Concetti generali
L’analisi di regressione, nelle sue varie forme, è una delle tecniche statistiche maggiormente utilizzate per spiegare la relazione esistente tra una variabile Y detta variabile dipendente (oppure output) e una o più variabili indipendenti (dette anche covariate o regressori, predittori o variabili di input).
Le tecniche di regressione, sulla base della conoscenza di un fenomeno studiato su un campione ridotto della popolazione, possono consentire di costruire una funzione matematica atta ad esprimere la migliore descrizione del fenomeno stesso, applicabile all’intera popolazione.
In sostanza, tra le molteplici soluzione al problema specifico che può svariare tra ogni campo applicativo della conoscenza umana (sociale, economico, fiscale, medico, ingegneristico, ecc.), la tecnica di regressione che si basa sulla teoria dei minimi quadrati (OLS) individua quella soluzione che statisticamente (sul ...
_OMISSIS_ ...o lo approssima riducendo al minimo gli scarti tra valori reali osservati e quelli restituiti dalla funzione di regressione.
Si cercheranno di affrontare le principali tipologie di regressioni a partire da quella lineare semplice per passare alla lineare multipla e ad altre più complesse quali la logaritmica e semilogaritmica.
In merito alle analisi statistiche, preliminarmente è necessario precisare –come già peraltro un po’ noto a tutti per conoscenza diffusa - che la statistica opera sui cosiddetti “grandi numeri” si occupa di fenomeni collettivi o di massa, influenzati da un determinato numero di variabili (inferenze), a volte elevatissimo come nelle stime immobiliari, per cui ogni analisi statistica, affinché abbia un fondamento, deve essere svolta su un numero di osservazioni di fenomeni ampiamente superiore a quello delle inferenze; deve quindi essere ben chiaro che le possibilità previsive dei modelli statis...
_OMISSIS_ ...rsquo;aumentare del numero dei dati osservati.
Un piccolissimo campione statistico è formato indicativamente da 30 ¸60 osservazioni e per il suo studio è già necessario (considerato il numero di elementi ridotto) adottare una distribuzione di Student.
La letteratura nel campo statistico evidenzia come criterio pratico, meno restrittivo, per un modello di regressione quello che preveda almeno 30 osservazioni ovvero un numero, se maggiore, pari a circa il numero delle inferenze (numero della variabili aumentato di uno) moltiplicato 5-6 per ogni inferenza.
Nel campo dell’estimo immobiliare, infine è da evidenziare, come meglio si vedrà nelle applicazioni concrete che seguiranno, che per un buon funzionamento dei suddetti modelli è necessario, o quanto meno utile, segmentare preventivamente il mercato immobiliare costituendo popolazioni già accomunate da similarità di caratteristiche incidenti sul valore. Quanto p...
_OMISSIS_ ... sono similari e più numeroso è il campione osservato, migliore è il valore di stima restituito dalla funzione valore (così come peraltro la stima svolta con procedimenti tradizionali). Di contro, con la segmentazione e l’allargamento del campione crescono gli oneri economici e i tempi per la costituzione dei vari campioni.
Per lo sviluppo dell’analisi di regressione multipla sono disponibili in commercio molteplici software specialistici, ma anche alcuni software di base (fogli di lavoro elettronici) comprendono funzioni statistiche di regressione.Il modello lineare
La regressione lineare semplice con intercetta
Noti il valore (y) di una grandezza esprimibile secondo un numero, quindi dato un certo effetto misurabile (variabile spiegata) ed individuata la variabile x che lo ha generato (variabile esplicativa), si intende cercare la relazione funzionale - nel seguito definita funzione - che lega...
_OMISSIS_ ...ai valori di y in modo da poter prevedere i valori della variabile y sulla scorta dei valori assunti dalla variabile x, in alcuni casi concreti.
La relazione funzionale è la seguente ed è rappresentata dall’equazione di una retta:
y = b + m x.
dove y è la variabile dipendente, x quella indipendente.
Nel caso delle stime immobiliari la y è costituita dal prezzo di compravendita degli immobili (quando è una grandezza osservata) e la x una caratteristica influente sul valore dell’immobile.
La funzione individuata nel caso in esame si può definire funzione valore in quanto restituisce il valore (di stima) di ogni immobile una volta noto il valore della caratteristica x conosciuto nel campo di variabilità del valore x riferito all’intera opolazione, cui il campione di studio appartiene.
Oggetto della ricerca sono i parametri b ed m che legano la variabile esplicativa a...
_OMISSIS_ ...piegata e che rappresentano i coefficienti di regressione.
La determinazione di tali coefficienti conduce a specificare l’equazione della retta e quindi a posizionarla sul piano, dove sono pure riportati i dati osservati.
Ai fini estimativi b1 rappresenta il prezzo marginale della caratteristica e b0 il prezzo totale dell’immobile quando la generica caratteristica x è nulla.
Nella dinamica reale di un fenomeno scaturiscono una serie di effetti che non consentono alla relazione originaria di rappresentare un perfetto legame teorico matematico, pertanto si deve tener conto di una componente di indeterminazione “e” stocastica (casuale) nella formulazione del modello, che diventa il seguente:
y = b + m x + e
Nelle applicazioni la componente “e” viene tralasciata in quanto rappresenterà proprio lo scarto tra valore reale dell’immobile e valore stimato della fun...
_OMISSIS_ ...erca di minimizzare con una attenta costruzione del modello.
La regressione lineare semplice senza intercetta
Per approssimare meglio il fenomeno valutativo al contesto reale con la individuazione di un prezzo marginale (coefficiente m) che non risenta della correzione con l’intercetta si può sviluppare una regressione lineare con intercetta impostata pari a zero.
È intuitivo che il risultato del modello sarà qualitativamente inferiore a quello precedente per effetto del vincolo imposto alla retta di regressione di passare per l’origine degli assi.
La regressione lineare multipla
Nelle stime immobiliari quasi sempre il modello di regressione lineare semplice risulta insufficiente a spiegare un fenomeno complesso, dove le variabili indipendenti in gioco sono molteplici, come peraltro già rilevato dall’esempio precedente (ma come più direttamente si potrà riscontrare nel paragrafo 3.5),...
_OMISSIS_ ... output statistici molto buoni (a prescindere dal numero degli elementi campionari).
Risulta perciò più adeguato, ma a volte ancora insufficiente, il ricorso alla regressione multiparametrica lineare, cioè che prenda in esame più variabili.
In questi casi, l’equazione di regressione diventa la seguente funzione che individua un piano (in caso di due parametri) ovvero un iperpiano (in caso di più di due parametri) e diventa la seguente:
yj = b + m1xj1 + m2xj2 +...+ mnxjn + ej,
dove
yj = variabile spiegata, rappresentata dal prezzo di compravendita del generico immobile j;
j = 1, 2, ..., m, è l’osservazione generica di un elemento componente il campione di m compravendite;
mi = parametri incogniti del modello, che rappresentato i prezzi marginali delle caratteristiche considerate;
xji = variabili esplicative, rappresentate dalle caratteristiche considerate rilevanti;
ej = variabil...
_OMISSIS_ ...ari al possibile errore connesso alla determinazione dei valori delle diverse variabili.
L’insieme delle suddette equazioni (m osservazioni), ciascuna depurata del termine “e” che rappresenta proprio l’indeterminazione estimativa del procedimento e che si tende a minimizzare, costituiscono un sistema in cui le incognite sono n + 1 (i parametri tecnici ed il coefficiente b), iperdeterminato in quanto m dovrà essere notevolmente superiore ad n, trattandosi di un campione che deve sottostare alle regole statistiche.
Come già rappresentato per la regressione lineare semplice, è utile evidenziare la natura della relazione che lega i risultati della stima condotta con l’analisi di regressione multipla lineare e quindi la definizione della funzione valore al fenomeno fisico concreto descritto dalle caratteristiche tecnico-economiche del bene e che si esterna attraverso il concetto di prezzo marginale di una ogni sp...
_OMISSIS_ ...ristica immobiliare presa in esame.
Il coefficiente (mi) dell’analisi di regressione rappresenta l’apporto marginale unitario, in termini monetari, che, moltiplicato per la misura della caratteristica (xi) esprime il contributo al prezzo totale di una data caratteristica immobiliare.
La stima del prezzo marginale della singola caratteristica qualitativa può essere condotta attraverso l’isolamento della stessa e la misura, al suo variare, del concorso monetario al prezzo totale.
Il segno del prezzo marginale di ciascuna caratteristica può assumere valore positivo, negativo o nullo rispettivamente nei casi in cui al crescere di un’unità della variabile il prezzo totale aumenta o diminuisce, ovvero si mantiene costante al variare dell’ammontare della variabile.