L'analisi di regressione

Concetti generali


L’analisi di regressione, nelle sue varie forme, è una delle tecniche statistiche maggiormente utilizzate per spiegare la relazione esistente tra una variabile Y detta variabile dipendente (oppure output) e una o più variabili indipendenti (dette anche covariate o regressori, predittori o variabili di input).
Le tecniche di regressione, sulla base della conoscenza di un fenomeno studiato su un campione ridotto della popolazione, possono consentire di costruire una funzione matematica atta ad esprimere la migliore descrizione del fenomeno stesso, applicabile all’intera popolazione.

In sostanza, tra le molteplici soluzione al problema specifico che può svariare tra ogni campo applicativo della conosce... _OMISSIS_ ...ale, economico, fiscale, medico, ingegneristico, ecc.), la tecnica di regressione che si basa sulla teoria dei minimi quadrati (OLS) individua quella soluzione che statisticamente (sul campione) meglio lo approssima riducendo al minimo gli scarti tra valori reali osservati e quelli restituiti dalla funzione di regressione.

Si cercheranno di affrontare le principali tipologie di regressioni a partire da quella lineare semplice per passare alla lineare multipla e ad altre più complesse quali la logaritmica e semilogaritmica.

In merito alle analisi statistiche, preliminarmente è necessario precisare –come già peraltro un po’ noto a tutti per conoscenza diffusa - che la statistica opera sui cosiddetti “grandi numeri” si occ... _OMISSIS_ ... collettivi o di massa, influenzati da un determinato numero di variabili (inferenze), a volte elevatissimo come nelle stime immobiliari, per cui ogni analisi statistica, affinché abbia un fondamento, deve essere svolta su un numero di osservazioni di fenomeni ampiamente superiore a quello delle inferenze; deve quindi essere ben chiaro che le possibilità previsive dei modelli statistici migliorano all’aumentare del numero dei dati osservati.

Un piccolissimo campione statistico è formato indicativamente da 30 ¸60 osservazioni e per il suo studio è già necessario (considerato il numero di elementi ridotto) adottare una distribuzione di Student.

La letteratura nel campo statistico evidenzia come criterio pratico, meno restrittivo, per u... _OMISSIS_ ...gressione quello che preveda almeno 30 osservazioni ovvero un numero, se maggiore, pari a circa il numero delle inferenze (numero della variabili aumentato di uno) moltiplicato 5-6 per ogni inferenza.

Nel campo dell’estimo immobiliare, infine è da evidenziare, come meglio si vedrà nelle applicazioni concrete che seguiranno, che per un buon funzionamento dei suddetti modelli è necessario, o quanto meno utile, segmentare preventivamente il mercato immobiliare costituendo popolazioni già accomunate da similarità di caratteristiche incidenti sul valore. Quanto più gli immobili sono similari e più numeroso è il campione osservato, migliore è il valore di stima restituito dalla funzione valore (così come peraltro la stima svolta con procedimenti tradizi... _OMISSIS_ ...tro, con la segmentazione e l’allargamento del campione crescono gli oneri economici e i tempi per la costituzione dei vari campioni.

Per lo sviluppo dell’analisi di regressione multipla sono disponibili in commercio molteplici software specialistici, ma anche alcuni software di base (fogli di lavoro elettronici) comprendono funzioni statistiche di regressione.Il modello lineare


La regressione lineare semplice con intercetta

Noti il valore (y) di una grandezza esprimibile secondo un numero, quindi dato un certo effetto misurabile (variabile spiegata) ed individuata la variabile x che lo ha generato (variabile esplicativa), si intende cercare la relazione funzionale - nel seguito definita funzione - che lega... _OMISSIS_ ...ai valori di y in modo da poter prevedere i valori della variabile y sulla scorta dei valori assunti dalla variabile x, in alcuni casi concreti.

La relazione funzionale è la seguente ed è rappresentata dall’equazione di una retta:

y = b + m x.

dove y è la variabile dipendente, x quella indipendente.

Nel caso delle stime immobiliari la y è costituita dal prezzo di compravendita degli immobili (quando è una grandezza osservata) e la x una caratteristica influente sul valore dell’immobile.

La funzione individuata nel caso in esame si può definire funzione valore in quanto restituisce il valore (di stima) di ogni immobile una volta noto il valore della caratteristica x conosciuto nel campo di... _OMISSIS_ ...l valore x riferito all’intera opolazione, cui il campione di studio appartiene.

Oggetto della ricerca sono i parametri b ed m che legano la variabile esplicativa alla variabile spiegata e che rappresentano i coefficienti di regressione.

La determinazione di tali coefficienti conduce a specificare l’equazione della retta e quindi a posizionarla sul piano, dove sono pure riportati i dati osservati.

Ai fini estimativi b1 rappresenta il prezzo marginale della caratteristica e b0 il prezzo totale dell’immobile quando la generica caratteristica x è nulla.

Nella dinamica reale di un fenomeno scaturiscono una serie di effetti che non consentono alla relazione originaria di rappresentare un perfetto legame... _OMISSIS_ ...tico, pertanto si deve tener conto di una componente di indeterminazione “e” stocastica (casuale) nella formulazione del modello, che diventa il seguente:

y = b + m x + e

Nelle applicazioni la componente “e” viene tralasciata in quanto rappresenterà proprio lo scarto tra valore reale dell’immobile e valore stimato della funzione, che si cerca di minimizzare con una attenta costruzione del modello.

La regressione lineare semplice senza intercetta

Per approssimare meglio il fenomeno valutativo al contesto reale con la individuazione di un prezzo marginale (coefficiente m) che non risenta della correzione con l’intercetta si può sviluppare una regressione lineare con intercetta imp... _OMISSIS_ ...ero.
È intuitivo che il risultato del modello sarà qualitativamente inferiore a quello precedente per effetto del vincolo imposto alla retta di regressione di passare per l’origine degli assi.

La regressione lineare multipla

Nelle stime immobiliari quasi sempre il modello di regressione lineare semplice risulta insufficiente a spiegare un fenomeno complesso, dove le variabili indipendenti in gioco sono molteplici, come peraltro già rilevato dall’esempio precedente (ma come più direttamente si potrà riscontrare nel paragrafo 3.5), nonostante gli output statistici molto buoni (a prescindere dal numero degli elementi campionari).
Risulta perciò più adeguato, ma a volte ancora insufficiente, il ricorso alla regressione mul... _OMISSIS_ ...ineare, cioè che prenda in esame più variabili.
In questi casi, l’equazione di regressione diventa la seguente funzione che individua un piano (in caso di due parametri) ovvero un iperpiano (in caso di più di due parametri) e diventa la seguente:

yj = b + m1xj1 + m2xj2 +...+ mnxjn + ej,
dove

yj = variabile spiegata, rappresentata dal prezzo di compravendita del generi...


...continua.  Qui sono visibili 8000 su 10256 caratteri complessivi dell'articolo.

 Sono omessi dal presente articolo eventuali note ed altri contenuti reperibili nel prodotto

Acquista per soli 2,00 € l'articolo, che ti verrà inviato via mail e che potrai scaricarti dalla tua area privata nella sua interezza e senza omissis.

Acquista articolo