Anteprima
Vedrai una selezione di 16 pagine su 72
Appunti Analisi dei dati Pag. 1 Appunti Analisi dei dati Pag. 2
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 6
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 11
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 16
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 21
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 26
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 31
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 36
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 41
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 46
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 51
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 56
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 61
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 66
Anteprima di 16 pagg. su 72.
Scarica il documento per vederlo tutto.
Appunti Analisi dei dati Pag. 71
1 su 72
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CLASSIFICAZIONE DEI METODI DI ESTRAZIONE COMUNALITA’ A’A (3 FAMIGLIE) E MATRICE

CORRELAZIONE FATTORI VARIABILI A

a) Si richiede che n/p sia non inferiore a 2, : quanto più aumenta questo rapporto, tanto più si

avranno dei risultati sicuri. NON ESAGERARE NEL N. FATTORI

b) Si estraggono fattori fino a quando viene spiegata una certa quota di varianza . Un criterio per

valutare se il numero p dei fattori comuni considerati è considerare solo i primi p fattori se la

quota di varianza cumulata estratta da questi è maggiore di p. dato che la somma

degli autovalori della matrice con le comunalità rappresenta la varianza dei fattori conservati ( ES.

METODO FATTORI PRINCIPALI O CORRELAZIONE CANONICA)

c) Se l’analisi è svolta su una matrice di correlazione , si considerano solo gli autovalori maggiori o

uguali a 1. La rappresentazione degli autovalori rispetto all’ordine di estrazione (screen plot)

consente di individuare con immediatezza gli autovalori più importanti. Se questa mostra una forte

inclinazione all’altezza dei primi fattori e un successivo appiattimento, allora il criterio afferma che

gli ultimi fattori possono essere ignorati ( ES. METODO FATTORI PRINCIPALI O CORRELAZIONE

CANONICA.

d) gli elementi della matrice dei residui possono fornire un’indicazione sul grado di accuratezza

raggiunta dai p fattori considerati nel riprodurre la matrice delle varianze e covarianze tra le q

variabili standardizzate ( ES.METODO MINRES) e) Per la maggior parte dei metodi di estrazione dei

fattori, è, poi possibile trovare un test statistico per verificare l’opportunità o meno di estrarre un

ulteriore fattore dopo i primi p,. Bartlett suggerisce un test che può essere impiegato

indipendentemente dal metodo di estrazione dei fattori usato. L’ipotesi nulla è che p fattori sono

sufficienti a descrivere un certo campo in sostituzione delle q variabili originarie.

Altrimenti significa che le q variabili costituiscono, di per sé, le dimensioni minime del fenomeno

considerato e l’analisi fattoriale non potrebbe fare altro che confermarle. È pertanto inutile in

questo caso effettuare l’analisi fattoriale. Per decidere il numero di fattori se l’ipotesi nulla è

rifiutata per p fattori si procede aumentando Se è maggiore del valore del corrispondente al livello

di probabilità scelto e per detti gradi di libertà, si dovrà rifiutare l’ipotesi nulla per p fattori e

procedere all’estrazione di un successivo fattore, dopodiché sarà nuovamente calcolato .

11.B MODELLO FATTORIALE: Metodo della massima verosimiglianza

Quando si hanno dati di tipo inferenziale, utilizzando il metodo della massima verosimiglianza, si

utilizza questa formula introdotta anche nelle lezioni precedenti:

Va a cercare una struttura ignota di valori della popolazione partendo da valori noti che sono la

struttura di matrice di correlazione o varianze e covarianze. 01/06/2021

“PARTE B”

11.B MODELLO FATTORIALE: Identificazione dei fattori

La potenza dell’analisi dei fattori è alta, poiché si ha una pretesa fortissima perché significa stimare

delle cause comuni non osservate che sottostanno a ciò che avviene nella realtà.

Il concetto di identificazione è stato introdotto originariamente da Koopmans e Reiersol. Nell’analisi

fattoriale la funzione di distribuzione del vettore casuale dipendente è completamente determinata

se la distribuzione delle variabili indipendenti è nota e se i parametri sono specificati

numericamente. Tale specificazione viene chiamata “struttura”. Una struttura allora può essere

considerata come una realizzazione di un modello, e un modello in questo senso può essere

considerato come l’insieme di tutte le possibili strutture con le assunzioni. Ad ogni struttura

ammissibile è associata esattamente una distribuzione condizionata del vettore casuale

dipendente. Due strutture dello stesso modello sono dette equivalenti (all’osservazione) se

generano la stessa distribuzione per le variabili dipendenti: si dice che tali strutture non sono

identificabili. Analogamente una struttura è identificabile se non esiste nessun’altra struttura

equivalente dello stesso modello. Se un parametro ha lo stesso valore in tutte le strutture

equivalenti, si dice che è identificabile. I parametri che invece possono assumere valori diversi in

strutture equivalenti non sono identificabili.

RIASSUNTO: definizioni

Sotto il profilo teorico sono state individuate da numerosi studiosi condizioni necessarie ed altre

sufficienti per la loro identificabilità, ma tali condizioni sono applicabili solo in situazioni particolari

e spesso sono formulate solo in termini matematici e rischiano di non corrispondere ai problemi

affrontati nella realtà. In altre parole gli assunti del modello fattoriale non sono sufficienti in

termini per determinare in modo univoco i parametri per un modello: al di là delle rotazioni dei

fattori per ottenere soluzioni uniche si devono costruire delle restrizioni sulla matrice A tali per cui

venga superato il problema di soluzioni e tali restrizioni sono da formularsi non in termini teorici

ma pratici in funzione dei problemi affrontati Si apre qui la fondamentale distinzione tra modelli

esplorativi e confermativi.

12.B MODELLO FATTORIALE: Esplorativo e Confermativo

Come si è accennato il modello fattoriale può essere adoperato secondo due ottiche totalmente

diverse: come analisi di tipo esplorativo oppure come analisi di tipo confermativo Nel caso

esplorativo il ricercatore non ha ipotesi teoriche sulla struttura sottostante ai dati osservati e usa

l'analisi dei fattori proprio per indagare la struttura latente: ma le soluzioni non sono uniche anche

al di là delle rotazioni. Nel caso confermativo, il ricercatore ha informazioni a priori sulla struttura

dei dati sottostanti comuni e vuole verificare l'adeguatezza della struttura proposta. Deve con

queste informazioni anche ottenere soluzioni uniche

Abbiamo tre tipi di parametri:

parametri fissi a cui sono stati assegnati valori dati (cioè 0 assumendo che i relativi fattori comuni

non contribuiscano a determinare la variabile collegata)

parametri incogniti vincolati, che sono ma uguali a uno o più parametri;

parametri liberi che sono incogniti e non vincolati ad essere uguali a nessun altro parametro.

Nel contesto esplorativo, f1 f2 ed f3 rappresentano i fattori non direttamente osservabili e spesso

supposti ortogonali; ognuna delle xi è una variabile osservabile che rappresenta misura dei fattori. I

legami fra le variabili ed i fattori sono costruiti tramite i pesi fattoriali λi . Gli ei rappresentano

invece i termini di errore, supposti fra loro indipendenti.

Le correlazioni fra i fattori sono nulle: Φ =Φ =Φ =0 (23)

12 13 23

Si noti che nella analisi esplorativa le variabili xi possono rappresentare più di un fattore

contemporaneamente, ed è possibile stabilire in che misura ogni variabile sia influenzata dal

fattore sottostante solo dopo aver stimato i coefficienti λ . Al contrario, nell’analisi confermativa il

i

fattore f è misurato solo dalle variabili x e x , e tutti gli altri legami sono annullati. Si noti che i

1 1 2

fattori possono essere fra loro collegati.

Nel caso confermativo , invece, il ricercatore dispone di informazioni a priori circa la struttura

comune sottostante i dati e desidera, dunque, verificare l’appropriatezza della struttura ipotizzata

confermandola o smentendola. Lo studioso parte, perciò, da un modello in cui alcuni elementi di A

ed alcuni elementi di Φ sono fissati a priori, ad esempio alcuni aij sono posti uguali a zero (anche ad

uno) ipotizzando che i relativi fattori comuni non concorrano nel determinare la variabile in esame.

L’analisi fattoriale confermativa si avvale della stima di massima verosimiglianza come metodo di

estrazione dei fattori, a patto che le variabili in esame abbiamo una distribuzione normale

multivariata

Si introducono perciò negli input delle nostre analisi vincoli sui parametri fissi o vincolati e nelle

rotazioni oblique vincoli di incorrelazione fra i fattori comuni

13.B MODELLO FATTORIALE: Indeterminatezza

Teorema del ’55: Gli scores dei punteggi fattoriali non sono unici anche quando il modello è

completamente identificato. Ciò significa come ha dimostrato Guttman (1955) che anche se il

modello è perfettamente e univocamente identificati i punteggi fattoriali possono essere diversi e

con uguale struttura identificativa anche correlati negativamente. In altre parola partendo dalla

stessa matrice di correlazione delle variabili osservate e avendo ricavato sia nel modello esplorativo

che anche in un modello confermativo, una sola matrice di correlazione tra fattori comuni e

variabili A esistono infinite soluzioni interne di punteggi fattoriali indistinguibili sul piano logico e

addirittura in certi casi correlate fra loro negativamente (cioè il punteggio fattoriale non è

attendibile) . CONCLUSIONI MODELLO FATTORIALE:

COMPONENTI PRINCIPALI VS ANALISI FATTORIALE

Alcuni autori trattano l’analisi delle componenti principali come un tipo particolare di analisi dei

fattori, in quanto in entrambi i casi si vanno ad individuare variabili non osservabili, latenti, in una le

componenti principali e nell’altra i fattori comuni e quelli specifici. Inoltre, nella pratica tali metodi

che a volte portano a risultati molto simili. In realtà, questi due tipi di analisi differiscono

sensibilmente. Proviamo a sottolinearne le differenze.

1) Innanzitutto, nelle componenti principali abbiamo bisogno di p componenti per spiegare la

varianza totale delle p variabili originarie e la somma delle varianze delle p componenti è

esattamente uguale alla somma delle varianze delle p variabili di partenza. Nell’analisi fattoriale si

tenti di ricavare da uno spazio a p dimensioni (quello delle variabili osservate), uno spazio a m + p

dimensioni (quello dei fattori comuni e specifici) con i problemi di unicità soluzioni descritti.

MODELLO FATTORIALE VS MODELLO LINEARE MULTIEQUAZIONALE

1) In entrambi i modelli si spiega la varianza delle variabili dipendenti mediante la varianza delle

indipendenti, ma l'analogia si ferma qui.

2) Nel modello multiequazionale le variabili dipendenti X sono combinazioni lineari delle variabili

dipendenti Y e si cerca semplicemente di "descrivere" il legame tra Y e X. Nel modello fattoriale si

vuole individuare le cause latenti Φ di Y e quantificarle (unitamente alle cause specifiche). 3)In

questo senso gli e sono residui dovuti a una non completa approssimazione (anche in campo

descrittivo), gli ε sono "cause specifiche" suscettibili di interpretazione ( comprendenti anche

l’errore stocastico)

MODELLO FATTORIALE E PATH ANALYSIS

Dettagli
A.A. 2020-2021
72 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher aurora.musitelli.am56 di informazioni apprese con la frequenza delle lezioni di Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Vittadini Giorgio.