vuoi
o PayPal
tutte le volte che vuoi
X Y
S
+ A - B
L’ effetto di X su Y al netto di S è positivo ( d>0), X e S sono associati positivamente ( a>0), ma S e
Y sono associati negativamente ( b<0). X influisce su Y, ma anche su S che di conseguenza
annulla l’ effetto di X su Y
Effetto diretto negativo e effetto mediato positivo - D
X Y
S
+ A + B 4
L’ effetto totale è sempre nullo
Capitolo 12: Analisi fattoriale
Una caratteristica (costrutto) può non essere misurabile direttamente (valori non misurabili
con scale scientifiche es: stati emotivi) e, tali caratteristiche, vengono chiamate costrutti
latenti. È possibile allora utilizzare una serie di indicatori misurabili per ottenere una
valutazione di un costrutto latente:
L’analisi fattoriale permette di esplorare empiricamente la relazione tra variabili osservate
e variabili latenti.Essa può essere:
Analisi Fattoriale Esplorativa (AFE): il ricercatore non ha in mente nessuna ipotesi
teorica, va ad indagare semplicemente le possibili relazioni tra indicatori e costrutto
latente
Analisi Fattoriale Confermatoria (AFC): il ricercatore dispone di una precisa ipotesi a
priori sulla struttura dei fattori che intende verificare
Una metodologia affine all’analisi fattoriale è quella delle componenti principali
L’analisi delle componenti principali permette di ridurre il numero delle componenti
osservate (dimensioni) creando combinazioni lineari che vengono usate per spiegare il
costrutto
Nel modello dell’analisi fattoriale si osservano un certo numero di variabili legate al
costrutto latente
Ognuna di queste variabili presenta un certo errore rispetto al costrutto latente
Se per esempio osserviamo quattro variabili, il modello matematico (in forma di
regressione standardizzata) è il seguente
X λ δ
∙
1 1 1
ξ
= +
X λ δ
∙ ξ
2 2 2
= +
X λ δ
∙
3 3 3
ξ
= +
X λ δ
∙ ξ
4 4 4
= +
Dove:
X = variabile osservata
ξ = costrutto latente 5
� = errore detto anche componente specifica
λ = coefficienti di regressione detti coefficiente di saturazione
I coefficienti di saturazione misurano il legame tra variabile osservata e variabile
latente ξ
Le variabili osservate (X) sono dipendenti dall’ effetto del costrutto latente secondo l’
λ �,
entità del coefficiente di saturazione , più il termine di errore indipendente sia dal
ξ
punteggio di X sia dal punteggio di .
L’analisi fattoriale può anche essere vista come un modello che rappresenta un insieme di
variabili mediante un insieme più compatto
L’analisi fattoriale permette di esaminare anche il caso di più fattori latenti. Le variabili
osservate possono essere raggruppate in insiemi legati all’una o all’altra variabile latente
Poiché le variabili osservate sono funzioni degli stessi fattori latenti, risultano correlate tra
loro. La correlazione può essere usata per raggruppare le variabili ed associarle ai fattori
latenti 6
X λ ξ λ ξ δ
∙ ∙
1 11 1 21 2 1
= + +
X λ ξ λ ξ δ
∙ ∙
2 21 1 22 2 2
= + +
X λ ξ λ ξ δ
∙ ∙
3 31 1 23 2 3
= + +
X λ ξ λ ξ δ
∙ ∙
4 41 1 24 2 4
= + +
le saturazioni rifletteranno l’intensità del legame tra la variabile osservata ed i il fattore
latente
La procedura tipica in un’analisi fattoriale si compone dei seguenti passi:
1) Estrazione dei fattori: quanti sono i fattori di interesse
2) Ispezione della relazione tra fattori latenti e variabili osservate: che valori hanno le
saturazioni
3) Rotazione dei fattori, con l’obiettivo di ottenere:
• poche ma forti saturazioni diverse da zero
• nessuna variabile saturata da più di un fattore
4) Interpretazione della soluzione e denominazione dei fattori latenti
Analisi delle componenti principali
Nell’analisi fattoriale le variabili osservate vengono considerate come il risultato della
presenza dei fattori latenti
Nell’analisi delle componenti principali la prospettiva si inverte: i fattori latenti vengono
considerati come l’espressione delle variabili osservate. L’obiettivo dell’analisi principale è
comunque la riduzione della dimensione dei dati (descrivere le variabili osservate con un
numero minore di fattori)
Autovalori e fattori: 7
Dalla matrice di correlazione delle variabili osservate si può costruire la matrice delle
varianze dei fattori (diagonale L)
La diagonale della matrice delle varianze dei fattori contiene le varianze dei singoli fattori
(gli autovalori). Ogni autovalore corrisponde ad una combinazione lineare delle variabili
osservate (cioè ad un fattore). Occorre scegliere i fattori da considerare (ovvero le
componenti principali)
Varianza spiegata:
La varianza complessiva dei fattori è uguale al numero delle variabili osservate
(standardizzate)
La varianza di ogni fattore è data dalla somma dei quadrati delle proprie saturazioni
Se scegliamo un insieme di fattori, invece che tutti, la varianza complessiva (somma dei
corrispondenti autovalori) è minore del numero delle variabili osservate: quindi
quell’insieme di fattori spiega solo una parte della varianza complessiva.
Si vuole scegliere un insieme di fattori che spieghino la maggior parte della varianza
complessiva, ma non troppo numeroso. Esistono due metodi:
Lo scree test:
Il test consiste nel tracciare la curva degli autovalori decrescenti (lo scree plot ) e fermarsi
quando la curva si appiattisce
Metodo dell’autovalore maggiore di 1:
Viene selezionato un numero di fattori uguale al numero di autovalori maggiore di 1
il numero di autovalori maggiori di 1 dipende dal numero di variabili (è circa il 30% del
numero di variabili)
Occorre usare i due criteri in maniera flessibile:
• Con molte variabili è preferibile lo scree test
• Con poche variabili è preferibile il metodo dell’autovalore maggiore di 1
Possiamo decidere quanti fattori estrarre (sulla base dello scree test o con il metodo
dell’autovalore maggiore di 1), ma l’identificazione dei fattori avviene tramite processi
puramente matematici secondo due regole:
1) Massimizzare la varianza spiegata 8
2) Estrarre fattori non correlati
Questi criteri quasi mai portano alle soluzioni che ci aspettiamo. Si ricorre alla rotazione
dei fattori dopo l’estrazione
Rotazione:
La rotazione dei fattori consiste nel modificare i fattori
in modo che:
1) per ogni fattore ci siano poche saturazioni diverse da zero
2) ogni variabile sia saturata da un solo fattore
La rotazione viene fatta in modo che una singola variabile tenda a correlare solo con un
fattore e poco o nulla con tutti gli altri.
Il problema è che le soluzioni non ruotate mostrano un primo fattore troppo ”pesante”,
mentre i successivi fattori sono ”leggeri” e di difficile interpretazione.
Le saturazioni nella rotazione: La varianza di ogni fattore è data dalla somma dei quadrati
delle proprie saturazioni
La rotazione modifica la matrice delle saturazioni polarizzando le variabili verso uno dei
due fattori
La varianza di ogni fattore cambia ma la varianza complessiva spiegata dai fattori scelti
rimane uguale
Terminologia per le saturazioni
La saturazione più alta per una data variabile è chiamata saturazione primaria per quella
variabile. Le altre saturazioni sono dette saturazioni secondarie
La saturazione più alta per un dato fattore è chiamata Marker
Esempi di analisi esplorativa
1) Consideriamo quattro indicatori osservabili:
Paura
Agitazione
Svalutazione
Tristezza
La matrice delle correlazioni (tra le 4 variabili) è la seguente
Paura Agitaz. Svalutazione Tristezza
Paura 1
Agitazione 0.696 1
Svalutazione 0.445 0.372 1
Tristezza 0.351 0.288 0.63 1
La matrice delle correlazioni mostra una correlazione forte tra: 9
Agitazione e Paura
Tristezza e Svalutazione
• Possiamo ricondurre le prime due variabili - Agitazione e Paura - soprattutto al
costrutto latente dell’Ansia
• Possiamo ricondurre le altre due variabili - Svalutazione e Tristezza - soprattutto al
costrutto latente della Depressione
2) Matrice delle varianze dei fattori per 4 variabili osservate. La varianza complessiva è 4
L = 2,395 0,945 0,362 0,298
• Se scegliamo solamente i primi due fattori, la varianza è 2.395+0.944=3.339,
ovvero il 3.339/4=83.5% della varianza complessiva
• Se scegliamo i primi tre fattori,la varianza spiegata sale a
2.395+0.944+0.362=3.701, ovvero il 3.701/4=92.5% della varianza complessiva
3) vogliamo vedere come le variabili correlano con i Fattori Latenti (ne scegliamo solo 2
su 4)! Ci aspettiamo un caso del genere visto i precedenti dati
Fattore 1 Fattore 2
Paura Alto Trascurabile
Agitazione Alto Trascurabile
Svalutazione Trascurabile Alto
Tristezza Trascurabile Alto
Ma invece otteniamo
Fattore 1 Fattore 2
Paura 0.81 -0.42
Agitazione 0.77 -0.52
Svalutazione 0.79 0.42
Tristezza 0.72 0.57
La varianza di ogni fattore è data dalla somma dei quadrati delle proprie saturazioni
2 2 2 2
0,812 ¿ ¿ ¿ ¿
La varianza del primo fattore è ( + (0,772 + (0,792 + (0,722 =
2,395 2 2 2 2
¿ ¿ ¿ ¿
La varianza del secondo fattore è (0,422 + (0,522 + (0,422 + (0,572 =
0,945 10
La varianza dei due fattori `e 2,395 + 0,945 = 3,34
la varianza totale è 4, la percentuale di varianza spiegata è 3,34/4 = 0,835 = 83:5%
(va bene ne utilizziamo 2 quindi)
4) utilizzando la Rotazione per poterli interpretare si ottiene
Fattore 1 Fattore 2
Paura 0.88 0.26
Agitazione 0.91 -0.15
Svalutazione 0.28 0.85
Tristezza 0.13 0.91
I La varianza del Fattore 1 è 1.698
I La varianza del Fattore 2 è 1.641
ma la varianza complessiva spiegata dai fattori scelti rimane uguale
marker fattore 1 = 0.91 marker fattore 2 = 0.91
Saturazione primaria Paura = 0,88
E cosi via…. Capitolo 13: L’analisi fattoriale confermativa
Precedentemente abbiamo visto come l’analisi esplorativa non fa alcuna ipotesi su quanti
e
quali fattori latenti scegliere, Il numero e le caratteristiche dei fattori latenti sono il
risultato di una procedura matematica.
Nell’analisi confermativa invece, il numero e le caratteristiche dei fattori vengono scelte da
chi effettua l’analisi: l’analisi confermativa permette di confrontare tra loro diversi modelli e
di verificare le ipotesi