Anteprima
Vedrai una selezione di 4 pagine su 14
Riassunto esame Statistica Multivariata, prof. Naldi, libro consigliato Modelli statistici per le scienze sociali, Gallucci, Leone Pag. 1 Riassunto esame Statistica Multivariata, prof. Naldi, libro consigliato Modelli statistici per le scienze sociali, Gallucci, Leone Pag. 2
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica Multivariata, prof. Naldi, libro consigliato Modelli statistici per le scienze sociali, Gallucci, Leone Pag. 6
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica Multivariata, prof. Naldi, libro consigliato Modelli statistici per le scienze sociali, Gallucci, Leone Pag. 11
1 su 14
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

X Y

S

+ A - B

L’ effetto di X su Y al netto di S è positivo ( d>0), X e S sono associati positivamente ( a>0), ma S e

Y sono associati negativamente ( b<0). X influisce su Y, ma anche su S che di conseguenza

annulla l’ effetto di X su Y

Effetto diretto negativo e effetto mediato positivo - D

X Y

S

+ A + B 4

L’ effetto totale è sempre nullo

Capitolo 12: Analisi fattoriale

Una caratteristica (costrutto) può non essere misurabile direttamente (valori non misurabili

con scale scientifiche es: stati emotivi) e, tali caratteristiche, vengono chiamate costrutti

latenti. È possibile allora utilizzare una serie di indicatori misurabili per ottenere una

valutazione di un costrutto latente:

L’analisi fattoriale permette di esplorare empiricamente la relazione tra variabili osservate

e variabili latenti.Essa può essere:

Analisi Fattoriale Esplorativa (AFE): il ricercatore non ha in mente nessuna ipotesi

teorica, va ad indagare semplicemente le possibili relazioni tra indicatori e costrutto

latente

Analisi Fattoriale Confermatoria (AFC): il ricercatore dispone di una precisa ipotesi a

priori sulla struttura dei fattori che intende verificare

Una metodologia affine all’analisi fattoriale è quella delle componenti principali

L’analisi delle componenti principali permette di ridurre il numero delle componenti

osservate (dimensioni) creando combinazioni lineari che vengono usate per spiegare il

costrutto

Nel modello dell’analisi fattoriale si osservano un certo numero di variabili legate al

costrutto latente

Ognuna di queste variabili presenta un certo errore rispetto al costrutto latente

Se per esempio osserviamo quattro variabili, il modello matematico (in forma di

regressione standardizzata) è il seguente

X λ δ

1 1 1

ξ

= +

X λ δ

∙ ξ

2 2 2

= +

X λ δ

3 3 3

ξ

= +

X λ δ

∙ ξ

4 4 4

= +

Dove:

X = variabile osservata

ξ = costrutto latente 5

� = errore detto anche componente specifica

λ = coefficienti di regressione detti coefficiente di saturazione

I coefficienti di saturazione misurano il legame tra variabile osservata e variabile

latente ξ

Le variabili osservate (X) sono dipendenti dall’ effetto del costrutto latente secondo l’

λ �,

entità del coefficiente di saturazione , più il termine di errore indipendente sia dal

ξ

punteggio di X sia dal punteggio di .

L’analisi fattoriale può anche essere vista come un modello che rappresenta un insieme di

variabili mediante un insieme più compatto

L’analisi fattoriale permette di esaminare anche il caso di più fattori latenti. Le variabili

osservate possono essere raggruppate in insiemi legati all’una o all’altra variabile latente

Poiché le variabili osservate sono funzioni degli stessi fattori latenti, risultano correlate tra

loro. La correlazione può essere usata per raggruppare le variabili ed associarle ai fattori

latenti 6

X λ ξ λ ξ δ

∙ ∙

1 11 1 21 2 1

= + +

X λ ξ λ ξ δ

∙ ∙

2 21 1 22 2 2

= + +

X λ ξ λ ξ δ

∙ ∙

3 31 1 23 2 3

= + +

X λ ξ λ ξ δ

∙ ∙

4 41 1 24 2 4

= + +

le saturazioni rifletteranno l’intensità del legame tra la variabile osservata ed i il fattore

latente

La procedura tipica in un’analisi fattoriale si compone dei seguenti passi:

1) Estrazione dei fattori: quanti sono i fattori di interesse

2) Ispezione della relazione tra fattori latenti e variabili osservate: che valori hanno le

saturazioni

3) Rotazione dei fattori, con l’obiettivo di ottenere:

• poche ma forti saturazioni diverse da zero

• nessuna variabile saturata da più di un fattore

4) Interpretazione della soluzione e denominazione dei fattori latenti

Analisi delle componenti principali

Nell’analisi fattoriale le variabili osservate vengono considerate come il risultato della

presenza dei fattori latenti

Nell’analisi delle componenti principali la prospettiva si inverte: i fattori latenti vengono

considerati come l’espressione delle variabili osservate. L’obiettivo dell’analisi principale è

comunque la riduzione della dimensione dei dati (descrivere le variabili osservate con un

numero minore di fattori)

Autovalori e fattori: 7

Dalla matrice di correlazione delle variabili osservate si può costruire la matrice delle

varianze dei fattori (diagonale L)

La diagonale della matrice delle varianze dei fattori contiene le varianze dei singoli fattori

(gli autovalori). Ogni autovalore corrisponde ad una combinazione lineare delle variabili

osservate (cioè ad un fattore). Occorre scegliere i fattori da considerare (ovvero le

componenti principali)

Varianza spiegata:

La varianza complessiva dei fattori è uguale al numero delle variabili osservate

(standardizzate)

La varianza di ogni fattore è data dalla somma dei quadrati delle proprie saturazioni

Se scegliamo un insieme di fattori, invece che tutti, la varianza complessiva (somma dei

corrispondenti autovalori) è minore del numero delle variabili osservate: quindi

quell’insieme di fattori spiega solo una parte della varianza complessiva.

Si vuole scegliere un insieme di fattori che spieghino la maggior parte della varianza

complessiva, ma non troppo numeroso. Esistono due metodi:

Lo scree test:

Il test consiste nel tracciare la curva degli autovalori decrescenti (lo scree plot ) e fermarsi

quando la curva si appiattisce

Metodo dell’autovalore maggiore di 1:

Viene selezionato un numero di fattori uguale al numero di autovalori maggiore di 1

il numero di autovalori maggiori di 1 dipende dal numero di variabili (è circa il 30% del

numero di variabili)

Occorre usare i due criteri in maniera flessibile:

• Con molte variabili è preferibile lo scree test

• Con poche variabili è preferibile il metodo dell’autovalore maggiore di 1

Possiamo decidere quanti fattori estrarre (sulla base dello scree test o con il metodo

dell’autovalore maggiore di 1), ma l’identificazione dei fattori avviene tramite processi

puramente matematici secondo due regole:

1) Massimizzare la varianza spiegata 8

2) Estrarre fattori non correlati

Questi criteri quasi mai portano alle soluzioni che ci aspettiamo. Si ricorre alla rotazione

dei fattori dopo l’estrazione

Rotazione:

La rotazione dei fattori consiste nel modificare i fattori

in modo che:

1) per ogni fattore ci siano poche saturazioni diverse da zero

2) ogni variabile sia saturata da un solo fattore

La rotazione viene fatta in modo che una singola variabile tenda a correlare solo con un

fattore e poco o nulla con tutti gli altri.

Il problema è che le soluzioni non ruotate mostrano un primo fattore troppo ”pesante”,

mentre i successivi fattori sono ”leggeri” e di difficile interpretazione.

Le saturazioni nella rotazione: La varianza di ogni fattore è data dalla somma dei quadrati

delle proprie saturazioni

La rotazione modifica la matrice delle saturazioni polarizzando le variabili verso uno dei

due fattori

La varianza di ogni fattore cambia ma la varianza complessiva spiegata dai fattori scelti

rimane uguale

Terminologia per le saturazioni

La saturazione più alta per una data variabile è chiamata saturazione primaria per quella

variabile. Le altre saturazioni sono dette saturazioni secondarie

La saturazione più alta per un dato fattore è chiamata Marker

Esempi di analisi esplorativa

1) Consideriamo quattro indicatori osservabili:

Paura

Agitazione

Svalutazione

Tristezza

La matrice delle correlazioni (tra le 4 variabili) è la seguente

Paura Agitaz. Svalutazione Tristezza

Paura 1

Agitazione 0.696 1

Svalutazione 0.445 0.372 1

Tristezza 0.351 0.288 0.63 1

La matrice delle correlazioni mostra una correlazione forte tra: 9

Agitazione e Paura

Tristezza e Svalutazione

• Possiamo ricondurre le prime due variabili - Agitazione e Paura - soprattutto al

costrutto latente dell’Ansia

• Possiamo ricondurre le altre due variabili - Svalutazione e Tristezza - soprattutto al

costrutto latente della Depressione

2) Matrice delle varianze dei fattori per 4 variabili osservate. La varianza complessiva è 4

L = 2,395 0,945 0,362 0,298

• Se scegliamo solamente i primi due fattori, la varianza è 2.395+0.944=3.339,

ovvero il 3.339/4=83.5% della varianza complessiva

• Se scegliamo i primi tre fattori,la varianza spiegata sale a

2.395+0.944+0.362=3.701, ovvero il 3.701/4=92.5% della varianza complessiva

3) vogliamo vedere come le variabili correlano con i Fattori Latenti (ne scegliamo solo 2

su 4)! Ci aspettiamo un caso del genere visto i precedenti dati

Fattore 1 Fattore 2

Paura Alto Trascurabile

Agitazione Alto Trascurabile

Svalutazione Trascurabile Alto

Tristezza Trascurabile Alto

Ma invece otteniamo

Fattore 1 Fattore 2

Paura 0.81 -0.42

Agitazione 0.77 -0.52

Svalutazione 0.79 0.42

Tristezza 0.72 0.57

La varianza di ogni fattore è data dalla somma dei quadrati delle proprie saturazioni

2 2 2 2

0,812 ¿ ¿ ¿ ¿

La varianza del primo fattore è ( + (0,772 + (0,792 + (0,722 =

2,395 2 2 2 2

¿ ¿ ¿ ¿

La varianza del secondo fattore è (0,422 + (0,522 + (0,422 + (0,572 =

0,945 10

La varianza dei due fattori `e 2,395 + 0,945 = 3,34

la varianza totale è 4, la percentuale di varianza spiegata è 3,34/4 = 0,835 = 83:5%

(va bene ne utilizziamo 2 quindi)

4) utilizzando la Rotazione per poterli interpretare si ottiene

Fattore 1 Fattore 2

Paura 0.88 0.26

Agitazione 0.91 -0.15

Svalutazione 0.28 0.85

Tristezza 0.13 0.91

I La varianza del Fattore 1 è 1.698

I La varianza del Fattore 2 è 1.641

ma la varianza complessiva spiegata dai fattori scelti rimane uguale

marker fattore 1 = 0.91 marker fattore 2 = 0.91

Saturazione primaria Paura = 0,88

E cosi via…. Capitolo 13: L’analisi fattoriale confermativa

Precedentemente abbiamo visto come l’analisi esplorativa non fa alcuna ipotesi su quanti

e

quali fattori latenti scegliere, Il numero e le caratteristiche dei fattori latenti sono il

risultato di una procedura matematica.

Nell’analisi confermativa invece, il numero e le caratteristiche dei fattori vengono scelte da

chi effettua l’analisi: l’analisi confermativa permette di confrontare tra loro diversi modelli e

di verificare le ipotesi

Dettagli
Publisher
A.A. 2014-2015
14 pagine
3 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Fradraken di informazioni apprese con la frequenza delle lezioni di Statistica multivariata e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Libera Università Maria SS.Assunta - (LUMSA) di Roma o del prof Naldi Maurizio.