Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
L’ANALISI IN COMPONENTI PRINCIPALI
L'obiettivo dell'analisi multivariata è lo studio delle relazioni tra più variabili, a partire da un
sistema di ipotesi già identificato in sede di progettazione della ricerca o elaborato attraverso
le precedenti fase di analisi monovariate e bivariata. Le tecniche di analisi multivariata
possono essere finalizzate a:
- classificare i casi: da somiglianze e differenze tra i casi presenti nella matrice si crea un
numero ridotto di gruppi omogenei rispetto alle caratteristiche delle variabili.
- sintetizzare le variabili: da un insieme di variabili manifeste si crea un numero minore di
costrutti variabili dimensioni che le riassumono al meglio
- spiegare delle relazioni tra le variabili: dall'osservazione della contemporanea variazione
delle variabili indipendenti della variabile dipendente si valuta l'esistenza di un rapporto di
causa ed effetto o della presenza di relazioni spurie.
Questa separazione si trova sempre meno nella pratica di ricerca perché in realtà il risultato
ottenuti con le tecniche di classificazione sintesi vengono frequentemente utilizzate nei
modelli esplicativi come variabili indipendenti.
La logica dell'acp è del tutto analoga a quella che capita spesso di adottare nel quotidiano
quando ci viene chiesto di descrivere il nostro gruppo di amici: poniamo che essi abbiano un
reddito elevato, vivono in delle case molto grandi, abbiano una seconda casa al mare,
vestono con vestiti firmati, pratico uno sport, seguano un regime alimentare sano… Come
potremmo dare in poche parole una descrizione abbastanza esaustiva di questo gruppo?
diremo per semplificare che il nostro è un gruppo di amici benestanti, sportivo e attivo. I tre
termini individuati rappresentano aggettivi idonei a descrivere sinteticamente il gruppo,
minimizzando al massimo la perdita di informazioni.
Fasi delL’ACP:
1. scelta delle variabili per l'analisi.
2. scelta delle componenti principali.
3. salvataggio utilizzo delle componenti principali.
Queste fasi non devono essere pensate come fasi consecutive di un processo standard,
quanto piuttosto come un insieme di elementi utilizzati simultaneamente per studiare un
fenomeno.
La tecnica dell'acp si effettua su variabili cardinali e quasi cardinali, questi dati possono
essere rilevati sia quando l'unità di analisi è l'individuo sia quando si tratta di aggregati come
comuni, scuole, aziende.
L'analisi della matrice di correlazione tra tutte le variabili di base rappresenta il punto di
partenza della procedura e ci dà una prima informazione sulla possibilità di arrivare ad una
buona sintesi dei dati iniziali con una perdita minima di informazioni, è necessario che tra le
variabili di partenza vi sia un apprezzabile quote di varianza in comune in modo che si abbia
una buona approssimazione della matrice iniziale. Ciò si verifica quando i coefficienti di
correlazione tra le variabili non sono:
- né molto alti, informazioni ridondanti
- né molto bassi, Indipendenza delle variabili.
Per la valutazione della fattorializzabilità si utilizzano Inoltre diversi parametri tra cui:
- il determinante: valuta problemi di multicollinearità che renderebbero i risultati dell'acp non
attendibili.È particolarmente utile quando le variabili sono molto numerose.
- il test di sfericità di bartlett: valuta l'indipendenza tra le variabili ed è basato sul
determinante. Imposta un valore elevato Non è una matrice di identità e si può effettuare la
CP.
- il test di adeguatezza campionario kmo: si basa sulle correlazioni parziali, si considera
accettabile un valore superiore a 0,6 o 0,7.
Se la matrice di correlazione tra le variabili di base è il punto di partenza, il punto di arrivo
dell'acp è la matrice di correlazione tra le variabili e i fattori estratti. Nel passaggio dall’una
l'altra matrice tutti i procedimenti sono finalizzati a racchiudere gran parte della varianza e
della covarianza contenute nella matrice in poche CP. Gli strumenti per ottenere una
soluzione finale ottimale, interpretare e denominare le nuove variabili sono:
- la comunalità
- gli autovalori
- gli autovettori e gli elementi dei quali essi si compongono ovvero
- i pesi fattoriali o componenziali.
La comunità ci dà informazioni sulle variabili iniziali, è data dalla somma dei pesi
confondenziali elevati al quadrato ed esprime la proporzione di varianza catturata da
ciascuna variabile iniziale riprodotta da un certo numero di CP. Quanto più è prossima ad
uno tanto più grande è l'informazione riprodotta dalle CP estratte. Il valore delle comunalità
varia variando il numero delle componenti estratte, Se tutte le variabili hanno una discreta
comunalità Allora possiamo considerare buona la soluzione ottenuta.
Nel caso in cui uno o più variabili hanno bassa come modalità rispetto alle prime componenti
ottenute, si può:
- tenere la soluzione così com'è perdendo la parte delle informazioni relative alla variabile
che presenta un valore basso di comunalità.
- sacrificare la variabile in questione ripetere le analisi senza di essa.
- ripetere le analisi Aumentando il numero delle CP finale e valutandone di nuovo la
comunalità.
Gli autovalori sono una combinazione lineare di tutte le variabili immesse nella matrice di
correlazione e rappresentano una sintesi dell'associazione tra di esse, sono scalari:
assumono un valore via via inferiore e la loro somma è pari all'intera variabilità della matrice
di correlazione iniziale. Dagli autovalori si evince che la varianza di prodotto da ciascuna C.P
è via via decrescente, ciò significa anche che la CP consente di estrarre tanti fattori quante
sono le variabili di base e che se si calcolano tutte le CP la varianza della matrice di
correlazione di partenza viene riprodotta per intera. Quello che ci interessa è che la maggior
parte della varianza si concentri in poche componenti, quelle che saranno effettivamente
estratte. Se le variabili originarie sono parzialmente correlate tra loro allora alcuni autovalori
avranno un valore marginale potranno essere trascurati.
L'analisi degli autovalori può farsi con diversi criteri:
- il decremento inerziale della curva degli autovalori: osservando il grafico dello screen test,
prendere gli autovalori posti prima del punto in cui comincia il decremento inerziale
- la percentuale di variante individuale riprodotta: prendere soltanto le CP che hanno un alto
valore Maggiore a 1.
- la percentuale di varianza totale riprodotta: prendere il numero di CP che insieme
riproducono almeno il 70,80% della varianza totale.
- la valutazione del costo o beneficio: in base alla varianza spiegata da ciascun fattore si
valuta l'opportunità di ottenere le CP dovendo poi assumersi l'onere di interpretarle.
L'interpretazione di una componente è più semplice quando la stessa È saturata da poche
variabili di partenza, è più difficile quando invece è saturata da più variabili. Per
l'interpretazione si utilizzano i pesi con potenziali, che esprimono la saturazione ovvero il
contributo di ciascuna variabile di base sulla CP estratta, nonché il verso della relazione
stessa. Essi consentono di capire quali variabili la caratterizzano maggiormente in modo da
poterle poi attribuire un significato e di battezzarla Così come abbiamo fatto nel nostro
esempio iniziale utilizzando i termini benestanti o sportivo.
La rotazione degli assi serve per ottimizzare la soluzione ottenuta e facilitare le
interpretazioni dei fattori:
- scopo della rotazione è quello di trovare un nuovo sistema di assi in cui ciascuna variabile
si disponga il più vicino possibile allle estremità di uno solo di essi.
- la rotazione provoca l'incremento dei pesi componenenziali, nonché la concentrazione
delle saturazione è già inizialmente basse mantenendo immutata la relazione tra le variabili
iniziali, la loro comunalità e la percentuale di varianza totale è riprodotta.
Ortogonali→ si lasciano alterato il vincolo dell'Indipendenza, quindi fattori continuano ad
essere non correlati tra di loro.
Obliqui→ si rende possibile la libertà di disposizione nello spazio, di conseguenza i fattori
possono anche finire correlati tra loro.
La pluralità di metodi di rotazione degli assi è causa di indeterminatezza della soluzione
fattoriale: non è possibile stabilire a priori quale metodo sia migliore degli altri e quindi quale
soluzione sia la più efficace. La soluzione può essere scelta soltanto confrontando i risultati
ottenuti con i vari metodi, scegliendo quella che meglio sintetizza le informazioni di partenza
che fornisce le dimensioni più agevolmente interpretabile.
3 elementi di tipo oggettivo statistico ed elementi di tipo ermeneutico interpretativo tipici
dell'acp culmina nella fase di denominazione delle nuove variabili. Si deve cercare quel tratto
comune alle variabili in grado di restituire semanticamente la complessità delle informazioni
iniziali. Denominazione delle CP richiede anche una conoscenza approfondita del fenomeno
a cui le variabili rimandano e una visione d'insieme di tutti i dati a disposizione del
ricercatore. Si tratta di un momento creativo in senso stretto che permette sia di non perdere
informazioni sia di realizzare una comunicazione efficace dei propri risultati di ricerca.
Una volta deciso Quante componenti estrarre si assegna ad ogni unità statistica un
punteggio su ciascun fattore, Per fare ciò bisogna passare dai pesi componenziali ai
coefficenti componenziali.La differenza tra peso e coefficiente è che il primo esprime
all'associazione lorda tra una componente e una variabile, mentre il secondo esprime
l'associazione netta. L'attribuzione del valore su ciascun caso è ottenuto di solito con
l'operazione di regressione Multipla, dove la componente principale rappresenta la variabile
dipendente e tutte le variabili originarie sono le variabili indipendenti, ciascuna con un peso
pari a quello emerso dall'analisi. L'attribuzione del valore su ciascun caso è ottenuto di solito
con l'operazione di regressione Multipla, dove la componente principale rappresenta la
variabile dipendente e tutte le variabili originarie sono le variabili indipendenti, ciascuna con
un peso pari a quello emerso dall'analisi.I punteggi possono poi essere salvati sulla matrice
dei dati come nuove variabili sintetiche ed essere usati in analisi successive.
Cosa si può fare con una variabile ottenuta dall'analisi in componenti principali?
- analizzare in maniera più efficiente l'associazione di ogni nuo