Estratto del documento

L'analisi in componenti principali

L'obiettivo dell'analisi multivariata è lo studio delle relazioni tra più variabili, a partire da un sistema di ipotesi già identificato in sede di progettazione della ricerca o elaborato attraverso le precedenti fasi di analisi monovariate e bivariata. Le tecniche di analisi multivariata possono essere finalizzate a:

  • Classificare i casi: Da somiglianze e differenze tra i casi presenti nella matrice si crea un numero ridotto di gruppi omogenei rispetto alle caratteristiche delle variabili.
  • Sintetizzare le variabili: Da un insieme di variabili manifeste si crea un numero minore di costrutti variabili dimensioni che le riassumono al meglio.
  • Spiegare delle relazioni tra le variabili: Dall'osservazione della contemporanea variazione delle variabili indipendenti della variabile dipendente si valuta l'esistenza di un rapporto di causa ed effetto o della presenza di relazioni spurie.

Questa separazione si trova sempre meno nella pratica di ricerca perché in realtà il risultato ottenuto con le tecniche di classificazione sintesi viene frequentemente utilizzato nei modelli esplicativi come variabili indipendenti.

Logica dell'ACP

La logica dell'ACP è del tutto analoga a quella che capita spesso di adottare nel quotidiano quando ci viene chiesto di descrivere il nostro gruppo di amici: poniamo che essi abbiano un reddito elevato, vivono in delle case molto grandi, abbiano una seconda casa al mare, vestono con vestiti firmati, praticano uno sport, seguano un regime alimentare sano… Come potremmo dare in poche parole una descrizione abbastanza esaustiva di questo gruppo? Diremo per semplificare che il nostro è un gruppo di amici benestanti, sportivo e attivo. I tre termini individuati rappresentano aggettivi idonei a descrivere sinteticamente il gruppo, minimizzando al massimo la perdita di informazioni.

Fasi dell'ACP

  • Scelta delle variabili per l'analisi.
  • Scelta delle componenti principali.
  • Salvataggio utilizzo delle componenti principali.

Queste fasi non devono essere pensate come fasi consecutive di un processo standard, quanto piuttosto come un insieme di elementi utilizzati simultaneamente per studiare un fenomeno. La tecnica dell'ACP si effettua su variabili cardinali e quasi cardinali, questi dati possono essere rilevati sia quando l'unità di analisi è l'individuo sia quando si tratta di aggregati come comuni, scuole, aziende. L'analisi della matrice di correlazione tra tutte le variabili di base rappresenta il punto di partenza della procedura e ci dà una prima informazione sulla possibilità di arrivare ad una buona sintesi dei dati iniziali con una perdita minima di informazioni. È necessario che tra le variabili di partenza vi sia un apprezzabile quota di varianza in comune in modo che si abbia una buona approssimazione della matrice iniziale. Ciò si verifica quando i coefficienti di correlazione tra le variabili non sono:

  • Né molto alti, informazioni ridondanti.
  • Né molto bassi, indipendenza delle variabili.

Valutazione della fattorializzabilità

Per la valutazione della fattorializzabilità si utilizzano inoltre diversi parametri tra cui:

  • Determinante: Valuta problemi di multicollinearità che renderebbero i risultati dell'ACP non attendibili. È particolarmente utile quando le variabili sono molto numerose.
  • Test di sfericità di Bartlett: Valuta l'indipendenza tra le variabili ed è basato sul determinante. Imposta un valore elevato non è una matrice di identità e si può effettuare la CP.
  • Test di adeguatezza campionario KMO: Si basa sulle correlazioni parziali, si considera accettabile un valore superiore a 0,6 o 0,7.

Se la matrice di correlazione tra le variabili di base è il punto di partenza, il punto di arrivo dell'ACP è la matrice di correlazione tra le variabili e i fattori estratti. Nel passaggio dall'una all'altra matrice tutti i procedimenti sono finalizzati a racchiudere gran parte della varianza e della covarianza contenute nella matrice in poche CP.

Strumenti per ottenere una soluzione finale

Gli strumenti per ottenere una soluzione finale ottimale, interpretare e denominare le nuove variabili sono:

  • La comunalità
  • Gli autovalori
  • Gli autovettori e gli elementi dei quali essi si compongono ovvero
  • I pesi fattoriali o componenziali

La comunalità ci dà informazioni sulle variabili iniziali, è data dalla somma dei pesi componenziali elevati al quadrato ed esprime la proporzione di varianza catturata da ciascuna variabile iniziale riprodotta da un certo numero di CP. Quanto più è prossima ad uno tanto più grande è l'informazione riprodotta dalle CP estratte. Il valore delle comunalità varia variando il numero delle componenti estratte. Se tutte le variabili hanno una discreta comunalità allora possiamo considerare buona la soluzione ottenuta.

Nel caso in cui una o più variabili hanno bassa come modalità rispetto alle prime componenti ottenute, si può:

  • Tenere la soluzione così com'è perdendo la parte delle informazioni relative alla variabile che presenta un valore basso di comunalità.
  • Sacrificare la variabile in questione e ripetere le analisi senza di essa.
  • Ripetere le analisi aumentando il numero delle CP finale e valutandone di nuovo la comunalità.

Gli autovalori sono una combinazione lineare di tutte le variabili immesse nella matrice di correlazione e rappresentano una sintesi dell'associazione tra di esse, sono scalari: assumono un valore via via inferiore e la loro somma è pari all'intera variabilità della matrice di correlazione iniziale. Dagli autovalori si evince che la varianza prodotta da ciascuna CP è via via decrescente, ciò significa anche che la CP consente di estrarre tanti fattori quante sono le variabili di base e che se si calcolano tutte le CP la varianza della matrice di correlazione di partenza viene riprodotta per intera. Quello che ci interessa è che la maggior parte della varianza si concentri in poche componenti, quelle che saranno effettivamente estratte. Se le variabili originarie sono parzialmente correlate tra loro allora alcuni autovalori avranno un valore marginale e potranno essere trascurati.

Analisi degli autovalori

L'analisi degli autovalori può farsi con diversi criteri:

  • Il decremento inerziale della curva degli autovalori: Osservando il grafico dello screen test, prendere gli autovalori posti prima del punto in cui comincia il decremento inerziale.
  • La percentuale di variante individuale riprodotta: Prendere soltanto le CP che hanno un alto valore maggiore a 1.
  • La percentuale di varianza totale riprodotta: Prendere il numero di CP che insieme riproducono almeno il 70,80% della varianza totale.
  • La valutazione del costo o beneficio: In base alla varianza spiegata da ciascun fattore si valuta l'opportunità di ottenere le CP dovendo poi assumersi l'onere di interpretarle.

L'interpretazione di una componente è più semplice quando la stessa è saturata da poche variabili di partenza, è più difficile quando invece è saturata da più variabili. Per l'interpretazione si utilizzano i pesi componenziali, che esprimono la saturazione ovvero il contributo di ciascuna variabile di base sulla CP estratta, nonché il verso della relazione stessa. Essi consentono di capire quali variabili la caratterizzano maggiormente in modo da poterle poi attribuire un significato e di battezzarla così come abbiamo fatto nel nostro esempio iniziale utilizzando i termini benestanti o sportivo.

Rotazione degli assi

La rotazione degli assi serve per ottimizzare la soluzione ottenuta e facilitare le interpretazioni dei fattori:

  • Scopo della rotazione è quello di trovare un nuovo sistema di assi in cui ciascuna variabile si disponga il più vicino possibile alle estremità di uno solo di essi.
  • La rotazione provoca l'incremento dei pesi componenziali, nonché la concentrazione delle saturazioni.
  • Ortogonalità: Si lasciano alterato il vincolo dell'indipendenza, quindi i fattori continuano ad essere non correlati tra di loro.
  • Obliquità: Si rende possibile la libertà di disposizione nello spazio, di conseguenza i fattori possono anche finire correlati tra loro.

La pluralità di metodi di rotazione degli assi è causa di indeterminatezza della soluzione fattoriale: non è possibile stabilire a priori quale metodo sia migliore degli altri e quindi quale soluzione sia la più efficace. La soluzione può essere scelta soltanto confrontando i risultati ottenuti con i vari metodi, scegliendo quella che meglio sintetizza le informazioni di partenza e che fornisce le dimensioni più agevolmente interpretabili.

Denominazione delle nuove variabili

La denominazione delle CP richiede anche una conoscenza approfondita del fenomeno a cui le variabili rimandano e una visione d'insieme di tutti i dati a disposizione del ricercatore. Si tratta di un momento creativo in senso stretto che permette sia di non perdere informazioni sia di realizzare una comunicazione efficace dei propri risultati di ricerca.

Attribuzione dei punteggi

Una volta deciso quante componenti estrarre si assegna ad ogni unità statistica un punteggio su ciascun fattore. Per fare ciò bisogna passare dai pesi componenziali ai coefficienti componenziali. La differenza tra peso e coefficiente è che il primo esprime l'associazione lorda tra una componente e una variabile, mentre il secondo esprime l'associazione netta. L'attribuzione del valore su ciascun caso è ottenuto di solito con l'operazione di regressione multipla, dove la componente principale rappresenta la variabile dipendente e tutte le variabili originarie sono le variabili indipendenti, ciascuna con un peso pari a quello emerso dall'analisi. I punteggi possono poi essere salvati sulla matrice dei dati come nuove variabili sintetiche ed essere usati in analisi successive.

Applicazioni delle componenti principali

Cosa si può fare con una variabile ottenuta dall'analisi in componenti principali? Analizzare in maniera più efficiente l'associazione di ogni nuovo...

Anteprima
Vedrai una selezione di 13 pagine su 59
Metodologia Pag. 1 Metodologia Pag. 2
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 6
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 11
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 16
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 21
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 26
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 31
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 36
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 41
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 46
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 51
Anteprima di 13 pagg. su 59.
Scarica il documento per vederlo tutto.
Metodologia Pag. 56
1 su 59
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze politiche e sociali SPS/07 Sociologia generale

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher laura1912 di informazioni apprese con la frequenza delle lezioni di Metodologia della ricerca sociale e analisi dei consumi e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica Guglielmo Marconi di Roma o del prof Ciampi Mario.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community