vuoi
o PayPal
tutte le volte che vuoi
CORRELAZIONE
Si parla di esistenza di relazione ma non di predittività e relazione causale. E’ un test per
verificare se esiste una relazione tra due variabili che non sono in relazione causale, ma
sono collegate e variano insieme, ma non hanno una causa-effetto. Misuro cose simili, che
hanno qualcosa in comune. Si chiamano variabile x e variabile y. Noi dobbiamo verificare il
calcolo dei coefficiente di correlazione, e dobbiamo capire la significatività.Per farlo usiamo
la R di Pearson per le scale quantitative, Rho di Sperman per scale ordinali. Il coefficiente di
correlazione r è un valore privo di unità di misura e compreso tra -1 e 1. La significatività
statistica è indicata tramite un p-value. Pertanto, le correlazioni in genere vengono scritte
ricorrendo a due numeri fondamentali: r = e p = . Più r si avvicina a zero, più la correlazione
lineare è debole, mentre più vicina a 1, e più è forte. Trovo r critico nella tavola, incrociando
gradi di libertà (n-2) e e alpha 0,05. Trovato l’ r critico, lo metto in confronto con l’ r empirico.
Esempio: r critico 0,79 r empirico 0,92 rifiuto l’ipotesi nulla perchè è più grande. Quindi l’ r è
significativo.
scala a rapporti
REGRESSIONE
E’ il secondo step della correlazione, nella regressione c’è una relazione matematica
rappresentata dalla retta e devo predire i risultati. Studia la dipendenza in media tra
fenomeni cercando una funzione che esprima tale dipendenza in media. Studia il rapporto
tra la variabile dipendente Y e la variabile indipendente X. Quando ha solo una variabile
indipendente si dice semplice, se ne ha di più si dice multipla. Lineare perchè studia la
dipendenza in media attraverso una linea. Per ottenere questa linea retta, bisogna
determinare la sua equazione, Y=ax+b dove a sta a quando x è uguale a 0, cioè dove parte
la retta, e b è il coefficiente angolare e mi dice quanto varia y all’ aumentare di x.
Come capisco se è correlazione o regressione? Uso la logica, ad esempio se ho le due
variabili ansia e depressione, una non causa l’ altra, ma essendo alta una è alta anche l’
altra, si tratta di una correlazione. Se una variabile causa l’ altra invece è regressione.
scala a intervalli
ANALISI DELLA VARIANZA (scale quantitative)
Analizza le differenze tra quanti gruppi voglio, li analizza tra loro, e poi guardo se c’è
differenza tra i soggetti. Mi tiene conto delle differenze all’ interno di uno gruppo.
ANALISI FATTORIALE
L'analisi fattoriale è un insieme di tecniche statistiche utilizzate per ricercare l'esistenza di
variabili latenti a partire da una serie di variabili osservate.
Variabile latente : una variabile è definita latente quando non è direttamente misurabile. Ad
esempio, concetti come la salute, l'intelligenza o la qualità di vita non sono direttamente
misurabili.
Serve per riassumere informazioni. Pensate ad un test o a un sondaggio molto vasto, come
faccio a dare una visione totale e compatta di tutte queste informazioni, se ci sono anche
aree diverse? Devo capire se queste domande hanno un elemento in comune.
Lo scopo è riassumere, semplificando, tutta l’informazione contenuta (varianza) nelle
relazioni di un insieme di variabili (matrice di correlazioni) attraverso l’identificazione
(estrazione) di un numero ristretto di dimensioni (fattori). Queste dimensioni possono
essere definite latenti, ovvero non direttamente misurabili, ma espressione di
dimensioni derivate dalla misura di altre variabili specifiche, direttamente osservabili e
misurabili.
Lo posso usare per controllare questionari nuovi, o validare questionari già creati, perchè
magari modificati, o traduco un questionario straniero e per adattarlo in italia uso l’ analisi
fattoriale. Requisiti : 5 soggetti per variabile, se ho 10 domande devo avere 50 soggetti.
L’analisi fattoriale valuta anche la validità,( sono sicuro di misurare proprio l’ ansia e non la
depressione), perchè riassumendo le info mi dice cosa sto misurando, e quindi di
conseguenza la validità del costrutto.
Esempio: Cosa ne pensi del covid? Hai avuto la malattia? Come l’hai curata? Ho tre
questioni diverse, 10 domande per aree, come posso fare un riassunto? Faccio una media?
No, uso l’ analisi fattoriale che riassume o meglio raggruppa. Ovvero estraggo i fattori in
comune tra queste 30 domande. Si usa su scala a rapporti o intervalli, al massimo scale
dicotomiche (si o no perchè c’è una quantità), faccio le correlazioni, come vanno insieme le
variabili, se sono positive o inverse. Quindi vedo quali aree sono correlate, da qui tutte le
variabili correlate e le raggruppo, e devo trovare il fattore che mi spiega perchè vanno
insieme. Questo fattore si chiama FATTORE COMUNE.
ANALISI FATTORI COMUNI
I fattori vengono interpretati come processi sottostanti le variabili che ne spiegano le loro
interrelazioni. Questa è un ‘interpretazione forte. Prevede p fattori comuni a tutte le p
variabili più un fattore specifico per ogni variabile. L'obiettivo è quello di trasformare la
matrice di variabili originaria in una che contenga il più possibile di fattori allo scopo di
eliminare eventuali ridondanze presenti nelle variabile. Poiché i fattori comuni sono assunti
essere variabili normalmente distribuite con varianza unitaria, essi non sono determinabili
univocamente, e di conseguenza non lo sono neanche i vettori. Questo metodo estrae q<p
di fattori comuni considerati è sufficiente a racchiudere l'informazione fornita dalle p variabili
originarie è quella di fissare una certa quota V di varianza delle variabili e considerare solo i
primi q fattori se la quota di varianza cumulata estratta da questi è maggiore di V.
ANALISI COMPONENTI PRINCIPALI
Le componenti possono anche essere interpretate come variabili che permettono di
riassumere e descrivere la complessità dei dati. Questa è un interpretazione debole.Il
metodo delle componenti principali si propone di sostituire le p variabili date con un certo
numero di variabili (tra loro non interdipendenti), ottenute come trasformazione lineare delle
variabili originarie, riducendo così il numero di variabili necessarie a descrivere un certo
ambito. Si tratta cioè di ricercare una serie di trasformate della matrice originaria dette,
appunto, componenti principali, che spieghino quanta più parte possibile della varianza delle
variabili originarie e che siano tra loro ortogonali. É possibile estrarre tante componenti
quante sono le variabili originarie, quando però lo scopo è quello di conseguire un'economia
nella descrizione in termini quantitativi di un certo fenomeno il risultato fornito
dall'applicazione del metodo è tanto più utile quanto minore è il numero di componenti prese