Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
T-TEST E ANOVA, AD UNA E A DUE VIE
T-TEST A CAMPIONE UNICO
Si usa quando devo confrontare con un singolo valore di media
Si deve guardare il valore Sig. deve essere sotto 0,05 o 0,01
T-TEST CAMPIONI APPAIATI
Si usa quando dobbiamo confrontare due serie di dati complete (non solo la media)
5
lOMoAR cPSD
Qui in entrambi i casi il valore di Significativita’ e’ inferiore a 0,01 quindi i due valori confrontati sono
statisticamente differenti
Dalla media evinco (in entrambi i casi) che la prima serie e’ inferiore alla seconda.
Guardando t e Sig. vedo che esiste una differenza significativa e quindi posso concludere che
T-TEST A CAMPIONI INDIPENDENTI
Si esegue quando abbiamo due gruppi indipendenti 6
lOMoAR cPSD
Qui l’interpretazione prevede il confronto di due valori:
Prima, nella sezione Test di Levene: se il valore Sig. e’ superiore a 0,05, prendo in considerazione la prima riga del
resto della tabella, altrimenti prendo in considerazione la seconda.
In questo caso, proseguendo la lettura della prima riga, vedo che il valore di Sig.(2-code) e’ superiore a 0,05
quindi posso assumere che i due campioni provengono da popolazioni con gli stessi parametri, perche’ non
esistono differenze significative.
Spiegazione: esistono due formule per il calcolo del t di student. Una complessa e una semplificata (se le
varianze sono uguali). Il PASW calcola con entrambe le formule, e lascia decidere a noi se le varianze sono uguali.
Ecco perche’ ci da il Test di Levene che e’ il rapporto tra le varianze del primo gruppo e del secondo gruppo
ANOVA UNIVARIATA BETWEEN
Si usa per confrontare due campionamenti sulla base di una variabile che identifica diversi gruppi
Nel nostro esempio, il miglioramento al Test intermedio, verificando le differenze WITHIN e BETWEEN i tre tipi
di esercitazioni di recupero: Teorico, Pratico o Teorico-Pratico.
7
lOMoAR cPSD
Nei parametri POST-HOC selezioniamo Tukey
Su Opzioni selezioniamo Descrittive e il Grafico delle medie
L’output che ritroviamo ci mostra due tabelle di DESCRITTIVI, in cui vediamo i dettagli per ogni gruppo:
8
lOMoAR cPSD
E un riassuntivo dell’ANOVA BETWEEN e WITHIN, che ci mostra che il Sig e’ < 0,01 quindi che ci sono delle
differenze significative.
Qui il valore della prima riga e’ la varianza dovuta alla somma di tutti i singoli gruppi.
Se si fa l’ANOVA tra 2 gruppi il risultato e’ quello del T-Test, la F sarebbe il quadrato del T-Test
Nel Test Post-Hoc possiamo osservare i confronti multipli tra i vari gruppi, che ci mostra le differenze tra loro:
L’analisi dei sottoinsiemi omogenei e il grafico delle medie ci mostrano quanto i tre gruppi siano dissimili tra loro.
9
lOMoAR cPSD
MODELLO LINEARE GENERALIZZATO – UNIVARIATA
Si usa per verificare l’interazione tra le varianti di due fattori
Es: performance al test sulla base di Tipo Recupero (Teorico/Pratico/Teorico-Pratico) e Supporto
(Self-Study/Videolezioni/E-Learning) 10
lOMoAR cPSD
Nell’OUTPUT, il test degli effetti ci mostra come hanno effetto Recupero e Supporto ma non l’interazione tra i
due
L’interazione tra due fattori significa che una variabile influisce sull’altra.
11
CORRELAZIONE E REGRESSIONE
CORRELAZIONE
Dal menu ANALIZZA CORRELAZIONE
BIVARIATA scegliamo le variabili da confrontare
Nell’output possiamo vedere i coefficienti di correlazione di pearson tra le varie variabili selezionate
13
lOMoAR cPSD
REGRESSIONE
Analizza Regressione Lineare 14
lOMoAR cPSD
La R rappresenta la correlazione globale tra tutte le variabili. Piu’ e’ alto questo valore, piu’ il nostro modello e’
riuscito ad individuare delle relazioni tra le variabili.
Solitamente si usa l’R-quadrato, che ci dice quanto e’ buono il modello, e rappresenta la percentuale di varianza
spiegata.
Dopo i dati dell’ANOVA 15
lOMoAR cPSD
Abbiamo la nostra equazione:
In questa tabella ci interessano i coefficienti standardizzati.
Nel nostro caso vediamo che la variabile che piu’ influenza il valore finale e’ la Prova 2 (piu’ alto valore di Beta)
DOMANDA: COME POSSIAMO UTILIZZARE QUESTI PASSAGGI IN SEDE D’ESAME?
Noi possiamo usare la regressione in due modalita’:
- la prima e’ predittiva (esplorativa) provo a vedere quali variabili indipendenti influenzano la mia variabile dipendente
e con quale impatto;
- il secondo modo e’ quando io ho gia’ in mente il modello teorico, sto ripetendo una ricerca ecc., e provo
a confermare il modello esistente sui miei dati;
in genere viene chiesto: scegli una variabile dipendente, scegli le variabili indipendenti, ed esplora con un software
a tua scelta quale puo’ essere la relazione che li rappresenti.
In sostanza quello che si fa e’ esplorare i dati, e cercare di interpretare il modello.
16
lOMoAR cPSD
ALTRO ESEMPIO
Confrontiamo la Prova 3 (var. dipendente) con 3 altre variabili (indipendenti): per blocchi
Prova 2, Numero Esercizi eseguiti, Numero pagine appunti
Come Passo successivo proviamo a Rimuovere il numero di pagine di appunti
Impostiamo sempre le stesse statistiche di prima 17
lOMoAR cPSD
Quindi l’OUTPUT ora ci mostra i due blocchi
L’R-Quadrato corretto non cambia molto anche se nel secondo modello abbiamo una variabile in meno
18
lOMoAR cPSD
Andiamo a vedere i Beta:
Nel primo modello vediamo che il Num Pagine appunti ha un Beta abbastanza basso, ed e’ anche poco significativo.
Questo significa che questa variabile non e’ particolarmente rilevante sull’effetto, infatti il Beta delle altre variabili
nel secondo modello e’ praticamente invariato. 19
lOMoAR cPSD
CHI QUADRATO
Questa applicazione ci fa capire se tra due variabili nominali e’ presente una associazione, una dipendenza.
Per esempio prendiamo in considerazione Genere e Comportamento Religioso
Analizza Statistiche descrittive Tavole di contingenza per creare la tabella delle frequenze tra le var.
Ecco l’OUTPUT: 20
lOMoAR cPSD
Ora, esaminando l’ultima tabella, dobbiamo porre le due ipotesi
H0 che dice che non vi e’ associazione tra le variabili
H1 che dice che vi e’ associazione
In questo caso, poiche’ il valore di probabilita’ associata al Chi-Quadro e’ superiore all’ alfa scelto (0,05)
allora dobbiamo accettare H0 che prevede che non vi sia associazione tra le variabili
ALTRE INFO: I RESIDUI
Supponiamo di aggiungere alle celle anche le Frequenze Attese e i Residui Standardizzati:
Ecco che otteniamo una tabella piu’ ricca, in cui in ogni cella abbiamo le info richieste:
dal confronto delle frequenze misurate (conteggio) e quelle attese teoriche (calcolate partendo dal presupposto che
le due variabili siano tra loro indipendenti), abbiamo i residui (standardizzati)
quando sono in valore assoluto > 1 hanno una certa rilevanza
saranno quindi questi residui che abbasseranno il valore di probabilita’ di Chi-Quadro, che ci puo’ portare ad accettare
l’ipotesi alternativa H1 di dipendenza 21
lOMoAR cPSD
22
lOMoAR cPSD
ANALISI FATTORIALE
L’analisi fattoriale, sulla base delle correlazioni tra variabili, individua dei fattori latenti e tenta di ricostruire la
matrice dei dati. (un po’ come con la regressione)
Nel momento in cui la rielabora ci dice quanto la soluzione individuata riesce a riprodurre i dati. Cioe’ quanto
il modello si adatta bene coi dati (livello di Significativita)
Nell’esempio esploriamo una serie di variabili (risposte al questionario sul Maslach Burnout Index)
Analizza Riduzioni Dimensione Fattoriale
Parametri da impostare: Descrittive, Estrazione, Rotazione, Opzioni
23
lOMoAR cPSD
La rotazione e’ quello che ci fa trovare la soluzione che meglio si adatta ai nostri dati.
Ecco l’OUTPUT:
Indicazioni di base se l’analisi fattoriale ha senso.
Il primo test KMO dev’essere un valore molto alto, possibilmente superiore a 0,6. In questo modo possiamo dire OK la
nostra analisi ha senso.
Stesso discorso per il test di sfericita’ Bartlett, la Sig. dev’essere molto bassa. Significa in questo caso che i dati sono
sufficientemente adeguati per fare l’Analisi Fattoriale.
Poi c’e’ la matrice di Correlazione. I valori alti significano che non ci sono correlazioni tra quelle variabili.
24
lOMoAR cPSD
Nella tabella Comunalita’, piu’ e’ alto il valore di estrazione, piu’ ha senso che il nostro item stia nella AF
Corrisponde alla percentuale di varianza spiegata.
Terza tabella la Varianza Totale Spiegata
ci interessa il valore di percentuale di varianza spiegata nella 3 colonna dei fattori ruotati
Significa che la nostra AF va a spiegare il 38% della varianza
Il problema qua e’ che ciascuno degli item come correlazione ha varianza 1.
I fattori estraibili sono 22, ma dal 5 in poi spiegano meno di 1. Il problema e’ trovare i fattori che spiegano piu’ di
un singolo item.
Avere un fattore come 3 e 4 che spiegano poco piu’ di 1 item, ha senso oppure no? Da questa tabella
sembrerebbe meglio provare ad estrarre 3 fattori, oppure solo 2.
25
lOMoAR cPSD
Nel grafico si guarda il punto in cui cambia direzione. In questo caso teniamo conto dei primi 3 fattori.
Qui ci interessa la Matrice Fattoriale Ruotata
In questo caso riusciamo a evidenziare una certa omogeneita’ dei valori di correlazione, che ci identifica
la particolarita’ dei fattori (es. 1-Esaurimento, 3- Realizzazione Personale, ecc.)
26
lOMoAR cPSD
Il test di bonta’ dell’adattamento ci dice quanto la matrice fattoriale ruotata riesce ad adattarsi ai dati.
Il valore Chi-Quadro deve essere alto (>0,01), e noi non vogliamo trovare diff. Significative tra la matrice di partenza
e quella ricostruita. In questo caso non e’ cosi.
RIPETIAMO CON SOLO 3 FATTORI
Ora otteniamo questa Matrice Fattoriale Ruotata
Nella quale riusciamo anche stavolta ad identificare le tipologie di fattori (es. 1-Esaurimento, 3- Realizzazione
Personale, ecc.) 27
lOMoAR cPSD
ESERCITAZIONE CON VANIN E ROSSI b
Esame del 18 settembre 2009 - Compito (pi090918b.pdf)
Partiamo dal quesito 5
Analizza Correlazione Bivariata
Scegliamo 5 variabili che non siano tra le L (vedi es. precedente)
OK, verifichiamo l’OUTPUT: 28
lOMoAR cPSD
SPSS ci indica con ** la significativita’ 0,01 -> in questo caso la richiesta era alfa=0,05 quindi e’ meglio verificare
il valore di Sig. < 0,05 per determinare le variabili con correlazione significativa
Sul foglio d’esame segnamo quindi solo i valori delle variabili con queste correlazioni significative (nel nostro caso
sono solo quelle con **, perche’ non ne abbiamo altre con Sig.<0,05 oltre a queste segnalate)
<