Anteprima
Vedrai una selezione di 9 pagine su 38
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 1 Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 2
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 6
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 11
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 16
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 21
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 26
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 31
Anteprima di 9 pagg. su 38.
Scarica il documento per vederlo tutto.
Riassunto del corso di Analisi Multivariata dei Dati, docente Gallucci Pag. 36
1 su 38
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

T-TEST E ANOVA, AD UNA E A DUE VIE

T-TEST A CAMPIONE UNICO

Si usa quando devo confrontare con un singolo valore di media

Si deve guardare il valore Sig. deve essere sotto 0,05 o 0,01

T-TEST CAMPIONI APPAIATI

Si usa quando dobbiamo confrontare due serie di dati complete (non solo la media)

5

lOMoAR cPSD

Qui in entrambi i casi il valore di Significativita’ e’ inferiore a 0,01 quindi i due valori confrontati sono

statisticamente differenti

Dalla media evinco (in entrambi i casi) che la prima serie e’ inferiore alla seconda.

Guardando t e Sig. vedo che esiste una differenza significativa e quindi posso concludere che

T-TEST A CAMPIONI INDIPENDENTI

Si esegue quando abbiamo due gruppi indipendenti 6

lOMoAR cPSD

Qui l’interpretazione prevede il confronto di due valori:

Prima, nella sezione Test di Levene: se il valore Sig. e’ superiore a 0,05, prendo in considerazione la prima riga del

resto della tabella, altrimenti prendo in considerazione la seconda.

In questo caso, proseguendo la lettura della prima riga, vedo che il valore di Sig.(2-code) e’ superiore a 0,05

quindi posso assumere che i due campioni provengono da popolazioni con gli stessi parametri, perche’ non

esistono differenze significative.

Spiegazione: esistono due formule per il calcolo del t di student. Una complessa e una semplificata (se le

varianze sono uguali). Il PASW calcola con entrambe le formule, e lascia decidere a noi se le varianze sono uguali.

Ecco perche’ ci da il Test di Levene che e’ il rapporto tra le varianze del primo gruppo e del secondo gruppo

ANOVA UNIVARIATA BETWEEN

Si usa per confrontare due campionamenti sulla base di una variabile che identifica diversi gruppi

Nel nostro esempio, il miglioramento al Test intermedio, verificando le differenze WITHIN e BETWEEN i tre tipi

di esercitazioni di recupero: Teorico, Pratico o Teorico-Pratico.

7

lOMoAR cPSD

Nei parametri POST-HOC selezioniamo Tukey

Su Opzioni selezioniamo Descrittive e il Grafico delle medie

L’output che ritroviamo ci mostra due tabelle di DESCRITTIVI, in cui vediamo i dettagli per ogni gruppo:

8

lOMoAR cPSD

E un riassuntivo dell’ANOVA BETWEEN e WITHIN, che ci mostra che il Sig e’ < 0,01 quindi che ci sono delle

differenze significative.

Qui il valore della prima riga e’ la varianza dovuta alla somma di tutti i singoli gruppi.

Se si fa l’ANOVA tra 2 gruppi il risultato e’ quello del T-Test, la F sarebbe il quadrato del T-Test

Nel Test Post-Hoc possiamo osservare i confronti multipli tra i vari gruppi, che ci mostra le differenze tra loro:

L’analisi dei sottoinsiemi omogenei e il grafico delle medie ci mostrano quanto i tre gruppi siano dissimili tra loro.

9

lOMoAR cPSD

MODELLO LINEARE GENERALIZZATO – UNIVARIATA

Si usa per verificare l’interazione tra le varianti di due fattori

Es: performance al test sulla base di Tipo Recupero (Teorico/Pratico/Teorico-Pratico) e Supporto

(Self-Study/Videolezioni/E-Learning) 10

lOMoAR cPSD

Nell’OUTPUT, il test degli effetti ci mostra come hanno effetto Recupero e Supporto ma non l’interazione tra i

due

L’interazione tra due fattori significa che una variabile influisce sull’altra.

11

CORRELAZIONE E REGRESSIONE

CORRELAZIONE  

Dal menu ANALIZZA CORRELAZIONE

BIVARIATA scegliamo le variabili da confrontare

Nell’output possiamo vedere i coefficienti di correlazione di pearson tra le varie variabili selezionate

13

lOMoAR cPSD

REGRESSIONE

 

Analizza Regressione Lineare 14

lOMoAR cPSD

La R rappresenta la correlazione globale tra tutte le variabili. Piu’ e’ alto questo valore, piu’ il nostro modello e’

riuscito ad individuare delle relazioni tra le variabili.

Solitamente si usa l’R-quadrato, che ci dice quanto e’ buono il modello, e rappresenta la percentuale di varianza

spiegata.

Dopo i dati dell’ANOVA 15

lOMoAR cPSD

Abbiamo la nostra equazione:

In questa tabella ci interessano i coefficienti standardizzati.

Nel nostro caso vediamo che la variabile che piu’ influenza il valore finale e’ la Prova 2 (piu’ alto valore di Beta)

DOMANDA: COME POSSIAMO UTILIZZARE QUESTI PASSAGGI IN SEDE D’ESAME?

Noi possiamo usare la regressione in due modalita’:

- la prima e’ predittiva (esplorativa) provo a vedere quali variabili indipendenti influenzano la mia variabile dipendente

e con quale impatto;

- il secondo modo e’ quando io ho gia’ in mente il modello teorico, sto ripetendo una ricerca ecc., e provo

a confermare il modello esistente sui miei dati;

in genere viene chiesto: scegli una variabile dipendente, scegli le variabili indipendenti, ed esplora con un software

a tua scelta quale puo’ essere la relazione che li rappresenti.

In sostanza quello che si fa e’ esplorare i dati, e cercare di interpretare il modello.

16

lOMoAR cPSD

ALTRO ESEMPIO

Confrontiamo la Prova 3 (var. dipendente) con 3 altre variabili (indipendenti): per blocchi

Prova 2, Numero Esercizi eseguiti, Numero pagine appunti

Come Passo successivo proviamo a Rimuovere il numero di pagine di appunti

Impostiamo sempre le stesse statistiche di prima 17

lOMoAR cPSD

Quindi l’OUTPUT ora ci mostra i due blocchi

L’R-Quadrato corretto non cambia molto anche se nel secondo modello abbiamo una variabile in meno

18

lOMoAR cPSD

Andiamo a vedere i Beta:

Nel primo modello vediamo che il Num Pagine appunti ha un Beta abbastanza basso, ed e’ anche poco significativo.

Questo significa che questa variabile non e’ particolarmente rilevante sull’effetto, infatti il Beta delle altre variabili

nel secondo modello e’ praticamente invariato. 19

lOMoAR cPSD

CHI QUADRATO

Questa applicazione ci fa capire se tra due variabili nominali e’ presente una associazione, una dipendenza.

Per esempio prendiamo in considerazione Genere e Comportamento Religioso

 

Analizza Statistiche descrittive Tavole di contingenza per creare la tabella delle frequenze tra le var.

Ecco l’OUTPUT: 20

lOMoAR cPSD

Ora, esaminando l’ultima tabella, dobbiamo porre le due ipotesi

 H0 che dice che non vi e’ associazione tra le variabili

  H1 che dice che vi e’ associazione

In questo caso, poiche’ il valore di probabilita’ associata al Chi-Quadro e’ superiore all’ alfa scelto (0,05)

allora dobbiamo accettare H0 che prevede che non vi sia associazione tra le variabili

ALTRE INFO: I RESIDUI

Supponiamo di aggiungere alle celle anche le Frequenze Attese e i Residui Standardizzati:

Ecco che otteniamo una tabella piu’ ricca, in cui in ogni cella abbiamo le info richieste:

dal confronto delle frequenze misurate (conteggio) e quelle attese teoriche (calcolate partendo dal presupposto che

le due variabili siano tra loro indipendenti), abbiamo i residui (standardizzati)

quando sono in valore assoluto > 1 hanno una certa rilevanza

saranno quindi questi residui che abbasseranno il valore di probabilita’ di Chi-Quadro, che ci puo’ portare ad accettare

l’ipotesi alternativa H1 di dipendenza 21

lOMoAR cPSD

22

lOMoAR cPSD

ANALISI FATTORIALE

L’analisi fattoriale, sulla base delle correlazioni tra variabili, individua dei fattori latenti e tenta di ricostruire la

matrice dei dati. (un po’ come con la regressione)

Nel momento in cui la rielabora ci dice quanto la soluzione individuata riesce a riprodurre i dati. Cioe’ quanto

il modello si adatta bene coi dati (livello di Significativita)

Nell’esempio esploriamo una serie di variabili (risposte al questionario sul Maslach Burnout Index)

 

Analizza Riduzioni Dimensione Fattoriale

Parametri da impostare: Descrittive, Estrazione, Rotazione, Opzioni

23

lOMoAR cPSD

La rotazione e’ quello che ci fa trovare la soluzione che meglio si adatta ai nostri dati.

Ecco l’OUTPUT:

Indicazioni di base se l’analisi fattoriale ha senso.

Il primo test KMO dev’essere un valore molto alto, possibilmente superiore a 0,6. In questo modo possiamo dire OK la

nostra analisi ha senso.

Stesso discorso per il test di sfericita’ Bartlett, la Sig. dev’essere molto bassa. Significa in questo caso che i dati sono

sufficientemente adeguati per fare l’Analisi Fattoriale.

Poi c’e’ la matrice di Correlazione. I valori alti significano che non ci sono correlazioni tra quelle variabili.

24

lOMoAR cPSD

Nella tabella Comunalita’, piu’ e’ alto il valore di estrazione, piu’ ha senso che il nostro item stia nella AF

Corrisponde alla percentuale di varianza spiegata.

Terza tabella la Varianza Totale Spiegata

ci interessa il valore di percentuale di varianza spiegata nella 3 colonna dei fattori ruotati

Significa che la nostra AF va a spiegare il 38% della varianza

Il problema qua e’ che ciascuno degli item come correlazione ha varianza 1.

I fattori estraibili sono 22, ma dal 5 in poi spiegano meno di 1. Il problema e’ trovare i fattori che spiegano piu’ di

un singolo item.

Avere un fattore come 3 e 4 che spiegano poco piu’ di 1 item, ha senso oppure no? Da questa tabella

sembrerebbe meglio provare ad estrarre 3 fattori, oppure solo 2.

25

lOMoAR cPSD

Nel grafico si guarda il punto in cui cambia direzione. In questo caso teniamo conto dei primi 3 fattori.

Qui ci interessa la Matrice Fattoriale Ruotata

In questo caso riusciamo a evidenziare una certa omogeneita’ dei valori di correlazione, che ci identifica

la particolarita’ dei fattori (es. 1-Esaurimento, 3- Realizzazione Personale, ecc.)

26

lOMoAR cPSD

Il test di bonta’ dell’adattamento ci dice quanto la matrice fattoriale ruotata riesce ad adattarsi ai dati.

Il valore Chi-Quadro deve essere alto (>0,01), e noi non vogliamo trovare diff. Significative tra la matrice di partenza

e quella ricostruita. In questo caso non e’ cosi.

RIPETIAMO CON SOLO 3 FATTORI

Ora otteniamo questa Matrice Fattoriale Ruotata

Nella quale riusciamo anche stavolta ad identificare le tipologie di fattori (es. 1-Esaurimento, 3- Realizzazione

Personale, ecc.) 27

lOMoAR cPSD

ESERCITAZIONE CON VANIN E ROSSI b

Esame del 18 settembre 2009 - Compito (pi090918b.pdf)

Partiamo dal quesito 5

 

Analizza Correlazione Bivariata

Scegliamo 5 variabili che non siano tra le L (vedi es. precedente)

OK, verifichiamo l’OUTPUT: 28

lOMoAR cPSD

SPSS ci indica con ** la significativita’ 0,01 -> in questo caso la richiesta era alfa=0,05 quindi e’ meglio verificare

il valore di Sig. < 0,05 per determinare le variabili con correlazione significativa

Sul foglio d’esame segnamo quindi solo i valori delle variabili con queste correlazioni significative (nel nostro caso

sono solo quelle con **, perche’ non ne abbiamo altre con Sig.<0,05 oltre a queste segnalate)

<
Dettagli
Publisher
A.A. 2015-2016
38 pagine
2 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher paulweston di informazioni apprese con la frequenza delle lezioni di Analisi multivariata dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Gallucci Marcello.