vuoi
o PayPal
tutte le volte che vuoi
Analisi della macchina di riempimento delle lattine di birra
Un produttore di birra vuole capire se la macchina che riempie le lattine è da buttare perché si accorge che non tutte le lattine contengono 0,33cc di birra. Quindi prova a prendere 40 lattine e vedere il suo contenuto. -> su VISTA DATI (in basso a dx) si vedono i 40 valori.
Su VISTA VARIABILE (in basso a dx), inserire NOME, TIPO, LARGHEZZA, DECIMALI, ETICHETTA, VALORI, MANCANTI, COLONNE, ALLINEA, MISURA, RUOLO
Prima valuto le STATISTICHE DESCRITTIVE:
- DESCRITTIVE -> seleziono il campo che voglio (per es. CC PER BOTTOGLIE) e media, deviazione standard, seleziono cosa voglio calcolare, ad esempio, massimo, minimo
Clicco poi su ANALIZZA, dove mi compaiono tutti i test e poi su MEDIE
TEST DI T A CAMPIONE SINGOLO, inserendo come valore test 33 (che sono i cc di birra che vorrei in ciascuna lattina)
Significatività inferiore a 0,01 quindi il produttore dovrebbe cambiare la macchina
ITEM MEDIO
Se devo mettere a confronto due o più distribuzioni o campioni, devo...
creare un dato per esempio devo confrontare due classi di 30 studenti, rispetto undi sintesi, questionario a cui hanno risposto, che contiene 20 domande. Il dato di sintesi, altro non è che il valore medio delle 20 risposte che lo studente ha dato al questionario, così in conclusione avrò 30 valori medi, uno per ciascuno studente.
COME SI FA A CREARE UN ITEM MEDIO? → TRASFORMA -> CALCOLA VARIABILE "Variabile di destinazione" metto il nome che voglio attribuire a questo nuovo dato creato, per esempio NMPQ.
Esempio: Cliccando su tipo etichetta posso rinominare l'etichetta che comparirà in tabella. "Gruppo di funzioni" metto STATISTICO e sotto seleziono MEAN, ovvero MEDIA. Successivamente seguo le istruzioni ovvero scrivo MEAN e tra parentesi aggiungo tutti gli items che voglio considerare divisi da una virgola.
Se successivamente vado nel DATABASE, cliccando sulla stella rossa, avrò la nuova etichetta con i nuovi valori medi.
CALCOLARE I
PUNTEGGI Z E T Cosa vuol dire calcolare il punteggio Z? Significa, data una lista di valori, attribuire al valore medio 0, ad un intervallo di confidenza attribuire il valore di +/-1 e a due intervalli di confidenza un valore di +/-2. Selezioniamo tutti i valori: 1. Calcoliamo la media 2. Calcoliamo la deviazione standard (per un campione) CON EXCEL: Ora, per ogni valore applichiamo la seguente formula: (valore - media)/deviazione standard Il dato che assumerà il valore 0, rappresenterà il nostro punteggio Z. Tuttavia, se noi abbiamo dei valori di riferimento standard (come, per esempio, il valore di colesterolo che dovrebbe essere 170 con deviazione standard di 25), allora dobbiamo applicare un'altra formula: (valore - media di riferimento)/deviazione standard di riferimento I PUNTEGGI T, normalizzano i punteggio Z, ponendo la media a 50 e la deviazione standard a +/-10. La formula che dobbiamo applicare è: 50 + (10*punteggio Z) Non si usano molto in ambito.sanitario.CON SPSS→Per il calcolo dei punteggi Z, basterà andare su:ANALIZZA -> STATISTICHE DESCRITTIVE -> DESCRITTIVE -> si selezionano le variabili-> flag sulla casella salva valori standardizzati come variabili -> OK
Per il calcolo dei punteggi T, basterà andare su:TRASFORMA -> CALCOLA VARIABILE -> VARIABILE DI DESTINAZIONE (inserisco il nomeche voglio dare alla variabile, per es. punteggio T) su ESPRESSIONE NUMERICAinserisco 50 + 10 * (punteggio grezzo – media / deviazione standard) -> OK
T TEST PER CAMPIONI INDIPENDENTISeleziono dal data base dei dati, appartenenti a due gruppi INDIPENDENTI, ovveroclasse 1°anno e classe 2° annoper esempio, (che non hanno nulla in comune comepotrebbe invece essere classe 1° anno prima e dopo un determinato incontroformativo).Il confronto ad esempio viene fatto tra 20 studenti del 1°anno e 20 studenti del2°anno rispetto le loro medie agli esami. Il che vuol dire che non devo prendere
In considerazione tutti i voti presi in ciascun esame, ma per fare un confronto devo utilizzare un punteggio di sintesi che esprime una valutazione unica, in questo caso una media di tutti gli esami svolti dallo studente x, y, z,...
Quando invece ho un questionario a più items, devo sempre ragionare in termini di calcolo dell'item medio!
- 1° cosa che devo fare è capire se la distribuzione è NORMALE o meno, per capire se utilizzare il TEST PARAMETRICO o NON PARAMETRICO!
- Quanti gruppi ho?
- Se ne ho due farò il T-test o i corrispettivi NON parametrici
- Se ne ho più di due farò ANOVA (l'analisi della varianza è un test parametrico che valuta le differenze tra le medie di due o più gruppi di dati, esso funziona confrontando la varianza delle medie tra i gruppi con la varianza all'interno dei singoli gruppi) o il corrispettivo Kruskal-Wallis (è un metodo non parametrico per verificare l'uguaglianza
delle mediane di diversi gruppi; cioè per verificare che tali gruppi provengano da una stessa popolazione o da popolazioni con uguale mediana)
Dato che sono DUE GRUPPI farò:
ANALIZZA -> STATISTICHE DESCRITTIVE -> ESPLORA
Sul comando “Statistiche…” verifico che l’intervallo di confidenza è al 95%
Sul comando “Grafici…” verifico che è selezionato Istogramma e Grafici di normalità con test
Su Elenco Dipendenti, ovvero la variabile dipendente, metto le medie degli esami
E su Elenco fattori metto la variabile indipendente ovvero le due classi (1° anno e 2° anno)
Come faccio a capire se la distribuzione è normale?
Guardo la MEDIA E L’INTERVALLO DI CONFIDENZA: es. Media 3,6 con intervallo di confidenza tra 3,3 e 3,8
Successivamente guardo la MEDIANA, se questa è compresa dentro l’intervallo di confidenza, allora la distribuzione è NORMALE
Un altro parametro che posso andare a verificare
è il TEST DI SHAPIRO-WILK, ovvero uno dei test più potenti per la verifica della normalità, soprattutto per piccoli campioni. Se il suo valore non è significativo, ovvero la p non è <0.05 allora la DISTRIBUZIONE È NORMALE. Altra caratteristica è il grafico che ne fuoriesce, se i puntini si distribuiscono lungo la diagonale, il dato è normale. Potrebbero essere presenti degli out-liner, ovvero dei punti al di fuori della diagonale che potrei eliminare. Una volta confermato che la distribuzione è NORMALE posso decidere di utilizzare un TEST PARAMETRICO, ovvero, il TEST DI T PER CAMPIONI INDIPENDENTI. Quindi ANALIZZA -> MEDIE -> TEST DI T PER CAMPIONI INDIPENDENTI. Variabile test, Sul campo ci va la variabile dipendente, ovvero le medie; mentre sul Variabile di Raggruppamento campo ci va la variabile indipendente ovvero le classi (1° e 2° anno). Questo genera il T TEST, dove mi dà il valore di t, i gradi dilibertà e la significatività
Come si scrive poi sul testo?
Se invece la distribuzione NON ERA NORMALE e quindi la Mediana era al di fuori dell’intervallo di confidenza, o il test di SHAPIRO-WILK è significativo.
Quindi avrei dovuto utilizzare il TEST NON PARAMENTRICO corrispondente, ovvero TEST U DI MANN-WHITNEY (il corrispettivo del t test per campioni indipendenti) per verificare se due campioni statistici provengono dalla stessa popolazione.
ANALIZZA -> TEST NON PARAMETRICI -> CAMPIONI INDIPENDENTI
Campi Test, Gruppi
Su metto la variabile Dipendente, su la variabile indipendente
T TEST PER CAMPIONI DIPENDENTI O APPAIATI (PRE-POST)
Lo stesso campione al tempo 0 e al tempo 1, rispetto un intervento.
1° passo: calcolare gli item medi, per poi fare il confronto tra questi
2° passo: valutare la normalità
ANALIZZA -> STATISTICHE DESCRITTIVE -> ESPLORA
In questo caso il gruppo al T0 ha una distribuzione NORMALE, ma il gruppo al T1 ha una
distribuzione NON NORMALE, quindi devo utilizzare il test NONPARAMETRICO
ANALIZZA -> TEST NON PARAMETRICI -> FINESTRA DI DIALOGO LEGACY -> DUE CAMPIONI CORRELATI
Nella variabile 1 metto il tempo 0, nella variabile 2 metto il tempo 1. Mi calcolerà il TEST DI WILCOXON per campioni appaiati che è l'alternativa nonparametrica al test t per campioni appaiati. Se la significatività è <0.001 significa che il mio intervento ha apportato dei cambiamenti.
Se invece la distribuzione fosse stata normale sia al T0 che al T1 allora avrei utilizzato un TEST PARAMETRICO, ovvero il T TEST PER CAMPIONI APPAIATI
ANALIZZA -> CONFRONTA MEDIE -> T TEST PER CAMPIONI ACCOPPIATI
Nella variabile 1 metto il tempo 0, nella variabile 2 metto il tempo 1, mi uscirà questa tabella. La significatività è <0.001 quindi significa che il mio intervento ha apportato dei cambiamenti.
CONFRONTO TRA PIÙ DI DUE GRUPPI
Come sempre occorre prima valutare
l'item medio, e con la codifica, per esempio 1 -2-3- 4 individuare i vari gruppi a confronto tra loro. Devo successivamente valutare se questa distribuzione è NORMALE o meno. Se è NORMALE, utilizzerò ANOVA. Se la distribuzione NON è NORMALE utilizzerò Kruskal-Wallis.
ANALIZZA -> STATISTICHE DESCRITTIVE -> ESPLORA
Su Elenco Dipendenti, ovvero la variabile dipendente, metto le medie degli esami.
E su Elenco fattori metto la variabile indipendente ovvero le due classi (1° anno e 2° anno).
Sul comando "Statistiche..." verifico che l'intervallo di confidenza è al 95%.
Sul comando "Grafici..." verifico che è selezionato Istogramma e Grafici di normalità con test.
Successivamente guardo la MEDIANA, se questa è compresa dentro l'intervallo di confidenza, allora la distribuzione è NORMALE.
Un altro parametro che posso andare a verificare è il TEST DI SHAPIRO-WILK.
se il suo valore non è significativo, ovvero la p non è <0.05 allora la DISTRIBUZIONE È NORMALE. DEVO VERIFICARE TUTTI E TRE/QUATTRO I GRUPPI CHE CONSIDERO! Se TUTTI i gruppi hanno una distribuzione NORMALE utilizzo il TEST -> PARAMETRICO ANOVA. ANALIZZA -> CONFRONTA MEDIA -> ANOVA A UNA VIA. La p riassuntiva NON è significativa, poiché è maggiore di 0,005, ciò determina che non ci sono differenze tra i gruppi; quindi, non mi interessa fare un confronto tra essi. Se invece la p riassunti