7. VERSO L INFERENZA STATISTICA
Cosa succede all errore standard diminuisce all aumentare della numerosità campionaria
• ➝
Con cosa si usa il parametro ? popolazione (la statistica con i dati di un campione)
• ➝
La varianza del campione (varianza campionaria, s ) rispetto a quella stimata è più piccola
• 2 ➝
Se la numerosità di due campioni è la stessa allora anche gli errori standard sono uguali
• ➝
La varianza campionaria sottostima della varianza della popolazione
• ➝
Errore standard della media σ x= σ /√n → σ della popolazione
• ➝
Se 2 campioni con n uguale allora stesso σx
• ➝
La varianza campionaria s minore della varianza della popolazione σ , perché la prima
• 2
2 ➝
ha come denominatore n, la seconda n-1
• Consideriamo la variabile quantitativa X. Supponiamo di conoscere la varianza della
popolazione rispetto a X. Supponiamo di aver estratto due campioni di uguale numerosit
dalla popolazione e di aver calcolato ogni volta l errore standard della media campionaria.
Quale delle seguenti affermazioni corretta:
a) i due errori standard sono sicuramente diversi
b) i due errori standard sono sicuramente uguali
c) sulla base delle informazioni a disposizione, nulla si pu dire sulla relazione tra i due errori
standard
d) i due errori standard sono probabilmente diversi
• In Statistica, l errore standard :
a) una misura di variabilità di una statistica dei dati
b) una misura diretta della variabilità dei dati no, la deviazione standard lo è
➝
c) l errore di una distribuzione normale standard
d) la media dei residui in un modello simmetrico
• Si consideri la distribuzione campionaria della media per campioni di dimensione n=3 estratti
da una popolazione incognita rappresentata in gura. Quale sarà il valore di mi? 6
➝
49
è è fi ò à
• Data la popolazione con media 99.569 e deviazione standard 57.445, si consideri di estrarre
casualmente da essa un campione di n = 100. Quale tra i seguenti valori sarà più probabile
osservare come media campionaria? 100 (perché la media campionaria coincide con
➝
quella della popolazione. Se fosse stata la varianza campionaria, questa sarebbe minore di
quella della popolazione)
Una statistica è una funzione dei dati campionari
• ➝
• se media= 99 e deviazione=57.445, nelle seguenti distribuzioni sono rappresentate le
distribuzioni campionarie della media relativa a campioni di dimensione 4, 10 e 50 e la
distribuzione campionaria della deviazione standard per n = 10. Individua la gura che
rappresenta la distribuzione campionaria della media per n = 4.
(Bassa e variabile perché n piccolo)
• Se media= 20 e deviazione standard=5, e vengono estratti 10000 campioni di dimensione n=4.
Quale delle seguenti gure rappresenta più verosimilmente la distribuzione campionaria della
varianza? D
➝
• Data la popolazione con media 88 e deviazione standard 23, quale tra i seguenti valori indica
l errore standard della media per campioni di dimensione n=30? 23/√ 30
➝
Quale proprietà caratterizza il valore atteso della media campionaria?
• ➝
indipendentemente dalla numerosità campionaria coincide con la media vera
Quale proprietà caratterizza il valore atteso della varianza campionaria assume il valore
• ➝
vero della varianza solo in campioni suf cientemente grandi
50
fi fi fi
ESERCIZIO 1
• Costruire attraverso la funzione seq() il seguente oggetto: v1 = (4, 8, 12, 16, 20)
v1 <- seq(from=4,to=20,by=4) o più semplicemente: v1<-seq(4,20,4)
e controllare la tipologia di oggetto creato
str(v1)
• Costruire attraverso la funzione rep() il seguente oggetto:
v2 = (Sì, Sì, No, No, No, No, Non so, Non so)
v2 <- rep(x=c("Sì","No","Non so"),times=c(2,4,2))
e controllare la tipologia di oggetto creato str(v2)1
• Costruire la seguente matrice:
X = 10 7 0 4
2 5 4 5 X<-matrix(c(10,2,7,5,0,4,4,5),nrow=2,ncol=4)
• Calcolare l ordine della matrice dim (X)
• Costruire la matrice Y eliminando da X la seconda e la quarta colonna
Y<-X[,-c(2,4)]
• Sostituire in Y l elemento sulla prima riga e seconda colonna con il valore -1
Y[1,2]<- -1
51
ESERCIZIO CURVA NORMALE
Un test psicologico sulle competenze matematiche
Supponiamo che il punteggio (X) di un test sulle competenze matematiche, validato a livello
nazionale sui bambini di 10 anni, sia distribuito normalmente con con media µ = 40 e deviazione
standard σ = 10: p(X = x) N(x ; 40, 10)
1. Qual è la probabilità che un bambino scelto a caso abbia un punteggio di competenze
matematiche inferiore alla media?
pnorm(q=40,mean=40,sd=10) 0.5
➝
2. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore a 15?
pnorm(q=15,mean=40,sd=10) 0.0062
➝
3. Qual è la probabilità che un bambino scelto a caso abbia un punteggio compreso tra la
media meno una deviazione standard e la media più una deviazione standard?
pnorm(q=40+10,mean=40,sd=10)-pnorm(q=40-10,mean=40,sd=10) 0.6826
➝
4. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore alla media
meno 2 deviazioni standard?
pnorm(q=40-10*2,mean=40,sd=10) 0.0227
➝
5. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore alla media
meno 3 deviazioni standard?
pnorm(q=40-10*3,mean=40,sd=10) 0.0013
➝
6. Qual è la probabilità che un bambino scelto a caso abbia un punteggio superiore alla media
più 2 deviazioni standard e mezzo?
1-pnorm(q=40+10*2.5,mean=40,sd=10) 0.0062
➝
7. Qual è il quinto percentile della distribuzione dei punteggi?
qnorm(p=.05,mean=40,sd=10) 23.55
➝
8. Qual è il rango percentile associato a un bambino che ha ottenuto un punteggio di 30?
pnorm(q=30,mean=40,sd=10)*100 15.86
➝
52
ESERCIZIO 2 CURVA NORMALE
Un test psicologico sull ansia di tratto
Supponiamo che il punteggio (X) di un test sull ansia di tratto, validato a livello nazionale su
donne maggiorenni, sia distribuito normalmente con con media µ = 50 e deviazione standard
σ = 6:
p(X = x) N(x ; 50, 6)
1. Rappresentare la funzione di densità del punteggio dell ansia per valori compresi tra µ − 4σ
e µ + 4σ 2 curve(dnorm(x=x,mean=50,sd=6),from=50-4*6,to=50+4*6)
2. Calcolare la probabilità che una donna presa a caso abbia un punteggio inferiore a 45
pnorm(q=45,mean=50,sd=6) 0.20
➝
3. Calcolare la probabilità che una donna presa a caso abbia un punteggio superiore a 60
1-pnorm(q=60,mean=50,sd=6) 0.0477
➝
4. Calcolare la probabilità che una donna presa a caso abbia un punteggio compreso tra 55 e
65 pnorm(q=65,mean=50,sd=6)-pnorm(q=55,mean=50,sd=6) 0.196
➝
5. Calcolare la probabilità che una donna presa a caso abbia un punteggio inferiore alla media
meno una deviazione standard
pnorm(q=50-6,mean=50,sd=6) 0.158
➝
6. Calcolare la probabilità che una donna presa a caso abbia un punteggio superiore alla media
più una una deviazione standard
1-pnorm(q=50+6,mean=50,sd=6) 0.158
➝
7. Calcolare la probabilità che una donna scelta a caso abbia un punteggio che non si discosta
dalla media più di 3 deviazioni standard
pnorm(q=50+3*6,mean=50,sd=6)-pnorm(q=50-3*6,mean=50,sd=6) 0.9973
➝
8. Calcolare il 95-esimo percentile della distribuzione dei punteggi
qnorm(p=.95,mean=50,sd=6) 59.86
➝
9. Calcolare il rango percentile associato a una donna che ha ottenuto un punteggio di 43
pnorm(q=43,mean=50,sd=6)*100 12.16
➝
53
SIMULAZIONE ESAME
1. Quale tra i seguenti comandi di R consente di eliminare tutti gli oggetti creati durante una
sessione di lavoro?
a) rm(LIST)
b) drop(allobjects)
c) rm(list=ls())
d) drop(all.objects)
ls() restituisce la lista di tutti gli oggetti attualmente presenti nell'ambiente di lavoro.
✅ rm(list = ls()) li rimuove tutti.
❌ rm(LIST) → cerca di rimuovere un oggetto chiamato LIST, non tutti gli oggetti.
❌ drop(allobjects) → non è un comando valido in R.
❌ drop(all.objects) → anche questo non esiste in R.
2. Un indice di variabilità può assumere:
a) solo valori maggiori di 0
b) solo valori compresi tra -1 e 1
c) solo valori maggiori o uguali a 0
d) sia 0, sia valori negativi, sia valori positivi
✅ solo valori maggiori o uguali a 0
Gli indici di variabilità (come la varianza, la deviazione standard, o l'intervallo interquartile) misurano la
dispersione dei dati e non possono essere negativi, perché:
La varianza è una media di quadrati → sempre 0.
≥
• La deviazione standard è la radice quadrata della varianza → sempre 0.
≥
• Anche altri indici come l intervallo (max − min) o l intervallo interquartile (Q3 − Q1) sono 0.
≥
•
❌ solo valori maggiori di 0 →sbagliato, perché la variabilità può anche essere zero (se tutti i dati sono
uguali).
❌ solo valori compresi tra -1 e 1 → falso, molti indici (es. varianza) possono assumere valori ben
superiori a 1.
❌ sia 0, sia valori negativi, sia positivi"→ falso, non possono mai essere negativi.
54
3. Nell oggetto data.frame chiamato dtest sono contenuti i dati relativi alla somministrazione
di 4 test psicologici ad un campione di 100 docenti universitari. Inoltre, in dtest è contenuta
la variabile quantitativa eta che contiene l età espressa in anni dei docenti. Quale tra le
seguenti istruzioni permette di costruire un data.frame contenente tutte le variabili di dtest,
ma solamente le righe che si riferiscono ai docenti di età uguale a 30 anni?
a) dtest[dtest$eta=30,]
b) dtest[dtest$eta=30]
c) dtest[dtest$eta==30,]
d) dtest[,dtest$eta==30]
✅ dtest[dtest$eta == 30,]
In R, per ltrare righe di un data.frame in base a una condizione, si usa la sintassi:
• dataframe[condizione_sulle_righe, colonne]
dtest$eta==30 crea un vettore logico che indica quali righe soddisfano la condizione "età uguale a 30".
• Quindi dtest[dtest$eta == 30, ] seleziona tutte le colonne ( , ]) ma solo le righe con eta == 30.
•
❌ dtest[dtest$eta = 30, ] → Errore: usa = al posto di ==. = è per assegnazione, non per confronto.
❌ dtest[dtest$eta = 30] → Errore di sintassi + = sbagliato.
❌ dtest[, dtest$eta == 30] → Questo ltra colonne, non righe. Inadatto allo scopo.
4. Si supponga di aver rilevato su un campione di n unit&agr
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti dell'esame di Analisi delle scienze del comportamento
-
Analisi dei dati (statistica)
-
Analisi sensoriale
-
Formulario Esercizi di Analisi di Dati (statistica sperimentale)