Estratto del documento

7. VERSO L INFERENZA STATISTICA

Cosa succede all errore standard diminuisce all aumentare della numerosità campionaria

• ➝

Con cosa si usa il parametro ? popolazione (la statistica con i dati di un campione)

• ➝

La varianza del campione (varianza campionaria, s ) rispetto a quella stimata è più piccola

• 2 ➝

Se la numerosità di due campioni è la stessa allora anche gli errori standard sono uguali

• ➝

La varianza campionaria sottostima della varianza della popolazione

• ➝

Errore standard della media σ x= σ /√n → σ della popolazione

• ➝

Se 2 campioni con n uguale allora stesso σx

• ➝

La varianza campionaria s minore della varianza della popolazione σ , perché la prima

• 2

2 ➝

ha come denominatore n, la seconda n-1

• Consideriamo la variabile quantitativa X. Supponiamo di conoscere la varianza della

popolazione rispetto a X. Supponiamo di aver estratto due campioni di uguale numerosit

dalla popolazione e di aver calcolato ogni volta l errore standard della media campionaria.

Quale delle seguenti affermazioni corretta:

a) i due errori standard sono sicuramente diversi

b) i due errori standard sono sicuramente uguali

c) sulla base delle informazioni a disposizione, nulla si pu dire sulla relazione tra i due errori

standard

d) i due errori standard sono probabilmente diversi

• In Statistica, l errore standard :

a) una misura di variabilità di una statistica dei dati

b) una misura diretta della variabilità dei dati no, la deviazione standard lo è

c) l errore di una distribuzione normale standard

d) la media dei residui in un modello simmetrico

• Si consideri la distribuzione campionaria della media per campioni di dimensione n=3 estratti

da una popolazione incognita rappresentata in gura. Quale sarà il valore di mi? 6

49

è è fi ò à

• Data la popolazione con media 99.569 e deviazione standard 57.445, si consideri di estrarre

casualmente da essa un campione di n = 100. Quale tra i seguenti valori sarà più probabile

osservare come media campionaria? 100 (perché la media campionaria coincide con

quella della popolazione. Se fosse stata la varianza campionaria, questa sarebbe minore di

quella della popolazione)

Una statistica è una funzione dei dati campionari

• ➝

• se media= 99 e deviazione=57.445, nelle seguenti distribuzioni sono rappresentate le

distribuzioni campionarie della media relativa a campioni di dimensione 4, 10 e 50 e la

distribuzione campionaria della deviazione standard per n = 10. Individua la gura che

rappresenta la distribuzione campionaria della media per n = 4.

(Bassa e variabile perché n piccolo)

• Se media= 20 e deviazione standard=5, e vengono estratti 10000 campioni di dimensione n=4.

Quale delle seguenti gure rappresenta più verosimilmente la distribuzione campionaria della

varianza? D

• Data la popolazione con media 88 e deviazione standard 23, quale tra i seguenti valori indica

l errore standard della media per campioni di dimensione n=30? 23/√ 30

Quale proprietà caratterizza il valore atteso della media campionaria?

• ➝

indipendentemente dalla numerosità campionaria coincide con la media vera

Quale proprietà caratterizza il valore atteso della varianza campionaria assume il valore

• ➝

vero della varianza solo in campioni suf cientemente grandi

50

fi fi fi

ESERCIZIO 1

• Costruire attraverso la funzione seq() il seguente oggetto: v1 = (4, 8, 12, 16, 20)

v1 <- seq(from=4,to=20,by=4) o più semplicemente: v1<-seq(4,20,4)

e controllare la tipologia di oggetto creato

str(v1)

• Costruire attraverso la funzione rep() il seguente oggetto:

v2 = (Sì, Sì, No, No, No, No, Non so, Non so)

v2 <- rep(x=c("Sì","No","Non so"),times=c(2,4,2))

e controllare la tipologia di oggetto creato str(v2)1

• Costruire la seguente matrice:

X = 10 7 0 4

2 5 4 5 X<-matrix(c(10,2,7,5,0,4,4,5),nrow=2,ncol=4)

• Calcolare l ordine della matrice dim (X)

• Costruire la matrice Y eliminando da X la seconda e la quarta colonna

Y<-X[,-c(2,4)]

• Sostituire in Y l elemento sulla prima riga e seconda colonna con il valore -1

Y[1,2]<- -1

51

ESERCIZIO CURVA NORMALE

Un test psicologico sulle competenze matematiche

Supponiamo che il punteggio (X) di un test sulle competenze matematiche, validato a livello

nazionale sui bambini di 10 anni, sia distribuito normalmente con con media µ = 40 e deviazione

standard σ = 10: p(X = x) N(x ; 40, 10)

1. Qual è la probabilità che un bambino scelto a caso abbia un punteggio di competenze

matematiche inferiore alla media?

pnorm(q=40,mean=40,sd=10) 0.5

2. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore a 15?

pnorm(q=15,mean=40,sd=10) 0.0062

3. Qual è la probabilità che un bambino scelto a caso abbia un punteggio compreso tra la

media meno una deviazione standard e la media più una deviazione standard?

pnorm(q=40+10,mean=40,sd=10)-pnorm(q=40-10,mean=40,sd=10) 0.6826

4. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore alla media

meno 2 deviazioni standard?

pnorm(q=40-10*2,mean=40,sd=10) 0.0227

5. Qual è la probabilità che un bambino scelto a caso abbia un punteggio inferiore alla media

meno 3 deviazioni standard?

pnorm(q=40-10*3,mean=40,sd=10) 0.0013

6. Qual è la probabilità che un bambino scelto a caso abbia un punteggio superiore alla media

più 2 deviazioni standard e mezzo?

1-pnorm(q=40+10*2.5,mean=40,sd=10) 0.0062

7. Qual è il quinto percentile della distribuzione dei punteggi?

qnorm(p=.05,mean=40,sd=10) 23.55

8. Qual è il rango percentile associato a un bambino che ha ottenuto un punteggio di 30?

pnorm(q=30,mean=40,sd=10)*100 15.86

52

ESERCIZIO 2 CURVA NORMALE

Un test psicologico sull ansia di tratto

Supponiamo che il punteggio (X) di un test sull ansia di tratto, validato a livello nazionale su

donne maggiorenni, sia distribuito normalmente con con media µ = 50 e deviazione standard

σ = 6:

p(X = x) N(x ; 50, 6)

1. Rappresentare la funzione di densità del punteggio dell ansia per valori compresi tra µ − 4σ

e µ + 4σ 2 curve(dnorm(x=x,mean=50,sd=6),from=50-4*6,to=50+4*6)

2. Calcolare la probabilità che una donna presa a caso abbia un punteggio inferiore a 45

pnorm(q=45,mean=50,sd=6) 0.20

3. Calcolare la probabilità che una donna presa a caso abbia un punteggio superiore a 60

1-pnorm(q=60,mean=50,sd=6) 0.0477

4. Calcolare la probabilità che una donna presa a caso abbia un punteggio compreso tra 55 e

65 pnorm(q=65,mean=50,sd=6)-pnorm(q=55,mean=50,sd=6) 0.196

5. Calcolare la probabilità che una donna presa a caso abbia un punteggio inferiore alla media

meno una deviazione standard

pnorm(q=50-6,mean=50,sd=6) 0.158

6. Calcolare la probabilità che una donna presa a caso abbia un punteggio superiore alla media

più una una deviazione standard

1-pnorm(q=50+6,mean=50,sd=6) 0.158

7. Calcolare la probabilità che una donna scelta a caso abbia un punteggio che non si discosta

dalla media più di 3 deviazioni standard

pnorm(q=50+3*6,mean=50,sd=6)-pnorm(q=50-3*6,mean=50,sd=6) 0.9973

8. Calcolare il 95-esimo percentile della distribuzione dei punteggi

qnorm(p=.95,mean=50,sd=6) 59.86

9. Calcolare il rango percentile associato a una donna che ha ottenuto un punteggio di 43

pnorm(q=43,mean=50,sd=6)*100 12.16

53

SIMULAZIONE ESAME

1. Quale tra i seguenti comandi di R consente di eliminare tutti gli oggetti creati durante una

sessione di lavoro?

a) rm(LIST)

b) drop(allobjects)

c) rm(list=ls())

d) drop(all.objects)

ls() restituisce la lista di tutti gli oggetti attualmente presenti nell'ambiente di lavoro.

✅ rm(list = ls()) li rimuove tutti.

❌ rm(LIST) → cerca di rimuovere un oggetto chiamato LIST, non tutti gli oggetti.

❌ drop(allobjects) → non è un comando valido in R.

❌ drop(all.objects) → anche questo non esiste in R.

2. Un indice di variabilità può assumere:

a) solo valori maggiori di 0

b) solo valori compresi tra -1 e 1

c) solo valori maggiori o uguali a 0

d) sia 0, sia valori negativi, sia valori positivi

✅ solo valori maggiori o uguali a 0

Gli indici di variabilità (come la varianza, la deviazione standard, o l'intervallo interquartile) misurano la

dispersione dei dati e non possono essere negativi, perché:

La varianza è una media di quadrati → sempre 0.

• La deviazione standard è la radice quadrata della varianza → sempre 0.

• Anche altri indici come l intervallo (max − min) o l intervallo interquartile (Q3 − Q1) sono 0.

❌ solo valori maggiori di 0 →sbagliato, perché la variabilità può anche essere zero (se tutti i dati sono

uguali).

❌ solo valori compresi tra -1 e 1 → falso, molti indici (es. varianza) possono assumere valori ben

superiori a 1.

❌ sia 0, sia valori negativi, sia positivi"→ falso, non possono mai essere negativi.

54

3. Nell oggetto data.frame chiamato dtest sono contenuti i dati relativi alla somministrazione

di 4 test psicologici ad un campione di 100 docenti universitari. Inoltre, in dtest è contenuta

la variabile quantitativa eta che contiene l età espressa in anni dei docenti. Quale tra le

seguenti istruzioni permette di costruire un data.frame contenente tutte le variabili di dtest,

ma solamente le righe che si riferiscono ai docenti di età uguale a 30 anni?

a) dtest[dtest$eta=30,]

b) dtest[dtest$eta=30]

c) dtest[dtest$eta==30,]

d) dtest[,dtest$eta==30]

✅ dtest[dtest$eta == 30,]

In R, per ltrare righe di un data.frame in base a una condizione, si usa la sintassi:

• dataframe[condizione_sulle_righe, colonne]

dtest$eta==30 crea un vettore logico che indica quali righe soddisfano la condizione "età uguale a 30".

• Quindi dtest[dtest$eta == 30, ] seleziona tutte le colonne ( , ]) ma solo le righe con eta == 30.

❌ dtest[dtest$eta = 30, ] → Errore: usa = al posto di ==. = è per assegnazione, non per confronto.

❌ dtest[dtest$eta = 30] → Errore di sintassi + = sbagliato.

❌ dtest[, dtest$eta == 30] → Questo ltra colonne, non righe. Inadatto allo scopo.

4. Si supponga di aver rilevato su un campione di n unit&agr

Anteprima
Vedrai una selezione di 18 pagine su 84
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 1 Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 2
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 6
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 11
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 16
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 21
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 26
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 31
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 36
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 41
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 46
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 51
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 56
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 61
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 66
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 71
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 76
Anteprima di 18 pagg. su 84.
Scarica il documento per vederlo tutto.
Analisi dei dati per le scienze del comportamento - lezioni e esercizi Pag. 81
1 su 84
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher tizi80 di informazioni apprese con la frequenza delle lezioni di Analisi dei dati per le scienze del comportamento e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Padova o del prof Altoe Gianmarco.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community