Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
M,
MER
: =
-
Hi Merc #8
= Xiu
S Ser 61
0
= .
1
n SCAL
- 38
3
= .
POOLED
VARIANZA
D 1)S
1)65
65 (42
(4y -
+
= - 2
Ma
Ny + -
65 (10
1) 1) 582
(10 612
0 3
+
.
- .
-
= . 5 64
. = .
2
10
18 + UBERTA
- VERTICAL-2 18 DI
GRADI
HO AL
UNA TAUDENT
VAR CON
E TEST DISTRIB
SOTTO COME
STATISTICA L =
. .
.
1
0
fx = . RIFIUTO
REGIONE
NELLA
MENO NON
O
SA DI
CHE
VERIFICO
TOSS
CALCOL E
tra testn
, 11-
,
Ta
X1
T 63
88 7 8 43
23
- .
= -
. =
- ,
↳ 642 64h
5 5
. .
+
18 18 Ho
VISTO CHEt 73 RIFIUTO
-1 -
=
.
18 35
. 0 . 6
Esercizio per casa
Un economista vuole valutare se il reddito (misurato in dollari alla settimana), dipende,
in media, dal fatto di abitare in un comune che presenta almeno una Università pubblica.
Pertanto, 3010 soggetti vengono estratti e se ne registra il reddito, ottenendo le seguenti
sintesi campionarie:
x = 550.3; x = 611.5; s = 235.0; s = 291.1;
1 2 1 2
1683
1
GRUPPO dove il gruppo 2 è quello composto dai soggetti che abitano in comuni in cui è situata
= 1327
GRUPPO 2 almeno una Università pubblica. Ipotizzando che il reddito si distribuisca normalmente
= e che i due campioni siano tra loro indipendenti, si risponda ai seguenti quesiti:
a. Qual è il sistema di ipotesi alla base di tale test?
X
b Qual è la stima della varianza pooled ?
*
c. Qual è la distribuzione della statistica test sotto l’ipotesi nulla?
d. Considerando un livello di significatività ↵ = 0.05, è possibile rifiutare l’ipotesi
nulla formulata al punto a.?
P MEDIA
IN DAL
/ANTARE DIPENDE FATTO DI ABITARE
REDDITO IN
SE UN COMUNE
IL CON U S
.
: .
S
X1 558
=
* 5
611
2 = .
21 235
=
S2 291 1
= . SOGGETTI
1683
GRUPPO 1 = 1327 Il
GRUPPO 2 = REDDITO
DISTRIB NORM DEL
. .
CAMPIONI INDIP
HoMs-
S
A Mc o
: =
#s Ms + 8
M2
. - (1326)
S2(nz-1) 12
(5 23541652)
55 (4s 1) 293
B +
+
-
= . 68244 25
- = ,
3008
Na
Hy 2
+ - UBERTA
-STUDENT GRADI
C DI
3008
CON 1)
così (0
quando della
è
il quantili
utilizzare
ampis i
contiere
comprone ,
DX 0 85
= . 5)
1550 Gu
toss 3 6
6 38 4
- . a
.
= .
.
=
6824468244
t
16831327
tass HO
6 PER RIFIUTARE CADERE
4 DEVE FUORI
6 4 REGIONE
DALLA DI ACCETTAZIONE
= . .
,
trans Espos
toss
<
4 11. Nal
, ,
Ho
96
1
I RIFIUTO
. = 8
Corso di Statistica 2022-2023:
Esercizi su altri problemi di verifica di ipotesi
1
Esercizio 1
Il Ministero dell’Università in collaborazione col Ministero del Lavoro e delle Politiche
sociali, vogliono confrontare la proporzione di NEET (Neither in Employment nor in
Education or Training), ossia i giovani che non lavorano e non studiano, in due diverse
Regioni (A e B). Per questo motivo si decide di estrarre casualmente 1000 giovani (dai
15 ai 29 anni) dalla Regione A e 1200 giovani dalla Regione B (sempre nella fascia d’età
15-29 anni). Il numero di NEET nel campione della Regione A risulta pari a 139, mentre
nella regione B è pari a 180. Considerando i due campioni come indipendenti, si risponda
ai seguenti quesiti:
a. Quali sono i valori delle proporzioni campionarie p e p ?
& A B
b. Qual è il valore di p, ossia la media pesata delle proporzioni campionarie?
&
c. Si può rifiutare l’ipotesi nulla che la proporzione di NEET sia la stessa nelle due
& Regioni, considerando un al livello di significatività pari ad ↵ = 0.05?
&
d. Qual è la distribuzione della statistica test sotto l’ipotesi nulla H 0
&
e. Qual è il valore del p-value associato alla statistica test calcolata al punto c?
1200
Us
1000
Ra =
= 180
NEETcB
139
NEFTiA =
=
A 13
0
==
PA .
PB-0 1
.
Rapc 133
Hyp1 145
180 0
Bp + +
= =
= .
2200
12
41 +
0 05
2 X = . TB
Ta
Ho
& : = Er
Ja
Ho +
: 158
0
159
-
0 729
PP 0
I
& .
.
- =
= -
.
145)
145(1-0
(1 145)
.
8 145 0 0 .
- . .
1200
1000 tiss"
20 96 E
-te
E 1
= = .
025
. ret Ho
Za
Zoss mi
=> 1)
(0 GRANDI
Ho Cuffic
Per CAMPION
Distribuisce
si
Test
Statistica Come
l
Sotto
a .
,
,
Zoss 2940 73
.
0
E = . H
=3) Rifiuto
05 101
0
5(-0 x
4654
0
AWE
2327
0
vame =
p- =
-p -
=
= .
= -
= .
=
. .
2 2
Esercizio 2
Un Comune di grandi dimensioni vuole confutare l’ipotesi nulla secondo cui la proporzione
di lavoratori che usufruiscono del lavoro agile (LA) sia minore (o uguale) nelle imprese
private (IP) rispetto alla pubblica amministrazione (PA). Pertanto, e↵ettua un campi-
onamento di n = 800 lavoratori e i risultati sono sintetizzati nella seguente tabella
PA IP
Ne so
Lavoratori 500 300
Lavoratori in LA 55 81 156
555 381
Supponendo che ci sia indipendenza tra le tipologie di impiego (pubblico o privato),
si risponda ai seguenti quesiti:
a. Qual è il sistema di ipotesi alla base di tale test?
&
&
b. Quali sono i valori delle proporzioni campionarie di lavoratori in LA per le due
tipologie (IP e PA)?
c. Qual è il valore di p, ossia la media pesata delle proporzioni campionarie?
&
d. Qual è la distribuzione della statistica test sotto l’ipotesi nulla H ?
& 0
e. Si può rifiutare l’ipotesi nulla descritta nel testo, considerando un al livello di
A significatività pari a ↵ = 0.01?
800
H =
:
A 55
B PB =
Pa O
0 27
= = .
300 T
17/RIGUARDA
21 M
0
27
0
35
p + 0
- .
.
= .
. .
=
500 300
+
D 5 83
Pa
P1
z
E - -
=
= .
DIT
PIA) ,
Ea 2001 36
2
= 2x
.
= Ho
Foss Ea RIFIUTO
= 4
Esercizio 3
L’Agenzia Regionale che si occupa della gestione dei rifiuti vuole indagare se i costi di
gestione delle discariche della Regione abbiano subito variazioni significative, in media,
tra il 2016 e il 2017. Per tale motivo, estrae casualmente 10 discariche, chiedendo la
rendicontazione dei costi in migliaia di euro. Si ipotizza che i costi di gestione seguano
una distribuzione gaussiana. I costi osservati sono sintetizzati nella seguente Tabella.
e
Discarica 2016 2017 !
1 76.2 41.3 - 56
2 187.2 181.6 - &
134 U
3 371.1 505.5 - . 2
M1
4 294.5 183.3 + .
M5 2
5 117.4 232.6 - . 7
80
6 132.8 213.5 - . 1
8
+
7 34.7 34.6 .
34 3
8 247.3 281.6 - .
27 5
+
9 285.7 258.2 .
g
10 85.5 85.5
Trattandosi di rilevazioni riptetute nel tempo e considerando quindi i due campioni
come non indipendenti, si risponda ai seguenti quesiti:
a. Quali sono le di↵erenze (D) dei costi tra il 2016 e il 2017?
↳
N
b. Qual è la media campionaria di tali di↵erenze?
c. Qual è la distribuzione della statistica test sotto l’ipotesi nulla?
*
D
d. Considerando un livello di significatività del 5%, è possibile rifiutare l’ipotesi nulla
di media delle di↵erenze pari a zero, ossia H : µ = 0, contro l’ipotesi alternativa
0 D
6
H : µ = 0?
1 D
Ö -18 53
B = . Tag
Ho
Gouisian--catto
distrib
se i costi seguon una
· .
X 85
0
D = .
M
- Sotto
Toss d
=
= .
Fu 5]
Sa = .
~
+ 26
t 2
26
6
= = .
. 6
Esercizio Per casa
A seguito di un cambiamento normativo avvenuto nel 2018, un centro di ricerca ha ideato
un indice per misurare la qualità dei documenti di programmazione dei Comuni tra il
2017 e il 2018. Più è elevato l’indice di qualità, più la qualità del documento è elevata, ed
è inoltre noto che l’indice si distribuisce come una variabile aleatoria gaussiana. Si vuole
testare se il cambiamento normativo abbia portato una modifica significativa (in meglio
o in peggio) della qualità dei piani. Pertanto, in una data Regione vengono campionati
10 Comuni e i risultati dell’indice di qualità sono i seguenti: D
Comune Qualità 2017 Qualità 2018 25
1 36.9 62.5 6
- .
8
16
2 34.4 51.2 - .
7 5
3 58.1 65.6 - .
19 4
-
4 26.2 45.6 .
8 7
5 23.8 32.5 - .
6 38.1 57.5 4
19
- .
7 30.0 58.1 28. 1
-
8 46.2 76.2 30
- 13
9 48.8 61.9 1
- .
30 1
10 31.2 61.3 - .
Considerando che le due rilevazioni non sono indipendenti, si risponda ai seguenti
quesiti:
a. Quali sono le di↵erenze (D) dei costi tra il 2016 e il 2017?
A
X
b. Qual è la media campionaria dei tali di↵erenze?
c. Qual è la distribuzione della statistica test sotto l’ipotesi nulla?
d. Considerando un livello di significatività del 10%, è possibile rifiutare l’ipotesi nulla
di media delle di↵erenze pari a zero, ossia H : µ = 0, contro l’ipotesi alternativa
0 D
6
H : µ = 0?
1 D
87
9
B = . +g
TS
Hy
COTO
C -- 81
% 0
S 18
DL X = .
=
=
.
& Ho Ma -
: =
Ha r #O Sa 8
t 4h]
2498
3 =
= .
9
. 0 009 .
. 87
-19
toss = . -
/558 8
Analisi di Regressione lineare semplice 1
Esercizio 1
Si vuole stimare la relazione tra i prezzi di vendita Y (espressi in migliaia di euro) e la dimensione X
(superficie espressa in mq) degli appartamenti di una certa area. Ricorrendo ad un modello di regressione
lineare semplice si vuole prevedere il prezzo di vendita in funzione della superficie. I dati, riferiti a un
campione casuale di 10 case, sono i seguenti:
X 140 160 170 187.5 110 155 235 245 142.5 170
Y 245 312 279 308 199 219 405 324 319 255
a. Tracciare il diagramma di dispersione
b. Specificare il modello
c.