1
Università degli Studi di Roma ‘La Sapienza’
FACOLTÀ DI SOCIOLOGIA
Cattedra di Statistica
Prof.ssa Mary Fraire
Docente: Bruno Delle Donne
a.a. 2004-05
Corso Intensivo di supporto
all’esame di Statistica 1
Indice
Appunti
1° Parte -
− pag. 3
Calolo delle probabilità
A. − pag. 11
Inferenza statistica
B. − pag. 21
Il campionamento
C. Test
2° Parte - pag. 24
Risposte test
3° Parte - pag. 33 2
Università degli Studi di Roma ‘La Sapienza’
FACOLTÀ DI SOCIOLOGIA
Corso di Statistica
Prof.ssa Mary Fraire
Docente: Bruno Delle Donne
a.a. 2004-05
Appunti Corso Intensivo di supporto
Riepilogo degli argomenti – definizioni ed
algoritmi – inseriti nei lucidi utilizzati
durante le lezioni
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 3
Calcolo delle probabilità
Definizioni
Il calcolo delle probabilità tende a rendere razionale il comportamento dell’uomo di
fronte all’incertezza; di fatto viene utilizzato in tutte le situazioni in cui non sono
prevedibili tutti i fattori osservabili e in quei casi in cui si debbono prendere decisioni in
base ad ipotesi riguardanti eventi futuri.
evento aleatorio
Un evento casuale (detto anche ) è rappresentato da uno dei possibili
risultati di un esperimento casuale. L’evento aleatorio può essere:
• certo: quando il risultato è positivo e noto a priori (estrarre una pallina bianca da
un un’urna contenente solo palline bianche);
• impossibile: quando il risultato è nullo e noto a priori (estrarre una pallina nera da
un un’urna contenente solo palline bianche);
• possibile: quando il risultato non è noto a priori (estrarre una pallina nera da un
un’urna contenente palline bianche e nere).
Nell’ultimo caso l’insieme dei risultati possibili si definisce spazio campionario e si indica
Ω
con il simbolo .
Lo spazio campionario si indica con:
Ω ≡ (E ; E ;E ;……;E )
1 2 3 n
essendo E il generico evento possibile ed n il numero di tali eventi.
i
A titolo di esempio: Ω ≡
l’estrazione di una pallina da un’urna con palline bianche e nere darebbe (B;N);
Ω ≡
il lancio di due monete in successione darebbe (TT;TC;CT;CC);
Ω ≡
l’estrazione di un bussolotto della tombola darebbe (1;2;3;4;…….;88;89;90);
Ω ≡
il lancio di due dadi in successione darebbe (12;13;14;15;16;21;22;…….;64;65;66).
incompatibili
Due o più eventi si dicono se il verificarsi di uno degli eventi esclude il
compatibili
verificarsi degli altri; si diranno nel caso contrario.
necessari
Due eventi incompatibili si dicono se uno di essi deve verificarsi
necessariamente. indipendenti
Due o più eventi si dicono se il verificarsi di uno non modifica il verificarsi
dipendenti
dell’altro; si diranno nel caso contrario.
Si chiama complementare dell’evento E quello corrispondente al non verificarsi
Ē
dell’evento (si indica con e si legge E negato o non E).
Ad esempio lanciando un dado, l’evento complementare all’uscita del numero 3 è dato
dall’uscita dei numeri 1,2,4,5,6.
Si possono dare 4 diverse definizioni di probabilità:
Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 4
1. soggettivista: la probabilità di un evento è il grado di aspettativa del verificarsi
dell’evento (se diciamo che la probabilità di uscita della faccia testa nel lancio di una
moneta è il 50% (1/2) gli attribuiamo un grado di fiducia maggiore di quello che
attribuiremmo all’uscita del numero 3 nel lancio di un dado a cui diamo probabilità
del 16,6% (1/6). Pertanto visto che la probabilità di un evento impossibile è zero e
quella di un evento certo è 1, per il generico evento E si può scrivere:
0 Pr(E) 1
≤ ≤
2. classica: la probabilità di un evento è il rapporto tra il numero dei casi favorevoli ed
il numero dei casi possibili, purché tutti i casi siano ugualmente possibili; a titolo di
esempio:
a. l’uscita di doppia testa nel lancio di due monete in successione è pari ad 1/4
essendo TT uno dei 4 casi possibili (TT, TC, CT,CC);
b. l’uscita di una carta di bastoni da un mazzo di carte napoletane è pari ad
10/40 essendo 10 il numero dei bastoni presenti nel mazzo di 40 carte;
c. l’estrazione di una pallina bianca da un’urna contenente 5 palline rosse, 12
bianche e 8 nere è pari a 12/25 essendo 12 il numero dei casi favorevoli e 25
quelli possibili.
3. frequentista: la probabilità di un evento è il limite a cui tende la frequenza relativa
di un evento (riscontrata in precedenti situazioni) al crescere del numero delle
prove; si ricorda che la frequenza relativa è il rapporto tra il numero delle prove in
cui si è manifestato l’evento e tutte le prove fatte.
4. assiomatica: la probabilità di un evento è quel numero reale p tale che:
a. 0 p 1;
≤ ≤
b. se l’evento è certo p(E)=1 e se l’evento è impossibile p(E)=0;
c. se due eventi E ed E sono incompatibili allora p(E o E ) = p(E ) + p(E ).
1 2 1 2 1 2
Teoremi
Quando si parla di eventi dipendenti debbono essere analizzate le probabilità subordinate,
cioè la probabilità che il secondo evento si verifichi subordinatamente al verificarsi del
primo evento; ad esempio se si volesse calcolare la probabilità di estrarre una carte di
spade da un mazzo napoletano si avrebbe 10/40, qualora tuttavia la carta estratta fosse
una seconda carta la sua probabilità risulterebbe diversa sapendo che la prima carta è
stata il 3 di bastoni (probabilità=10/39) oppure il 5 di coppe (probabilità=10/39) oppure il
2 di spade (probabilità=9/39) e cosi via). La probabilità del verificarsi dell’evento E
2
subordinatamente all’evento E si indica con p(E / E ). E’ evidente che nel caso di eventi
1 2 1
indipendenti si avrebbe p(E / E )= p(E )
2 2 2
I teoremi fondamentali sulle probabilità possono sintetizzarsi in:
1. probabilità composte: la probabilità del verificarsi di un evento che risulta dal
concorso di due eventi è data dal prodotto delle probabilità del primo evento e del
secondo subordinatamente al primo:
Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 5
• eventi dipendenti - p(E e E ) = p(E ) * p(E / E )
1 2 1 2 1
• eventi indipendenti - p(E e E ) = p(E ) * p(E )
1 2 1 2
2. probabilità totali: la probabilità che si verifichi uno dei due eventi E o E è data dalla
1 2
somma delle probabilità dei due eventi diminuita della probabilità che si verifichino
entrambi:
• eventi compatibili - p(E o E ) = p(E ) + p(E ) - p(E e E )
1 2 1 2 1 2
• eventi incompatibili - p(E o E ) = p(E ) + p(E ) (la probabilità che si
1 2 1 2
verifichino entrambi è ovviamente nulla).
Richiami di calcolo combinatorio
Per le applicazioni di calcolo delle probabilità è necessario conoscere alcune nozioni di
calcolo combinatorio che possono essere sintetizzate nelle seguenti:
Permutazioni
Si dicono permutazioni di N elementi tutti quei gruppi che si possono formare con gli N
elementi cambiando l’ordine degli elementi stessi; ad esempio avendo le prime tre lettere
dell’alfabeto a, b, c, è possibile ottenere i seguenti gruppi: abc, acb, bac, bca, cab, cba.
Il numero dei gruppi che si possono formare risulta pari a
( ) ( ) ( )
= ⋅ − ⋅ − ⋅ − ⋅ ⋅ ⋅ ⋅ =
P N N 1 N 2 N 3 .......... . 3 2 1 N !
N
Il simbolo N! si legge N fattoriale e sta ad indicare il prodotto di N termini crescenti da 1
fino ad N.
Disposizioni
Si dicono disposizioni di N elementi di classe k tutti quei gruppi che si possono formare
prendendo ogni volta k degli N elementi e cambiando ogni volta un elemento o l’ordine
degli elementi stessi.
Le disposizioni possono essere:
• senza ripetizione: quando ogni elemento deve comparire una sola volta in ciascun
gruppo e risultano pari a (il numero dei termini del prodotto è pari a k):
( ) ( ) ( ) ( ) N !
= ⋅ − ⋅ − ⋅ − ⋅ ⋅ − + =
D N N 1 N 2 N 3 .......... . N k 1 ( )
N , k −
N k !
ad esempio avendo le prime quattro lettere dell’alfabeto a, b, c, d, prendendole a due a
due è possibile ottenere i seguenti gruppi: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc; il
( ) 4
!
= ⋅ − = =
D 4 4 1 12
numero dei gruppi risulta ( )
4 ,
2 −
4 2 !
• con ripetizione: quando ogni elemento può comparire più volte in ciascun gruppo e
=
r k
D N
risultano pari a: N , k
ad esempio avendo le prime quattro lettere dell’alfabeto a, b, c, d, prendendole a due a
due è possibile ottenere i seguenti gruppi: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd,
= =
r 2
D 4 16
da, db, dc, dd; il numero dei gruppi risulta 4 ,
2
Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 6
Combinazioni
Si dicono combinazioni di N elementi di classe k tutti quei gruppi che si possono formare
prendendo ogni volta k degli N elementi e cambiando ogni volta un elemento e non
l’ordine degli elementi stessi.
Le combinazioni possono essere:
• senza ripetizione: quando ogni elemento deve comparire una sola volta in ciascun
gruppo e risultano pari a:
( ) ( ) ( ) ( )
⋅ − ⋅ − ⋅ − ⋅ ⋅ − +
N
N N 1 N 2 N 3 .......... . N k 1 N !
= = ≡
C
N , k ⋅ −
k ! k ! ( N k )! k
ad esempio avendo le prime cinque lettere dell’alfabeto a, b, c, d, e, prendendole a due
a due è possibile ottenere i seguenti gruppi: ab, ac, ad, ae, bc, bd, be, cd, ce, de; il
( )
⋅ −
5 5 1 5
!
= = =
C 10
numero dei gruppi risulta ( )
4 2
, ⋅ ⋅ −
2 1 2
! 5 2 !
• con ripetizione: quando ogni elemento può comparire più volte in ciascun gruppo e
risultano pari a: + −
N k 1
( )
+ −
N k !
1
== ≡
r C
N , k ⋅ −
k ! ( N )! k
1 L
ad esempio avendo le prime cinque lettere dell’alfabeto a, b, c, d, e, prendendole a due
a due è possibile ottenere i seguenti gruppi: aa, ab, ac, ad, ae, bb, bc, bd, be, cc, cd, ce,
( )
+ −
5 2 1 !
= =
r C 15
dd, de, ee; il numero dei gruppi risulta ( )
5 2
, ⋅ −
2
! 5 1 !
Legge empirica del caso
Sottoponendo un evento con probabilità p(E) ad una serie n di prove indipendenti ed
effettuate nelle medesime condizioni, questo presenterà una frequenza assoluta k
(numero delle volte in cui si è manifestato l’evento) ed una frequenza relativa f=k/n.
La legge empirica del caso, denominata anche legge dei grandi numeri, afferma che al
crescere del numero delle prove la frequenza relativa f tende alla probabilità p(E); si
deve precisare che la legge è molto generica: non vengono precisati i concetti di crescita
del numero delle prove che non è comunque quella del limite nel senso di analisi
matematica ed inoltre molto spesso è impossibile sottoporre un evento ad un numero
molto grande di prove (basta pensare ad un esperimento scientifico).
In ogni modo, nei casi in cui la quantità delle informazioni è molto elevata, il fenomeno è
assimilabile ai giochi d’azzardo (lancio di una moneta, estrazione di una carta) e quindi
l’approccio frequentista può coincidere con quello soggettivista.
Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 7
Teorema di Bayes
Riprendiamo il teorema delle probabilità composte ed il concetto delle probabilità
subordinate e quindi quello di eventi dipendenti; per il teorema sugli eventi dipendenti si
può scrivere:
p(E e E ) = p(E ) * p(E / E ) oppure p(E e E ) = p(E ) * p(E / E )
1 2 1 2 1 2 1 2 1 2
e visto che le due probabilità p(E e E ) e p(E e E ) sono uguali si può scrivere:
1 2 2 1
p(E ) * p(E / E ) = p(E ) * p(E / E ) da cui
1 2 1 2 1 2 ( )
⋅
( ) p ( E ) p E / E
= 1 2 1
p E / E ( )
1 2 p E 2
Le diverse probabilità che appaiono nell’ultima relazione che rappresenta il teorema di
Bayes possono essere interpretate come:
p(E / E ) probabilità a posteriori, cioè la probabilità che avendo osservato l’evento E
1 2 1
questo sia stato generato dalla causa E ;
2
p(E ) probabilità a priori;
1
p(E ) probabilità dell’evento E indipendentemente dall’altro evento;
2 2
p(E / E ) verosimiglianza cioè la probabilità dell’evento E subordinatamente all’evento
2 1 2
E .
1
Il teorema di Bayes consente di utilizzare tutta una serie di informazioni, disponibili da
altre indagini statistiche relative agli eventi interessati (ad esempio la probabilità a priori
e la verosimiglianza) in modo da poter ottenere una serie di convinzioni tradotte in
distribuzioni a priori di probabilità.
Teorema delle prove ripetute
Considerando un evento E, estrazione di una pallina da un’urna contenente palline
bianche e nere, con probabilità p e probabilità contraria q (pari a 1 – p), se si eseguono n
estrazioni reinserendo ogni volta la pallina nell’urna, si vuole calcolare la probabilità che
si presentino h palline bianche. La probabilità di estrarre le prime h palline bianche e le
successive nere è data da (teorema delle probabilità composte):
−
= ⋅
h n h
P p q
Considerando tutti i modi possibile di uscita nelle n prove (cioè alternando uscite bianche
e nere) delle h palline bianche (combinazioni senza ripetizione di n elementi di classe h) si
avrà che la probabilità cercata è pari a:
n −
= ⋅
h n h
P p q
h
h
Distribuzioni di probabilità
Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli
Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire
bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 8
eventi possibili connessi ad un certo numero di prove dello schema generale di estrazione
di una pallina da un’urna.
Le più usuali distribuzioni di probabilità utilizzate nella statistica inferenziale sono
rappresentate da:
1. distribuzione bernoullina o binomiale: è una distribuzione discreta la cui espressione è
quella generale indicata nel problema delle prove ripetute; tale distribuzione gode
delle seguenti proprietà:
• la distribuzione è simmetrica indipendentemente dal numero delle prove
purché p=q=1/2;
• la somma delle probabilità della distribuzione è uguale ad uno;
• la probabilità del singolo evento è relativamente bassa; n
=
• h
la massima probabilità si ha in corrispondenza dell’evento se n è pari e
2
+
1
n n
=
h oppure se n è dispari (la parentesi quadra individua la
2 2
parte intera del quoziente);
• la media della distribuzione è np e la sua varianza è npq;
• per n sufficientemente grande (normalmente maggiore di 30) la distribuzione
è approssimata dalla distribuzione normale o di Gauss.
La funzione di ripartizione della distribuzione è tabulata per vari valori di n e di p
n
n −
∑ k n k
p q (essendo k
in modo da poter determinare i valori dell’espressione
k
=
i k
il numero dei casi favorevoli).
distribuzione normale o di Gauss: è una distribuzione continua la cui curva ha equazione
2
−
1 x m
−
1 σ 2
σ
=
2 in cui la media è m=np e la varianza è =npq; la curva è definita in tutto
y e
σ π
2 ±
∞
l’intervallo delle x (± ) e presenta le seguenti caratteristiche:
• approssima la distribuzione binomiale al crescere del numero delle prove;
• è simmetrica rispetto alla media nel senso che la probabilità di un valore
superiore alla media di un intervallo prefissato è uguale alla probabilità di un
valore inferiore alla media dello stesso intervallo;
• l’area al di sotto della curva è pari ad 1;
• approssima molte distribuzioni empiriche nel campo sociale, fisico,
economico, ecc.;
• approssima la distribuzione degli errori accidentali (quelli che si commettono
quando si misura più volte la stessa grandez
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Terapia del supporto parodontale
-
Tecniche di statistica multivariata a supporto delle decisioni aziendali, Tesi
-
Istologia - Tessuto connettivo e di supporto
-
Genitorialità: età adulta e supporto