Estratto del documento

1

Università degli Studi di Roma ‘La Sapienza’

FACOLTÀ DI SOCIOLOGIA

Cattedra di Statistica

Prof.ssa Mary Fraire

Docente: Bruno Delle Donne

a.a. 2004-05

Corso Intensivo di supporto

all’esame di Statistica 1

Indice

Appunti

1° Parte -

− pag. 3

Calolo delle probabilità

A. − pag. 11

Inferenza statistica

B. − pag. 21

Il campionamento

C. Test

2° Parte - pag. 24

Risposte test

3° Parte - pag. 33 2

Università degli Studi di Roma ‘La Sapienza’

FACOLTÀ DI SOCIOLOGIA

Corso di Statistica

Prof.ssa Mary Fraire

Docente: Bruno Delle Donne

a.a. 2004-05

Appunti Corso Intensivo di supporto

Riepilogo degli argomenti – definizioni ed

algoritmi – inseriti nei lucidi utilizzati

durante le lezioni

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 3

Calcolo delle probabilità

Definizioni

Il calcolo delle probabilità tende a rendere razionale il comportamento dell’uomo di

fronte all’incertezza; di fatto viene utilizzato in tutte le situazioni in cui non sono

prevedibili tutti i fattori osservabili e in quei casi in cui si debbono prendere decisioni in

base ad ipotesi riguardanti eventi futuri.

evento aleatorio

Un evento casuale (detto anche ) è rappresentato da uno dei possibili

risultati di un esperimento casuale. L’evento aleatorio può essere:

• certo: quando il risultato è positivo e noto a priori (estrarre una pallina bianca da

un un’urna contenente solo palline bianche);

• impossibile: quando il risultato è nullo e noto a priori (estrarre una pallina nera da

un un’urna contenente solo palline bianche);

• possibile: quando il risultato non è noto a priori (estrarre una pallina nera da un

un’urna contenente palline bianche e nere).

Nell’ultimo caso l’insieme dei risultati possibili si definisce spazio campionario e si indica

con il simbolo .

Lo spazio campionario si indica con:

Ω ≡ (E ; E ;E ;……;E )

1 2 3 n

essendo E il generico evento possibile ed n il numero di tali eventi.

i

A titolo di esempio: Ω ≡

l’estrazione di una pallina da un’urna con palline bianche e nere darebbe (B;N);

Ω ≡

il lancio di due monete in successione darebbe (TT;TC;CT;CC);

Ω ≡

l’estrazione di un bussolotto della tombola darebbe (1;2;3;4;…….;88;89;90);

Ω ≡

il lancio di due dadi in successione darebbe (12;13;14;15;16;21;22;…….;64;65;66).

incompatibili

Due o più eventi si dicono se il verificarsi di uno degli eventi esclude il

compatibili

verificarsi degli altri; si diranno nel caso contrario.

necessari

Due eventi incompatibili si dicono se uno di essi deve verificarsi

necessariamente. indipendenti

Due o più eventi si dicono se il verificarsi di uno non modifica il verificarsi

dipendenti

dell’altro; si diranno nel caso contrario.

Si chiama complementare dell’evento E quello corrispondente al non verificarsi

Ē

dell’evento (si indica con e si legge E negato o non E).

Ad esempio lanciando un dado, l’evento complementare all’uscita del numero 3 è dato

dall’uscita dei numeri 1,2,4,5,6.

Si possono dare 4 diverse definizioni di probabilità:

Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 4

1. soggettivista: la probabilità di un evento è il grado di aspettativa del verificarsi

dell’evento (se diciamo che la probabilità di uscita della faccia testa nel lancio di una

moneta è il 50% (1/2) gli attribuiamo un grado di fiducia maggiore di quello che

attribuiremmo all’uscita del numero 3 nel lancio di un dado a cui diamo probabilità

del 16,6% (1/6). Pertanto visto che la probabilità di un evento impossibile è zero e

quella di un evento certo è 1, per il generico evento E si può scrivere:

0 Pr(E) 1

≤ ≤

2. classica: la probabilità di un evento è il rapporto tra il numero dei casi favorevoli ed

il numero dei casi possibili, purché tutti i casi siano ugualmente possibili; a titolo di

esempio:

a. l’uscita di doppia testa nel lancio di due monete in successione è pari ad 1/4

essendo TT uno dei 4 casi possibili (TT, TC, CT,CC);

b. l’uscita di una carta di bastoni da un mazzo di carte napoletane è pari ad

10/40 essendo 10 il numero dei bastoni presenti nel mazzo di 40 carte;

c. l’estrazione di una pallina bianca da un’urna contenente 5 palline rosse, 12

bianche e 8 nere è pari a 12/25 essendo 12 il numero dei casi favorevoli e 25

quelli possibili.

3. frequentista: la probabilità di un evento è il limite a cui tende la frequenza relativa

di un evento (riscontrata in precedenti situazioni) al crescere del numero delle

prove; si ricorda che la frequenza relativa è il rapporto tra il numero delle prove in

cui si è manifestato l’evento e tutte le prove fatte.

4. assiomatica: la probabilità di un evento è quel numero reale p tale che:

a. 0 p 1;

≤ ≤

b. se l’evento è certo p(E)=1 e se l’evento è impossibile p(E)=0;

c. se due eventi E ed E sono incompatibili allora p(E o E ) = p(E ) + p(E ).

1 2 1 2 1 2

Teoremi

Quando si parla di eventi dipendenti debbono essere analizzate le probabilità subordinate,

cioè la probabilità che il secondo evento si verifichi subordinatamente al verificarsi del

primo evento; ad esempio se si volesse calcolare la probabilità di estrarre una carte di

spade da un mazzo napoletano si avrebbe 10/40, qualora tuttavia la carta estratta fosse

una seconda carta la sua probabilità risulterebbe diversa sapendo che la prima carta è

stata il 3 di bastoni (probabilità=10/39) oppure il 5 di coppe (probabilità=10/39) oppure il

2 di spade (probabilità=9/39) e cosi via). La probabilità del verificarsi dell’evento E

2

subordinatamente all’evento E si indica con p(E / E ). E’ evidente che nel caso di eventi

1 2 1

indipendenti si avrebbe p(E / E )= p(E )

2 2 2

I teoremi fondamentali sulle probabilità possono sintetizzarsi in:

1. probabilità composte: la probabilità del verificarsi di un evento che risulta dal

concorso di due eventi è data dal prodotto delle probabilità del primo evento e del

secondo subordinatamente al primo:

Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 5

• eventi dipendenti - p(E e E ) = p(E ) * p(E / E )

1 2 1 2 1

• eventi indipendenti - p(E e E ) = p(E ) * p(E )

1 2 1 2

2. probabilità totali: la probabilità che si verifichi uno dei due eventi E o E è data dalla

1 2

somma delle probabilità dei due eventi diminuita della probabilità che si verifichino

entrambi:

• eventi compatibili - p(E o E ) = p(E ) + p(E ) - p(E e E )

1 2 1 2 1 2

• eventi incompatibili - p(E o E ) = p(E ) + p(E ) (la probabilità che si

1 2 1 2

verifichino entrambi è ovviamente nulla).

Richiami di calcolo combinatorio

Per le applicazioni di calcolo delle probabilità è necessario conoscere alcune nozioni di

calcolo combinatorio che possono essere sintetizzate nelle seguenti:

Permutazioni

Si dicono permutazioni di N elementi tutti quei gruppi che si possono formare con gli N

elementi cambiando l’ordine degli elementi stessi; ad esempio avendo le prime tre lettere

dell’alfabeto a, b, c, è possibile ottenere i seguenti gruppi: abc, acb, bac, bca, cab, cba.

Il numero dei gruppi che si possono formare risulta pari a

( ) ( ) ( )

= ⋅ − ⋅ − ⋅ − ⋅ ⋅ ⋅ ⋅ =

P N N 1 N 2 N 3 .......... . 3 2 1 N !

N

Il simbolo N! si legge N fattoriale e sta ad indicare il prodotto di N termini crescenti da 1

fino ad N.

Disposizioni

Si dicono disposizioni di N elementi di classe k tutti quei gruppi che si possono formare

prendendo ogni volta k degli N elementi e cambiando ogni volta un elemento o l’ordine

degli elementi stessi.

Le disposizioni possono essere:

• senza ripetizione: quando ogni elemento deve comparire una sola volta in ciascun

gruppo e risultano pari a (il numero dei termini del prodotto è pari a k):

( ) ( ) ( ) ( ) N !

= ⋅ − ⋅ − ⋅ − ⋅ ⋅ − + =

D N N 1 N 2 N 3 .......... . N k 1 ( )

N , k −

N k !

ad esempio avendo le prime quattro lettere dell’alfabeto a, b, c, d, prendendole a due a

due è possibile ottenere i seguenti gruppi: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc; il

( ) 4

!

= ⋅ − = =

D 4 4 1 12

numero dei gruppi risulta ( )

4 ,

2 −

4 2 !

• con ripetizione: quando ogni elemento può comparire più volte in ciascun gruppo e

=

r k

D N

risultano pari a: N , k

ad esempio avendo le prime quattro lettere dell’alfabeto a, b, c, d, prendendole a due a

due è possibile ottenere i seguenti gruppi: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd,

= =

r 2

D 4 16

da, db, dc, dd; il numero dei gruppi risulta 4 ,

2

Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 6

Combinazioni

Si dicono combinazioni di N elementi di classe k tutti quei gruppi che si possono formare

prendendo ogni volta k degli N elementi e cambiando ogni volta un elemento e non

l’ordine degli elementi stessi.

Le combinazioni possono essere:

• senza ripetizione: quando ogni elemento deve comparire una sola volta in ciascun

gruppo e risultano pari a:

( ) ( ) ( ) ( )

⋅ − ⋅ − ⋅ − ⋅ ⋅ − +  

N

N N 1 N 2 N 3 .......... . N k 1 N !

= = ≡  

C  

N , k ⋅ −  

k ! k ! ( N k )! k

ad esempio avendo le prime cinque lettere dell’alfabeto a, b, c, d, e, prendendole a due

a due è possibile ottenere i seguenti gruppi: ab, ac, ad, ae, bc, bd, be, cd, ce, de; il

( )

⋅ −

5 5 1 5

!

= = =

C 10

numero dei gruppi risulta ( )

4 2

, ⋅ ⋅ −

2 1 2

! 5 2 !

• con ripetizione: quando ogni elemento può comparire più volte in ciascun gruppo e

risultano pari a: + −

 

N k 1

( )

+ −  

N k !

1

== ≡

r C  

N , k ⋅ −  

k ! ( N )! k

1 L

 

ad esempio avendo le prime cinque lettere dell’alfabeto a, b, c, d, e, prendendole a due

a due è possibile ottenere i seguenti gruppi: aa, ab, ac, ad, ae, bb, bc, bd, be, cc, cd, ce,

( )

+ −

5 2 1 !

= =

r C 15

dd, de, ee; il numero dei gruppi risulta ( )

5 2

, ⋅ −

2

! 5 1 !

Legge empirica del caso

Sottoponendo un evento con probabilità p(E) ad una serie n di prove indipendenti ed

effettuate nelle medesime condizioni, questo presenterà una frequenza assoluta k

(numero delle volte in cui si è manifestato l’evento) ed una frequenza relativa f=k/n.

La legge empirica del caso, denominata anche legge dei grandi numeri, afferma che al

crescere del numero delle prove la frequenza relativa f tende alla probabilità p(E); si

deve precisare che la legge è molto generica: non vengono precisati i concetti di crescita

del numero delle prove che non è comunque quella del limite nel senso di analisi

matematica ed inoltre molto spesso è impossibile sottoporre un evento ad un numero

molto grande di prove (basta pensare ad un esperimento scientifico).

In ogni modo, nei casi in cui la quantità delle informazioni è molto elevata, il fenomeno è

assimilabile ai giochi d’azzardo (lancio di una moneta, estrazione di una carta) e quindi

l’approccio frequentista può coincidere con quello soggettivista.

Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 7

Teorema di Bayes

Riprendiamo il teorema delle probabilità composte ed il concetto delle probabilità

subordinate e quindi quello di eventi dipendenti; per il teorema sugli eventi dipendenti si

può scrivere:

p(E e E ) = p(E ) * p(E / E ) oppure p(E e E ) = p(E ) * p(E / E )

1 2 1 2 1 2 1 2 1 2

e visto che le due probabilità p(E e E ) e p(E e E ) sono uguali si può scrivere:

1 2 2 1

p(E ) * p(E / E ) = p(E ) * p(E / E ) da cui

1 2 1 2 1 2 ( )

( ) p ( E ) p E / E

= 1 2 1

p E / E ( )

1 2 p E 2

Le diverse probabilità che appaiono nell’ultima relazione che rappresenta il teorema di

Bayes possono essere interpretate come:

p(E / E ) probabilità a posteriori, cioè la probabilità che avendo osservato l’evento E

1 2 1

questo sia stato generato dalla causa E ;

2

p(E ) probabilità a priori;

1

p(E ) probabilità dell’evento E indipendentemente dall’altro evento;

2 2

p(E / E ) verosimiglianza cioè la probabilità dell’evento E subordinatamente all’evento

2 1 2

E .

1

Il teorema di Bayes consente di utilizzare tutta una serie di informazioni, disponibili da

altre indagini statistiche relative agli eventi interessati (ad esempio la probabilità a priori

e la verosimiglianza) in modo da poter ottenere una serie di convinzioni tradotte in

distribuzioni a priori di probabilità.

Teorema delle prove ripetute

Considerando un evento E, estrazione di una pallina da un’urna contenente palline

bianche e nere, con probabilità p e probabilità contraria q (pari a 1 – p), se si eseguono n

estrazioni reinserendo ogni volta la pallina nell’urna, si vuole calcolare la probabilità che

si presentino h palline bianche. La probabilità di estrarre le prime h palline bianche e le

successive nere è data da (teorema delle probabilità composte):

= ⋅

h n h

P p q

Considerando tutti i modi possibile di uscita nelle n prove (cioè alternando uscite bianche

e nere) delle h palline bianche (combinazioni senza ripetizione di n elementi di classe h) si

avrà che la probabilità cercata è pari a:

 

n −

= ⋅

h n h

 

P p q

 

h  

h

Distribuzioni di probabilità

Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli

Università degli Studi di Roma ‘La Sapienza’-Facoltà di Sociologia - Cattedra di Statistica - Prof.ssa Mary Fraire

bruno delle donne – appunti Corso Intensivo di Statistica - a.a.2004-05 8

eventi possibili connessi ad un certo numero di prove dello schema generale di estrazione

di una pallina da un’urna.

Le più usuali distribuzioni di probabilità utilizzate nella statistica inferenziale sono

rappresentate da:

1. distribuzione bernoullina o binomiale: è una distribuzione discreta la cui espressione è

quella generale indicata nel problema delle prove ripetute; tale distribuzione gode

delle seguenti proprietà:

• la distribuzione è simmetrica indipendentemente dal numero delle prove

purché p=q=1/2;

• la somma delle probabilità della distribuzione è uguale ad uno;

• la probabilità del singolo evento è relativamente bassa; n

=

• h

la massima probabilità si ha in corrispondenza dell’evento se n è pari e

2

+

   

1

n n

=

h oppure se n è dispari (la parentesi quadra individua la

   

   

2 2

parte intera del quoziente);

• la media della distribuzione è np e la sua varianza è npq;

• per n sufficientemente grande (normalmente maggiore di 30) la distribuzione

è approssimata dalla distribuzione normale o di Gauss.

La funzione di ripartizione della distribuzione è tabulata per vari valori di n e di p

n  

n −

∑ k n k

  p q (essendo k

in modo da poter determinare i valori dell’espressione  

 

k

=

i k

il numero dei casi favorevoli).

distribuzione normale o di Gauss: è una distribuzione continua la cui curva ha equazione

2

 

1 x m

−  

1 σ 2

σ

=  

2 in cui la media è m=np e la varianza è =npq; la curva è definita in tutto

y e

σ π

2 ±

l’intervallo delle x (± ) e presenta le seguenti caratteristiche:

• approssima la distribuzione binomiale al crescere del numero delle prove;

• è simmetrica rispetto alla media nel senso che la probabilità di un valore

superiore alla media di un intervallo prefissato è uguale alla probabilità di un

valore inferiore alla media dello stesso intervallo;

• l’area al di sotto della curva è pari ad 1;

• approssima molte distribuzioni empiriche nel campo sociale, fisico,

economico, ecc.;

• approssima la distribuzione degli errori accidentali (quelli che si commettono

quando si misura più volte la stessa grandez

Anteprima
Vedrai una selezione di 12 pagine su 53
Supporto all’esame di Statistica Pag. 1 Supporto all’esame di Statistica Pag. 2
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 6
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 11
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 16
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 21
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 26
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 31
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 36
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 41
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 46
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Supporto all’esame di Statistica Pag. 51
1 su 53
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher valeria0186 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Fraire Mary.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community