Estratto del documento

Appunti di statistica

La statistica è stata concepita inizialmente come attività descrittiva di certi fatti sociali, come attività amministrativa dello stato. Si è poi ampliata a scienza del collettivo, perché studia le popolazioni. Galton è uno dei padri della statistica, ha sviluppato metodi per questionari e indagini per lo studio delle scienze umane. È una disciplina scientifica per la raccolta, analisi e interpretazione di dati. Si basa sulla teoria della probabilità. La statistica quindi ci guida nelle scienze umane e nella scienza e tecnologia.

Si utilizza il linguaggio della probabilità per costruire una storia usando dei dati, che sono gli indizi. Questa storia deve avere una spiegazione plausibile (modello). Una volta fatta la storia bisogna cercare conferma (in statistica si parla di inferenza, ossia passare da un campione di dati all’intera popolazione).

Probabilità

Lo studio delle leggi del caso va sotto il nome di calcolo delle probabilità. La probabilità è il linguaggio delle situazioni che presentano incertezza. La probabilità nasce coi giochi di carte di nobili francesi che si sono posti quesiti sulla probabilità di vittoria al gioco di carte. Uno dei metodi per gestire l’incertezza è assegnare una probabilità agli esiti dell’esperimento. La probabilità quindi è uno strumento per gestire l’incertezza.

Esperimento

L’esperimento è un procedimento concreto o ideale che produca un’osservazione, un risultato, un esito. È una prova il cui esito è incerto. Lo spazio degli esiti è l’insieme di tutti i possibili risultati di un esperimento, detto anche evento certo o spazio campionario. L’evento è un sottoinsieme dello spazio degli esiti, indicato con le lettere maiuscole. Si verifica se il risultato che osserviamo sta in questo sottoinsieme. Gli eventi sono le entità per le quali è possibile calcolare una probabilità.

  • P(A)= 0 se pensiamo che l’evento non si verifichi. A si chiamerà evento quasi impossibile.
  • P(A) > 0 se pensiamo che l’evento possa verificarsi. Non ha mai probabilità negativa.
  • P(Ø)=0 se l’insieme non contiene elementi. L’evento è quindi impossibile e la sua probabilità è nulla.
  • P(A) = 1 evento quasi certo. Non esiste mai la certezza totale che un evento si realizzi.

Eventi

Quando abbiamo due eventi A e B usiamo:

  • A U B: si verifica almeno uno dei 2 eventi. Può verificarsi solo A, può verificarsi solo B o possono verificarsi entrambi nell’intersezione tra i due insiemi.
  • A B: nella zona dove si sovrappongono i due eventi. Quindi si verificano entrambi gli eventi.
  • Ā: complementare di A, cioè non si verifica A.

Due eventi A e B sono incompatibili (o disgiunti) se uno esclude l’altro. La loro intersezione è vuota, non esiste. Se A e B sono incompatibili, possiamo assumere che P(A U B)=P(A)+P(B). Un evento e il suo complementare sono incompatibili.

La probabilità di un evento A è necessariamente maggiore o uguale a 0. La probabilità dello spazio degli esiti è 1. La somma della probabilità di due sottoinsiemi A e B è:

  • Se P(A B)=Ø, allora P(A U B) = P(A) + P(B).
  • Invece se P(A B)≠Ø, allora P(A U B)=P(A)+P(B)-P(A B).

Ne deriva che:

  • La probabilità di A è compresa tra 0 e 1 (attenzione! Può essere sia uguale a 0 che a 1).

La probabilità di un evento quindi non può essere mai superiore a 1, perché 1 corrisponde al 100%.

Dato che A e il suo complementare sono incompatibili:

P(A U Ā) = 1 allora P(Ā) = 1 – P(A)

Se due eventi sono incompatibili, quindi A B≠Ø allora P(A U B) = P(A) + P(B) – P(A B), tolgo l’intersezione perché altrimenti conterei quella parte due volte. Se tutti i possibili esiti sono ugualmente possibili e finiti, una P è quella definita dal rapporto tra il numero di esiti favorevoli diviso il numero di esiti possibili.

Esempio

Se il 43% del personale è femmina (A), il 22,4% è chirurgo (B) e il 7% è chirurgo femmina (A B). Ω = tutto il personale. A e B non sono incompatibili perché esistono dei dipendenti femmina che sono chirurghi. Scegliendo a caso una persona:

  • C’è il 63% di P che sia femmina.
  • C’è il 22,4% di P che sia chirurgo.
  • C’è il 7% di P che sia femmina e chirurgo.
  • Per calcolare la probabilità che sia maschio, calcolo il complementare di A > P(Ā)=1-(A).
  • Per calcolare la probabilità che sia femmina ma non chirurgo > P(A-B)=P(A)-P(A B).

In questa situazione A e A B sono incompatibili, quindi vale la regola della somma per l’unione.

Esempio

Tra gli elettori di una città il 54% è donna. Alle ultime elezioni ha votato il 68% delle donne (D) e il 62% degli uomini (U).

  • Spazio degli esiti > tutti gli iscritti alle liste elettorali.
  • I due eventi D e U sono incompatibili (o si è uomo o donna).
  • V sono i votanti.
  • Scegliamo a caso > casi favorevoli/casi possibili.

P(A) = |A|/|Ω|= favorevoli all’evento/casi possibili dell’esperimento. In questo caso A è la cardinalità, ossia il numero di elementi contenuti in A e il simbolo si legge come “numero di”. Le percentuali ci danno i casi favorevoli.

  • Qual è la probabilità che un elettore scelto a casa sia donna? Il 54%.
  • Qual è la probabilità che sia una donna che ha votato? È il 68% del 54%. È D V = 37% ossia sia donna che votante.
  • P(D V) = 0,68*0,54 = 0,3672.
  • Qual è la probabilità che sia un uomo che non ha votato? Se le donne erano il 54%, gli uomini erano il complementare di V, quindi il 46%. Se ha votato il 62%, non ha votato il 1-62%.
  • P(U V )=(1-0,62)*0,46 = 0,1748C.
  • Qual è la probabilità che un elettore abbia votato? P(V) =P(D V)+P(U V) = 0,3672+0,1748.

Esempio

Lanciamo due dadi equilibrati:

  • Esito A: “i due punteggi sono uguali”.
  • Esito B: “la somma dei punteggi è 4”.

Trovare lo spazio degli esiti > tutte le possibili combinazioni lanciando due dadi = 36.

  • Quanto vale la probabilità di A? 6/36 quindi 1/6 > perché ci sono 36 caselle e c’è 1/6 di probabilità che esca su ciascun dado un valore.
  • A e B sono incompatibili? No, la combinazione 2;2 ha sia numeri uguali sia somma 4.
  • Quanto vale la probabilità di B? 3/36, perché ci sono 3 combinazioni su 36 che danno risultato 4.

Esercizio

P(A)= 0,7 P(B)= 0,42:

  • I due eventi sono incompatibili? No, perché la loro somma è maggiore di 1, si intersecano 0,20.
  • P(A B) quanto può valere? Se abbiamo tre opzioni: – 0,50 – 0,70. Solo 0,20 può essere l’intersezione perché P(A B) <(o uguale) P(B).
  • Quale dei seguenti valori non è accettabile per P(A B)? 0,20 – – 0,30.
  • P(A B) deve necessariamente essere minore di 1.
  • P(A U B) = P(A)+P(B)-P(A B). P(A U B) = 0,7+0,42 – P(A B) ≥ 0,12 siccome l’unione tra P(A) e P(B) non può essere maggiore di 1, il valore dell’intersezione che fa scendere l’unione sotto 1 è solo un valore superiore o uguale a 0,12. Per questo 0,10 non è un valore accettabile.

Fattoriale e coefficiente binomiale

Il fattoriale si distingue per la presenza di un punto esclamativo ! Consideriamo solo numeri interi K. K fattoriale K! > > prodotto di tutti gli interi da K in giù fino a 1 > tutti i modi in cui posso scambiare K lettere tra loro. È il numero degli anagrammi o (utilizzando il termine matematico) delle permutazioni.

Es. R-O-M-A > 4 lettere, per capire il numero di permutazioni 4*3*2*1 sono tutti i modi in cui posso far girare le lettere.

K! = K(K-1)(K-2)…*1

Esempio

In quanti modi possiamo scegliere a caso 3 studenti in una classe di 20 alunni per formare una delegazione della classe? Faccio un’estrazione senza reimmissione. Ho 20 biglietti tra cui scegliere, preso il primo lo lascio fuori e mi restano 19 biglietti, poi lascio fuori e ne restano 18, pesco l’ultimo biglietto. Ora ho trovato 3 biglietti.

20*19*18 modi per trovarli. Questi sono tutti i modi in cui posso riempire le caselle, ma il numero di delegazioni di studenti è inferiore, poiché non importa l’ordine in cui sono. Devo dividere quindi il numero ottenuto per tutti i modi in cui posso ordinarli nelle caselle, ossia 3*2*1.

( n k ) = (20*19*18)/(3*2*1) = ( 20 3) >>>> attenzione, il coefficiente binomiale in realtà si scrive con n sopra e k sotto. ( n k ) = n*(n-1)*….*(n-k+1) / K! >>> questo è il coefficiente binomiale. Al numeratore abbiamo k fattori. È possibile scrivere il coefficiente binomiale anche come ( n k) = n! / ( k!(n-k)! ) > questo significa prodotto a ritroso di n fino ad 1, diviso k per il prodotto a scendere del numero meno k moltiplicato per tutti i valori fino ad 1. Questa formula è scomoda da usare, ma molto utile nelle proprietà del coefficiente binomiale.

Proprietà di n! e coefficiente binomiale di n su k

  • 0! = 1
  • ( n 0 ) = 1
  • ( n 1 ) = ( n n-1 ) = n
  • ( n k ) = ( n n-k )

Esercizio

Scegliendo 3 studenti:

  • Trova la P di una delegazione.
  • Un’altra delegazione ha maggiore probabilità di uscire? No, qualunque terna di studenti ha uguale P.

Ma quanto vale questa P? ha P 1 diviso il numero totale delle terne. Le terne sono (20*19*18)/(3*2*1). Facendo il coefficiente binomiale 20 su 3 ottengo 1140 terne diverse. Quindi la probabilità di ogni terna è 1/1140, ossia 0,000877193.

Esercizio

C’è un’estrazione del lotto in cui vengono estratti casualmente 5 numeri su 90 palline senza reimmissione. Quanto vale la probabilità di vincere giocando 3,7 e 71? E 1,2,3?

Indipendentemente dalla terna che gioco, ho uguale probabilità di vincere, cioè 1/diviso il numero di terne che posso formare estraendo a caso senza reimmissione 3 palline da un’urna con 90 palline.

( 90 3) = (90*89*88) / (3*2*1) = 117480 coefficiente binomiale. Quindi qualunque terna ha probabilità 1/117480 = 0,0000085.

Dipendenza e indipendenza

Lanciamo due volte un dado: i due lanci sono indipendenti > il secondo lancio non dipende dal risultato del primo. La probabilità che esca un certo risultato sarà sempre 1/6. Estraendo 3 volte da un’urna senza reimmissione, il secondo risultato dipende dal primo. Se il primo studente non è A, la probabilità che esca alla seconda estrazione è maggiore. Se prima c’erano studenti era 1/20, ora che uno studente è stato estratto, restano 19 studenti tra cui scegliere e quindi A avrà probabilità 1/19. Ad ogni estrazione successiva cambia la probabilità.

Eventi indipendenti

Due eventi sono indipendenti se il verificarsi dell’uno non influenza la probabilità del verificarsi dell’altro. Se la probabilità di A non è influenzata dal realizzarsi di B allora P(A|B)=P(A), cioè P(A) rimane invariata.

Esempio

Immaginiamo 200 soci di un circolo privato, classificati sulla base del genere e dell’attitudine al fumo.

  • Nel circolo privato ci sono 200 persone.
  • Le donne sono 50, mentre gli uomini sono 150.
  • Donne che fumano 35/200.
  • Uomo o donna che fuma 90/200.
  • Probabilità di trovare una fumatrice scegliendo tra le donne 35/50 > donne fumatrici rispetto a tutte le donne fumatrici e non fumatrici.

La probabilità di un certo evento sapendo che si è verificato un altro evento è detta probabilità condizionata. Quando facciamo un esperimento ma ci viene data un’informazione ulteriore passo dallo spazio totale degli esiti ad uno spazio più ridotto.

| > questo simbolo significa che si è verificato un evento.

Es P(A|B) si legge probabilità di A condizionatamente a B. P(A|B) = P(A B)/P(B) > probabilità sia fumatori sia donna diviso probabilità donna. A e B non sono incompatibili perché A B sarebbe 0, ma qui c’è dello spazio in comune.

Gli eventi A e B si definiscono stocasticamente indipendenti se P(A|B) = P(A), sapere che si è verificato B non cambia la probabilità di A.

P(A B) = P(A)P(B).

Indipendenza tra eventi

  • A e B sono indipendenti se e solo se P(A|B)=P(A) e P(B|A)=P(B).
  • A e B sono indipendenti se e solo se P(A B)=P(A)*P(B).

Probabilità condizionata

  • P(A B)=P(A|B)P(B).
  • P(A B)=P(B|A)P(A).

Leggi di De Morgan

Il complementare dell’intersezione di A e B è l’unione tra il complementare di A e il complementare di B. Se lancio il dado due volte, i due eventi sono indipendenti. Per valutare l’indipendenza faccio il prodotto tra la probabilità del primo e del secondo.

Esempio

Qual è la probabilità che alla prima pescata esca B e alla seconda esca A se non c’è nessuna reimmissione? P(A|B) = 1/19*1/20 P(A|B)=P(B|A)P(B). La probabilità che all’inizio esca B è 1/20. La probabilità che esca A è 1/19. Tornando all’esempio dei fumatori.

  • P(fumatore) sapendo che è una donna è 35/50 = 0,70.
  • Cambiando però l’ordine > P(D) sapendo che è fumatore 35/90=0,39.
  • P(A|B) ≠ P(B|A) > attenzione!

Esercizio

Siano A e B due eventi con P(A)=0,6, P(B)=0,4 e P(A U B)=0,9:

  1. P(A B)=? P(A|B)=?
  2. A e B sono indipendenti?
  3. A e B sono incompatibili?

Risposta:

  1. c) P(A U B)= P(A)+P(B)-P(A B). Siccome nel caso fossero incompatibili l’intersezione sarebbe zero, a partire da questa formula calcolo l’intersezione. P(A B)=P(A)+P(B)-P(A U B). P(A B)=0,6+0,4-0,9= 0,1 > A e B non sono incompatibili perché P(A B)>0.
  2. b) sono indipendenti se P(A B)=P(A)*P(B). 0,1=0,6*0,4 > 0,1≠0,24 sono valori diversi quindi A e B non sono indipendenti.
  3. a) siccome non sono indipendenti posso trovare P(A|B). P(A|B)= P(A B)/P(B) = 0,1/0,4=0,25 > dato B, scende la possibilità di A di realizzarsi.

Se la probabilità del verificarsi di A non è influenzata dal verificarsi di B vorremmo che P(A|B)=P(A) cioè rimanga invariata P(A). Quelli che abbiamo definito sono i due schemi principali per la scelta di un campione casuale, come l’estrazione da un’urna.

  • Senza reimmissione > elementi distinti.
  • Con reimmissione > elementi anche ripetuti.

Se l’urna è grande i due metodi diventano equivalenti. Nel momento in cui la popolazione a cui faccio il sondaggio è grande, pescare con o senza reimmissione garantisce comunque un campione casuale. Il risultato è l’indipendenza dei risultati dalle estrazioni. Noi ci occuperemo di campioni casuali semplici che ci garantiscono l’indipendenza dei risultati.

Se n eventi sono indipendenti, allora la probabilità che si verifichino tutti contemporaneamente è uguale al prodotto delle probabilità.

P(A1 A2 … An) = P(A1)*P(A2)*…*P(An).

Indipendenza tra eventi

  • A e B sono indipendenti se e solo se P(A|B)=P(A) e P(B|A)=P(B).
  • Poiché si ha che, se A e B sono indipendenti P(A|B)=P(A B)/P(B)=P(A) allora P(A B)=P(A)*P(B).

Allora una definizione equivalente di indipendenza è A e B sono indipendenti se e solo se P(A B)=P(A)*P(B). Dalla nozione di probabilità condizionata, ossia P(A|B)=P(A B)/P(B), segue che presi due eventi A e B qualsiasi, valgono sempre due relazioni:

  • P(A B)=P(A|B)*P(B).
  • P(A B)=P(B|A)*P(A).

Due eventi A e B sono indipendenti se non sono incompatibili e se P(A B=P(A)*P(B). Se non sono indipendenti, si calcola la probabilità condizionata. P(A|B)=P(A B)/P(B). P(B|A)=P(A B)/P(A). P(A|B) e P(B|A) sono tra loro diverse.

Esempio

Lanciamo una moneta equilibrata 10 volte, questi lanci sono indipendenti.

  • P(10 volte testa)= (1/2)10 > prodotto di ½ ripetuto 10 volte.
  • P(10 volte croce)=(1/2)10.
  • P(TTCTCCCTCT)=( 1/2)10 > in questo caso considero l’ordine preciso.
  • P(che la sequenza contenga almeno una testa) > posso scriverla come probabilità di 1-nessuna testa. Il contrario di almeno una testa infatti è tutto croci. Poiché nessuna testa avrebbe probabilità (1/2)10, 1-nessuna testa è sempre (1/2)10.
  • P(che la sequenza contenga esattamente 4T e 6C) > io posso mettere 4T in qualsiasi posto possibile della sequenza. Quindi ho la possibilità di scegliere 4 posti in cui mettere le teste, sfrutto allora il coefficiente binomiale (10 4). Una qualsiasi sequenza di 10 lanci ha probabilità (1/2)10 ma quante sono le sequenze con 4T e 6C? Scelgo 4 posizioni distinte tra le 10 disponibili in cui mettere le 4T, per trovare il numero di modi in cui posso posizionare le 4T uso il coefficiente binomiale. Otterrò quindi (10 4) = 10*9*8*7/(4*3*2*1)=10*3*7=210 modi in cui posso mettere le 4T. (10 4)*0,510 moltiplico quindi il coefficiente binomiale per la probabilità di trovare una precisa sequenza.
Anteprima
Vedrai una selezione di 10 pagine su 61
Appunti di statistica (primo parziale) Pag. 1 Appunti di statistica (primo parziale) Pag. 2
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 6
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 11
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 16
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 21
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 26
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 31
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 36
Anteprima di 10 pagg. su 61.
Scarica il documento per vederlo tutto.
Appunti di statistica (primo parziale) Pag. 41
1 su 61
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher sarazanotta di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof Bodini Antonella.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community