Statistica e metodologia della ricerca

Appunti di Statistica e metodologia della ricerca basati su appunti personali del publisher presi alle lezioni della prof.ssa Bozza dell’università degli Studi Istituto …

Esame Statistica e metodologia della ricerca

Facoltà Scienze e tecniche della comunicazione grafica e multimediale

Dal corso del Prof. Bozza Silvia

Università Istituto Universitario Salesiano Venezia - IUSVE

Publisher stc.iusve

A.A. 2015-2016

12 pagine

1 download

Appunto

Vota 4,5 / 5 (2)

Scarica

Estratto del documento

Ogni evento ha probabilità sempre maggiore o uguale a 0, quindi P(A)0

La probabilità dello spazio campionario è pari a 1 P(S)=1

La probabilità dell’unione di eventi incompatibili deve essere pari alla somma delle

probabilità dei due eventi. P(AB)=P(A)+P(B) se AB=0. L’unione di due eventi incompatibili

è la somma delle probabilità dei due eventi.

Dai postulati ne risulta che la probabilità è sempre compresa tra 0 e 1. Quindi 0P(A)1, poi

P(Ā)=1-P(A)

La misura delle probabilità: la probabilità del verificarsi di un evento A è data dal rapporto tra il

numero di casi favorevoli all’evento e il numero di casi possibili purché sia tutti ugualmente

possibili.

Due eventi sono indipendenti quando il verificarsi dell’uno non ha nessuna influenza sul verificarsi

dell’altro. Quindi P(AB)=P(A)xP(B)

LEZIONE 8

Variabili casuali

La variabile casuale indica una quantità il cui valore è determinato da un esperimento aleatorio.

È una funzione X che associa a ciascun risultato di un esperimento aleatorio un numero secondo

una determinata regola.

Le variabili casuali possono essere discrete o continue.

La variabie aleatoria discreta è tale perché definita su uno spazio discreto.

Distribuzione di probabilità: di una variabile casuale discreta X associa ad ogni valore possibile x i

la corrispondente probabilità P(X=x )= P(X )

i i

È la somma delle probabilità dei 3 eventi: si calcola rapportando il numero di probabilità di uno

stesso numero rispetto al totale delle possibilità.

Per rappresentare la distribuzione di probabilità si usa il diagramma a bastoncini.

Esperimento: lanciamo due dati

I possibili esiti dello spazio campionario sono:

1,1

1,2-2,1

1,3-3,1-2,2

1,4-4,1-2,3-3,2

1,5-5,1-3,3-2,4-4,2

1,6-6,1-2,5-5,2-3,4-4,3

le possibili coppie da osservare sono 36 (6 facce per un dado x 6 del secondo dado)

costruirsi una tabella dove nella prima riga si mettono i valori che la variabile assume

x 2 P(X) 1/36

x 3 P(x) 1/18

indipendenti quando il verificarsi dell’uno non influenza il verificarsi dell’altro

incompatibili quando il verificarsi dell’uno esclude per forza il verificarsi dell’altro

Media o valore atteso di una variabile aleatoria

bisogna fare una media dei possibili valori che la variabile piò assumere però pesando la

possibilità che avvenga.

Es: se x1=0 x2=1 x3=2 x4=3

1/8 3/8 3/8 1/8

La media è: 0x1/8+1x3/8+2x3/8+3x1/8

Quindi 0+3/8+3/4+3/8= 3/2

Distribuzione binomiale

urna con 10 palline: 6 bianche e 4 nere

esperimento: estrazione di 1 pallina

l’evento può essere bianco successo o nero insuccesso

la possibilità p si osservare un successo è 6/10 ovvero 3/5

la possibilità p si osservare un insuccesso è 4/10 ovvero 2/5

La variabile aleatoria di bernoulli dice che

x 1-x

P (X=x)= p (1-p)

Variabile aleatoria binomiale ci va a contare i successi che si verificano in un numero n di eventi

indipendenti

variabile di bernoulli assume valore 1 in caso di successo quindi nel nostro caso la possibilità che

esca 1 è 3/5

assume valore 0 in caso di insuccesso quindi la possibilità è 1-2/5

adesso se io prendo 5 palline voglio sapere quale possibilità ho di estrarne 2 bianche

qual è la possibilità che su 5 palline ne escano 2 bianche e 3 nere BBNNN.

Essendo eventi indipendenti, perché c’è il reinserimento, bisogna moltiplicarli tutti (se fosse

dipendenti invece?? )

le probabilità quindi sono pB x pB xpN x pN x pN

1 2 1 2 3

6/10x6/10x4/10x4/10x4/10

2 3

ovvero 6/10 x 4/10 2 3

quindi la probabilità è P=(X=2)= 5 6/10 x 4/10

in più, ho le combinazioni di 5 elementi in classe 2 (5) (2)

questa terminologia diventa 5!

2! X 3!

si legge ! fattoriale ovvero 5x4x3x2x1

2x1x3x2x1

risultato 10 2 3

quindi la probabilità è P=(X=2)= 10 x 6/10 x 4/10

LEZIONE 9

Adesso si introduce Variabile aleatoria binomiale si distribuisce come una binomiale con due valori

n e p

XBin(n,p). la variabile binomiale X conta il numero di successi che ottengo in n prove

indipendenti. x

P (X=x) la probabilità p elevata per il numero di successi per 1-p elevato al numero di insuccessi

n-x per le combinazioni di n elementi in classe x

p è la probabilità di successo

n è il numero di prove

su 70 lavatrici, qual’è la probabilità che 5 richiedano un intervento con probabilità 0,06

la variabile X assume valore 1 in caso di successo (intervento) e valore 0 in caso di insuccesso

(non intervento)

quindi p=0,06, 1-p=0,94

successo 5/70

insuccesso 65/70

5 65

P=(X=5)= 0,06 x 0,94 x 70 5

dbinom in R per trovare

dbinom (numero successo, totale prove, probabilità di successo)

choose (n,x) per calcolare la combinazione di n elementi in classe x

Il valore medio atteso di una variabile aleatoria binomiale XBin(n,p) è sempre E(X)=np

La varianza mi da un idea di quanto sono dispersi i valori della variabile. Var(X)=np(1-p)

100 nati vivi

49/100 femmine, successo p

51/100 maschi, insuccesso 1-p

- su 6 donne, possibilità che nascono 3 maschi e 3 femmine

n=6, p=51/100 3 3

P=(X=3)= 49/100 x 51/100 x 6 3

- su 6 donne, possibilità che i maschi siano meno delle femmine

sia ha quando nascono 6f oppure 5 f, oppure 4 f

P=(6fU5fU4f)

P=(6f)U P=(5f) U P=(4f) somma delle 3 probabilità

4 2

P=(X=4)= 49/100 x 51/100 x 6 4

5 1

P=(X=5)= 49/100 x 51/100 x 6 5

6 0

P=(X=6)= 49/100 x 51/100 x 6 6

sommo i 3 risultati

ES

70 lavatrici

p= 0,06

successo: richiesta garanzia p= 0,06

insuccesso: non richiesta di garanzia p= 0.94

probabilità che almeno 2 lavatrici non chiedano intervento in garanzia

P(ameno 2 insuccessi)

P (2 insuccessi) + P (3 insuccessi) + ….fino a 70

Procedimento troppo complicato quindi si fa il contrario

1- P (0 insuccessi) – P (1 insuccesso)

Attenzione: 1= spazio campionario

LEZIONE 10

Variabile aleatoria continua: assume un valore infinito sull’asse preso in considerazione

Esempio di variabile aleatoria continua: altezza delle persone, raggruppate per classi

La distribuzione di probabilità è rappresentata da un istogramma: a ciascun punto interno alla

singola classe è assegnato un valore costante, la densità.

Funzione di densità: è sempre non negativa

L’aere sottostante alla funzione di densità è sempre uguale a 1

Partendo dalla funzione di densità sono in grado di calcolarmi i valori della variabile aleatoria

continua

La proporzione tra probabilità e area vale per qualsiasi sia la suddivisione in classi

Si chiama funzione di densità della variabile continua X la funzione f(x) per cui l’area sottesa alla

funzione corrisponde ad un intervallo [a,b] è uguale alla probabilità che X assuma valore in

quell’intervallo.

Con le variabili aleatorie continue, la probabilità di calcolare un punto preciso è pari a 0 2

La variabile aleatoria continua più usata è la variabile continua normale indicata con XN(, )

Questi due parametri mi servono per disegnare la forma che avrà un asse centrale medio, +/- 3

volte la deviazione standard.

 è la media della variabile

 è la varianza

La normale standardizzata è una variabile normale con dei valori particolari perché ha valore

medio 0 e varianza pari a 1 quindi XN(0,1). È una variabile simmetrica

Quando troviamo una variabile normale standardizzata la probabilità si calcola con delle tavole

Z è la variabile

4 casi con XN(0,1)

Pr (z<di 1,3) cerco il numero 1,3 sulla tavole e guardo il valore rispettivo

Pr (z>di 1,3) trovo il valore e poi faccio 1-il valore

Pr (z<di -1,3) si sfrutta la simmetria quindi 1- valore

Pr (z>di -1,3) si sfrutta la simmetria quindi si trova il valore e basta

Quando non si hanno variabili normali standardizzate ma semplicemente normali, si può

ugualmente trasformare in normale standardizzata e usare la tabella. Come?

Operazione di standardizzazione: data la variabile normale XN(, ), prendiamo la variabile X,

sottraiamo la media e dividiamo per la deviazione standard  che è la radice della varianza 

Z=X-/

Es:

XN(0,4) con Pr (x< di 1,3)

Essendo una disuguaglianza, si può sottrarre da entrambe le parti  e dividere per 

Quindi Pr (X-/<1,3-/)

Pr (Z<1,3-0/1) quindi Z

Per le variabili binomiali

Trovo E(x) e var(x)

Che sono la mia m e s di una nuova variabile simile che chiamo Y

Pr di Y è la stessa Pr della binomiale….poi standardizzo e tutto è ok

LEZIONE 11

Statistica inferenziale:

come usare gli strumenti visti finora per fare inferenza ovvero estendere le ricerche all’intera

popolazione.

Elementi di inferenza statistica:

Popolazione di riferimento

 Campione casuale

 Raccolta di informazioni

 Tecnica inferenziale per giungere dal risultato parziale alla popolazione di riferimento.

 Giudizio sulla validità statistica della procedura utilizzata.



Campione casuale: si dice campione casuale di ampiezza n la variabile aleatoria multipla (X X

1, 2,

X ) le cui componenti X X X che sono associate alle varie osservazioni fatte x x x , sono

…. n 1, 2,…. n , 1, 2,…. n

indipendenti ed identicamente distribuite.

X maiuscola perché sono variabile aleatorie di bernoulli

In corrispondenza di ciascuna unità x abbiamo una variabile X che può avere risultato soddisfatto o

insoddisfatto (si o no).

Statistica: modo per riassumere tutte le informazioni che possediamo. La statistica è una qualsiasi

funzione del campione casuale indicata con T.

Es: prendendo un campione casuale (X X X ) in cui n è la dimensione del campione e X è il

1, 2,…. n

reddito.

Come faccio a capire quale sia il reddito medio della popolazione?

Se io prendessi le unità x e facessi la media tra tutte, otterrei una media che però non è il reddito

medio. Quella trovata è la media campionaria ma io voglio trovare la media di tutta la popolazione.

Quindi serve la statistica media campionaria

Statistica media campionaria: 2 2

sia (X X X ) un campione casuale, con media  e varianza  , XN(, ), la statistica media

1, 2,…. n 2

campionaria avrà una distribuzione pari a XN(, /n).

Quantile della variabile aleatoria continua Z 0.95

Pr (Z<

Anteprima

Vedrai una selezione di 4 pagine su 12

Statistica e metodologia della ricerca Pag. 1

Statistica e metodologia della ricerca Pag. 2

Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.

Scarica

Statistica e metodologia della ricerca Pag. 6

Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.

Scarica

Statistica e metodologia della ricerca Pag. 11

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher stc.iusve di informazioni apprese con la frequenza delle lezioni di Statistica e metodologia della ricerca e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Istituto Universitario Salesiano Venezia - IUSVE o del prof Bozza Silvia.

Appunti correlati