Anteprima
Vedrai una selezione di 3 pagine su 10
Lezioni, Analisi e ricerche di mercato Pag. 1 Lezioni, Analisi e ricerche di mercato Pag. 2
Anteprima di 3 pagg. su 10.
Scarica il documento per vederlo tutto.
Lezioni, Analisi e ricerche di mercato Pag. 6
1 su 10
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Distribuzione normale

Densità: Il termine densità è impiegato in quanto si riferisce al numero di individui per un’unità di area.

Funzione di densità: La funzione di densità è un’equazione utilizzata per calcolare le probabilità per

variabili casuali continue. Condizioni:

- L’area sottesa dal grafico dell’equazione, su tutti i possibili valori assunti dalla variabile casuale,

deve essere pari a 1;

- L’altezza del grafico deve essere ≥ 0 per tutti i possibili valorri assunti dalla variabile casuale.

Curva normale: Una variabile casuale continua è normalmente distribuita, se l’istogramma della

frequenza relativa della variabile casuale ha la forma della curva normale.

Proprietà:

- La curva normale è simmetrica rispetto alla media ʯ;

- Dato che M =Me=Moda, il punto più alto della curva corrisponde a x=ʯ;

1

- I punti di flesso sono situati a ʯ-σ e ʯ+σ;

- L’area sottesa della curva è pari a 1;

- L’area alla sinistra della media ʯ è uguale all’area di destra ed è pari a ½;

- All’aumentare del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma senza toccarlo. Al

decrescere del valore sull’asse x, il grafico si avvicina all’asse orizzontale, ma senza toccarlo.

- Intervalli tipici: il 68% dell’area sottesa è compresa tra x=ʯ-σ e x=ʯ+σ; il 95% dell’area sottesa è

compresa tra x=ʯ-2σ e x=ʯ+2σ; il 97,7% dell’area sottesa è compresa tra x=ʯ-3σ e x=ʯ+3σ.

Passaggio dalla curva normale alla standardizzata: Zi=(x - x

)/σ.

i

Proprietà:

- E’ simmetrica rispetto alla sua media ʯ=0 e ha σ=1;

- Dato che M =Me=Moda=0, il punto più alto della curva corrisponde a z=0;

1

- I punti di flesso sono situati a ʯ-σ=-1 e ʯ+σ=1;

- L’area sottesa della curva è pari a 1;

- L’area alla sinistra della media ʯ=0 è uguale all’area di destra ed è pari a ½;

- All’aumentare/ridursi del valore Z, il grafico approssima lo 0;

- Intervalli tipici: il 68% dell’area sottesa è compresa tra z=-1 e z=1; il 95% dell’area sottesa è

compresa tra z=-2 e z=2; il 97,7% dell’area sottesa è compresa tra z=-3 e z=3.

Processo statistico:

1. Identificare l’obbiettivo della ricerca;

2. Raccogliere i dati necessari per fornire una risposta alle domande;

3. Descrivere i dati;

4. Fare inferenza. Distribuzioni campionarie

Distribuzione campionaria: la distribuzione campionaria di una statistica è una distribuzione di probabilità

associata a tutti i possibili valori della statistica calcolati per un campione di ampiezza n.

Distribuzione della media campionaria : La distribuzione della media campionaria x è la distribuzione di

probabilità associata a tu i possibili valori della variabile casuale x calcola in corrispondenza di un

campione di ampiezza n estratto da una popolazione con media ʯ e devianza standard σ. Se una variabile

casuale X è distribuita normalmente, anche la distribuzione della media campionaria x è distribuita

normalmente. Dove: Media= ʯ = ʯ ; Devianza standard=errore standard della media= σ = σ/√n.

x x

Teorema del limite centrale: Siano x1,x2,..,xn v.c. indipendenti e identicamente distribuite con aspettativa

2

E(xi)>u, var(xi)= σ , dove i=1,..,n sono quantità finite. La somma delle v.c è Sn=x1+x2+..+xn. L’aspettativa di

2

Sn è: E(Sn)=E(x1+x2+..+xn)=E(x1)+E(x2)+..+E(xn)=nu. La var(Sn)=var(x1+x2+..+xn)=nσ . Data l’indipendenza

2

della v.c. X al crescere di n la funzione cumulata della v.c. Sn-nu/σ √n converge alla funzione di ripartizione

della v.c. standardizzata. Quindi P((Sn-nu/ σ√n)≤z)=F(z).

La distribuzione campionaria di x si approssima alla normale al crescere della numerosità campionaria

n≥30.

Frequenza relativa campionaria: p =x/n;

 la forma della distribuzione campionaria di p è approssima vamente normale a condizione che:

npq≥10,

 la media della distribuzione campionaria p è ʯ =p,

p

 la devianza standard dell distribuzione campionaria di p è σ =√pq/n,

p

 l’ipotesi d’indipendenza è verificata se n≤0,05N.

Probabilità della fr relativa campionaria: Z=p

-p/√(pq/n).

Intervalli di confidenza

Stima puntuale: è il valore di una statistica che fornisce il valore di un parametro.

Intervallo di confidenza: Un intervallo di confidenza per un parametro ignoto consiste in un intervallo di

numeri. Il livello di confidenza rappresenta la proporzione prevista di intervalli che contengono il

parametro oggetto di studio, indicato con (1-α)*100%.

Costruzione:

 σ e ʯ noti: ʯ =ʯ; σ σ/√n; [x +-Z * σ/√n].

x x= α/2

 2

σ e ʯ non noti: S=√ Σ(x -x ) /(n-1), t= x

-ʯ/(S/√n), [x

+-t * S/√n].

i α/2

Interpretazione: Un intervallo di confidenza (1-α)*100% indica che l’(1-α)*100% di tutti i campioni casuali

semplici di ampiezza n estratti da una popolazione il cui parametro è ignoto conterrà il parametro stesso.

Margine d’errore: misura quanto è accurata la stima, E=Z * σ/√n, dipende da:

α/2

 livello di confidenza (all’aumentare del livello di confidenza il margine d’errore aumenta;

 ampiezza campionaria (all’aumentare dell’ampiezza del campione casuale, il margine d’errore

diminuisce);

 deviazione standard della popolazione: quanto maggiore è la variabilità della popolazione tanto più

sarà ampio l’intervallo di confidenza ottenuto.

2

Ampiezza campionaria: n=[(Z * σ)/E]

α/2

Proprietà della t di Student:

 La distribuzione t differisce a seconda dei gradi di libertà;

 La distribuzione t è centrata e simmetrica rispetto a 0;

 L’area sotto la curva è 1;

 Le code della distribuzione t sono asintotiche rispetto all’asse delle x;

 L’area delle code della distribuzione t è più grande dell’area delle code della normale standard;

 All’aumentare della dimensione campionaria n, la curva di densità di t si avvicina alla curva di

densità della normale standard. Il valore di S si avvicina a σ per la legge dei grandi numeri.

Intervallo di confidenza per la frequenza relativa della popolazione

La stima puntuale della frequenza rela va di una popolazione è p

=x/n

na distribuzione campionaria di p è approsima vmente normale con media ʯ =p e deviazione standard

p

σ =√pq/n, con npq>=10 e ogni prova sia indipendente n<=0,05N.

p

Intervallo: [p

+-Z √p (1-p )/n]

α/2 2

Ampiezza campionaria: n=p (1-p

)*[ Z /E] , quando p

=0,5 si ottiene il massimo valore p (1-p )=0,25.

α/2 Verifica d’ipotesi

Sistema d’ipotesi:

Ipotesi nulla H0: rappresenta l’info che vogliamo testare, l’ipotesi nulla è l’ipotesi di nessun cambiamento

o nessun effetto.

Ipotesi alternativa H1: rapresenta l’info che vogliamo sostenere attraverso una prova campionaria.

Risultati verifica di ipotesi:

1.Rifiutare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe corretta.

2.Accettare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe corretta.

3.Rifiutare l’ipotesi nulla quando l’ipotesi nulla è vera. Questa decisione sarebbe sbagliata e l’errore che

commettiamo è definito errore di I tipo.

4.Accettare l’ipotesi nulla quando l’ipotesi alternativa è vera.Questa decisione sarebbe sbagliata e l’errore

che commettiamo è definito errore di II tipo.

Devianza Nota σ:

Condizioni:

 x è normale e devianza standard= σ/√n

 avere a disposizine un campione casuale semplice

 avere una numerosità campionaria n>=30

Statisticamente significativi: quando i risultati osservati sono diversi da quelli attesi nel caso in cui l’ipotesi

nulla sia vera, quindi possiamo rifiutare Ho.

Metodo classico:

Logica: Se la media campionaria, misurata in unità di deviazione standar, è molto inferiore alla media

indicata nell’ipotesi nulla, allora rifiutiamo l’ipotesi nulla

Condizioni

1. Il campione è ottenuto utilizzando un capionamento casuale semplice con σ noto.

2. Il campione non ha valori anomali e la popolazione da cui è stato estratto è distribuita come una

variabile casuale normale oppure la numerosità campionaria è sufficientemente elevata (n>=30).

Step:

1. Vado a determinare l’ipotesi nulla e l’ipotesi alternativa.

Bilaterale Unilaterale sinistro Unilaterale destro

H : ʯ=ʯ H :ʯ=ʯ H :ʯ=ʯ

0 0 0 0 0 0

H :ʯ≠ʯ H :ʯ<ʯ H :ʯ>ʯ

1 0 1 0 1 0

2. Vado a selezionare un livello di significatività α, basato sulla possibilità di commettere l’errore di I

tipo.

3. Soddisfatte le condizioni affermiamo che x è normale e devianza standard= σ/√n, quindi z = x

-ʯ /

0 0

σ/√n rappresenta la distanza dalla media campionaria dalla media assunta ʯ , espressa in numero

0

di deviazioni standard. Questo valore è chiamato statistica test.

4. Il livello di significatività è utilizzato per determinare il valore critico , che rappresenta il numero

massimo di deviazioni standard. Inoltre, possiamo osservera la regione critica (o regione di rifiuto)

che rappresenta l’insieme di valori per cui rifiutiamo l’ipotesi nulla.

5. Confronto il valore critico con la statistica test (regola di decisione).

Bilaterale Unilaterale sinistro Unilaterale destro

Z <-Z o Z >Z Z <-Z Z >Z

0 α/2 0 α/2 0 α 0 α

Rifiutiamo l’ipotesi nulla

6. Formulo la conclusione

Metodo P-value

Il p-value è la probabilità di osservere una statistica test con un valore pari (o più estremo) a quello

osservato sotto l’assunzione che l’ipotesi nulla sia vera. In altre parole, rappresenta la verosomiglianza o la

probabilità di estrarre un campione la cui media campionaria corrisponda a quella ottenuta nell’analisi, nel

caso di ipotesi nulla vera.

Logica: Assumendo che l’ipotesi H0 sia vera, se la probabilità di avere una media campionaria pari o anche

più esterna a quella che abbiamo ottenuto è bassa, allora rifiutiamo l’ipotesi nulla.

Condizioni

1. Il campione è ottenuto

Dettagli
Publisher
A.A. 2014-2015
10 pagine
3 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher menguz di informazioni apprese con la frequenza delle lezioni di Analisi e ricerche di mercato e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Libera Università di Lingue e Comunicazione (IULM) o del prof Sfogliarini Bruno Giuseppe.