Anteprima
Vedrai una selezione di 20 pagine su 108
Appunti Statistics for management Pag. 1 Appunti Statistics for management Pag. 2
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 6
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 11
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 16
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 21
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 26
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 31
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 36
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 41
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 46
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 51
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 56
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 61
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 66
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 71
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 76
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 81
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 86
Anteprima di 20 pagg. su 108.
Scarica il documento per vederlo tutto.
Appunti Statistics for management Pag. 91
1 su 108
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

PROBLEMI OPERATIVI DI VERIFICA D'IPOTESI

Illezione 02.03.2021 14-16 vedremo come fare la verifica d'ipotesi sempre sulla media, come la scorsa lezione, ma in questa lezione nel caso di piccoli campioni. Quando siamo in presenza di un piccolo campione per poter operativamente ottenere un risultato sensato e valido dal punto di vista metodologico dobbiamo valutare la ragionevolezza dell'assunzione evidenziata qui sotto:

Questa è l'assunzione che il fenomeno che stiamo studiando X possa essere rappresentato da una variabile aleatoria con forma di distribuzione normale. Dal punto di vista pratico questo tipo di assunzione corrisponde a chiederci se sia ragionevole pensare che le differenze tra i valori osservati di X abbiano natura accidentale come avviene nei fenomeni, le misurazioni ripetute, per i quali è stata introdotta 200 anni fa la variabile aleatoria normale. Se questa assunzione è verificata possiamo procedere perché già

conosciamo Z (Xmedio): se X ha distribuzione normale in cui la varianza è ignota ed è stimata con s quadro, la variabile aleatoria scostamento standardizzato di Z di X medio (che è definita come variabile aleatoria media diviso l'errore standard della media campionaria. Quindi questa campionaria meno il valore atteso µ0, variabile aleatoria, se è valida l'assunzione iniziale, ha una distribuzione T di Student con n-1 gradi di libertà. Possiamo quindi procedere a un test semplicemente usando la variabile aleatoria T di Student anziché la normale standardizzata. La logica di procedura della verifica è esattamente la stessa vista la scorsa lezione. a destra qui sopra. Vediamo l'esempio 73. Dobbiamo sempre partire scrivendo l'ipotesi nulla e l'ipotesi alternativa che, come sappiamo, non dipendono dai dati, ma dipendono dal problema che stiamo studiando. Qui il problema è di un processo produttivo.sottocontrollo che, come viene riportato nei dati, se tutto va bene deve essere uguale a 18mm. Qui si sta parlandodi diametro medio. L'ipotesi nulla sotto controllo è H0 : µ = 18.Il passo successivo è quello di scegliere un'alternativa, e la prendiamo bilaterale perché la macchina è sregolata sia quando produce pezzi mediamente troppo lunghi che mediamente troppo corti, poiché sono in entrambi i casi pezzi difettosi. Facciamo un test quindi a due code. Anche qui è riportato lo scostamento quadratico medio calcolato con la formula della statistica descrittiva calcolato su 10 pezzi campionari. È come se avessimo utilizzato la formula DEV.ST.P sui dati originari. Se avessimo i dati originari calcoleremmo direttamente la funzione DEV.ST.C, ma non avendo i dati originari correggiamo lo 0.8 mm riportato nel testo. 0.8 quindi viene corretto moltiplicando per la radice di n diviso n-1 quindi 10/9. Vediamo che l'effetto dellacorrezione è molto marcato, in un campione di soli 10 pezzi le due formule dannorisultati che hanno una certa differenza, mentre in un campione grande la differenza è trascurabile.Possiamo poi calcolare l'errore standard, s radice di n. L'errore standard rappresenta la misura dellavariabilità campionaria della variabile aleatoria X soprassegnato, quindi ci fornisce una misura stimata sullabase dei dati di quanto ci dobbiamo attendere sia lo scostamento quadratico medio della variabile aleatoriaX soprassegnato nell'ipotesi di un campionamento ripetuto, nell'ipotesi di estrarre tutti gli infiniti campioniall'infinito.ripetendo campionare, nel caso della produzione in serie,Per la produzione in serie è verosimile pensare che le differenze tra i valori osservati di X siano accidentali;qui stiamo misurando il diametro dei pezzi prodotti, quindi il diametro dovrebbe essere in media 18mm, main concreto alcuni pezzi avranno un diametro

leggermente superiore, altri un diametro leggermente inferiore, ma le differenze tra i singoli pezzi prodotti possono essere verosimilmente essere attribuite a una variabilità di tipo accidentale. Quindi se l'assunzione H0 : µ = 18 è verificata possiamo procedere e considerare la variabile aleatoria Z di X medio (che è definita come X soprassegnato meno il valore atteso, che se vale l'ipotesi nulla è 18, diviso l'errore standard). La variabile aleatoria Z di X medio in questo esempio ha una distribuzione T di Student con 9 gradi di libertà (10-1). Fatti questi ragionamenti possiamo trovare la zona di accettazione, la zona di rifiuto oppure calcolare il p-value. γ = 0.05. Qui prendiamo un livello di significatività del 5%, quindi Come facciamo a trovare i percentili che definiscono la zona di accettazione e quella di rifiuto? Dobbiamo trovare i due percentili che lasciano 74 all'interno della zona di accettazione una

probabilità del 95%. Per farlo usiamo le funzioni di Excel disponibili: INVT che fornisce il percentile dato il valore della funzione di ripartizione, oppure la funzione INV.T.2T, dove 2T sta a indicare le due code, che fornisce il percentile che corrisponde a una probabilità nelle code.

Il percentile che ci interessa per costruire la zona di accettazione e la zona di rifiuto si può trovare con entrambe le funzioni, essendo equivalenti.

A questo punto facciamo il calcolo numerico di Z di X medio, la realizzazione nello specifico campione della variabile aleatoria Z di X medio, quindi facciamo media campionaria (che è data nei dati, 18.3) meno il valore atteso 18 diviso l’errore standard. La realizzazione della variabile aleatoria Z di X medio in questo campione è 1.125, che cade nella zona di accettazione poiché è compreso in questo intervallo [-2.262; +2.262].

Quindi non possiamo rifiutare l’ipotesi nulla, questo non vuol dire che

siamo sicuri che l'ipotesi nulla sia vera ma non abbiamo prove sufficienti per dire che 18.3 non sia davvero compatibile con il processo in condizioni di controllo. Un valore della media campionaria uguale a 18.3mm è compatibile con un valore medio della produzione di 18mm, non c'è una evidenza contro questa ipotesi. La differenza tra 18 e 18.3 è una differenza che possiamo attribuire alla variabilità campionaria. In questo caso errore di prima specie vuol dire intervenire sul processo produttivo quando in realtà non c'è bisogno poiché è sotto controllo. È un errore grave che costa un sacco di soldi all'azienda, che implica il blocco della produzione. Quindi è un errore che siamo disposti a commettere, un certo rischio di commetterlo è inevitabile, ma vogliamo che la probabilità associata a questo errore sia molto bassa, comunque inferiore al 28/29% che è il valore calcolato su.questo campione. Vediamo ora il problema della verifica d'ipotesi sulla frequenza relativa, che non c'è sul libro: Ora non ci interessa più solo avere una stima della quota di mercato, ma sapere se è stato raggiunto un certo sotto la forma di un'ipotesi nulla, H0 : π = π0,target oppure no. Il target viene rappresentato che coinvolge π greco cioè la frequenza relativa della popolazione che non conosciamo, quindi adesso il parametro non è più mu ma pi greco, e l'ipotesi nulla dice che questo parametro è uguale a un valore prefissato, noto, che conosciamo prima di vedere i dati. π = π0, Ci possono essere problemi in cui scriviamo pi greco uguale a pi greco zero, e realmente intendiamo un'uguaglianza, ma in molti altri casi, e sicuramente quello del raggiungimento del target è uno di questi, noi scriviamo l'ipotesi nulla in quel modo perché siamo abituati a fare così e la

convenzione è quella, ma in realtà stiamo pensando a una disuguaglianza. La variabile aleatoria campionaria che ci interessa adesso non è più la media campionaria ma la frequenza relativa campionaria, se stiamo parlando di una proporzione di una 75 nell'universo la variabile aleatoria campionaria corrispondente sarà la frequenza relativa campionaria, P maiuscolo.

Che caratteristiche ha la variabile aleatoria frequenza relativa campionaria? Il valore atteso di tale variabile è 0. Se noi ragioniamo come se l'ipotesi nulla fosse vera il vero valore di è uguale al vero valore di pi greco, sempre come se l'ipotesi nulla fosse vera. pi greco è pi greco zero, e quindi noi ragioniamo.

Poi c'è una differenza rispetto alla media campionaria, la variabilità della media campionaria, la formula della varianza della media campionaria, è sigma quadro diviso n, che non dipende dalla media, da mu.

Invece, nella variabile aleatoria frequenza relativa campionaria, la variabilità dipende da π greco. La varianza della variabile aleatoria P è π greco per uno meno π greco diviso n. Quindi il valore di π entra anche nella variabilità della variabile aleatoria P, non solo nel suo valore atteso. Quindi siccome la variabilità di P dipende dal vero valore di π greco, e siccome noi ragioniamo sempre come se l'ipotesi nulla fosse vera in σ(P) possiamo mettere π greco zero. E poi nel caso di grandi campioni la distribuzione dello scostamento standardizzato di P è normale standardizzata perché abbiamo una versione del Teorema Centrale del Limite che vale anche per la variabile aleatoria P. Perché possiamo applicare il Teorema Centrale del Limite anche alla variabile aleatoria P? Noi possiamo trattare la frequenza relativa campionaria come una media campionaria perché le proprietà della frequenza relativa campionaria sono.

simili a quelle della mediase ci ricordiamo che l'universo di partenza nel caso della frequenza relativa è una variabile dicampionaria,Bernoulli. Quindi noi possiamo applicare alla frequenza relativa i risultati che abbiamo già ottenuto per lamedia, perlomeno quelli per grandi campioni, perché la frequenza relativa campionaria è effettivamente unamedia campionaria di variabile aleatoria di Bernoulli. Il TCL si basa solo sul fatto che il limite campionario siauna media, non è legato alla forma di distribuzione del fenomeno, quindi il TCL si può applicare. Quindi lavariabile aleatoria P da questo punto di vista in grandi campioni ha le stesse proprietà della variabile aleatoriaZ soprassegnato. Vediamo un esempio:Qui abbiamo un esempio in termini di campagna promozionale, il cui obiettivo è quello di ottenere una % dirisposte, acquisti in funzione della promozione, dell'8%. L'ipotesi nulla è definita dal

target che vogliamo quindi l'ipotesi nulla la scriviamo così: H0 : π = 0.08. Ma l'azienda è interessata a verificare che raggiungere la risposta alla campagna sia esattamente l'8%, qui
Dettagli
Publisher
A.A. 2020-2021
108 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher leovia88 di informazioni apprese con la frequenza delle lezioni di Statistics for Management e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Parma o del prof Cerioli Andrea.