Anteprima
Vedrai una selezione di 9 pagine su 36
Sperimentazione industriale (statistica di base) Pag. 1 Sperimentazione industriale (statistica di base) Pag. 2
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 6
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 11
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 16
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 21
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 26
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 31
Anteprima di 9 pagg. su 36.
Scarica il documento per vederlo tutto.
Sperimentazione industriale (statistica di base) Pag. 36
1 su 36
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Inferenza

Fare inferenza significa trarre conclusioni su una popolazione più ampia o su un fenomeno generale basandosi sui dati raccolti da un campione rappresentativo di quella popolazione.

Stima e stimatore

La media del campione ovvero la media delle misure, è la miglior stima del valore vero o del valore atteso della popolazione. Questo pensiero è ragionevole e intuitivo ma è possibile giustificarlo?

Diamo così due definizioni di base:

Stima: valutazione di un parametro caratteristico della popolazione a partire da una serie di misure.

Stimatore: variabile campionaria utilizzata per stimare un determinato parametro della popolazione.

Stima puntuale: valore assunto dallo stimatore in corrispondenza di un determinato campione.

Lo stimatore è una variabile casuale poiché dipende del campione selezionato e pertanto, la stima puntuale varierà a seconda di quest'ultimo. Infine lo stimatore sarà soggetto a incertezza, analizziamone le proprietà:

  1. Correttezza: il valore atteso dello stimatore corrisponde al parametro della popolazione da stimare (es: E(stimatore) = E(popolazione)).

La media è uno stimatore corretto del valore atteso della popolazione?

se lo è poiché E(X̄) = E(X) = μ.

Efficienza

la stima deve avere la minima varianza possibile.

Senza le dimostrazioni scriviamo

  • E(X) = E(mediana) = μ → entrambi corretti
  • V(X) = σ2/n, V(mediana) ≈ πσ2/2n

Osserviamo come la media campionaria sia più efficiente come stima del valore atteso della popolazione rispetto alla mediana. Equivalenza solo asintotica.

Consistenza

la precisione e affidabilità della stima devono crescere al crescere della numerosità del campione

limn→∞ Pr {|Tn(X) − θ| > ε} = 0     ∀ε>0

Dato un campione di "n" det. X, al crescere di "n" la probabilità che la differenza, in valore assoluto, tra stimatore e parametro risulti maggiore di un valore ε piccolo, tende a 0

Test statistici

I test statistici sono lo scopo di tutto ciò che abbiamo studiato prima e pertanto ora andremo ad analizzarli. Permettono di dedurre conclusioni generali a partire da informazioni campionarie utilizzando i "tool" studiati nei capitoli precedenti. Al fine di spiegare meglio l'argomento ci atterremo con due esempi:

Esempio 1:

Un'impresa edile ha acquistato una fornitura di cavi d'acciaio, con un carico di rottura dichiarato > 500 bar. Per verificare questa ipotesi, l'impresa seleziona un campione casuale di 50 cavi e ne misura i carichi di rottura.

Esempio 2:

Viene sviluppato un motore automobilistico per il quale è richiesta una biellina con un numero di ottano almeno pari a 98. Per verificare che la biellina selezionata ha le caratteristiche necessarie, si prelevano 30 campioni e ne si valuta la resistenza alla detonazione.

Al fine di trarre conclusioni si imbastisce un test statistico che, però, per essere fatto, necessita di ipotesi (H0 da Hypothesis) da verificare. Chiariamo subito che “accettare” un’ipotesi non per forza significa che questa sia vera poiché il tutto dipende dal campione casuale su quale si effettua il test.

es: "Accettazione" ≠ "Verità"

Formuliamo ora le ipotesi del problema 2 e consideriamo come ipotesi nulla (H0) che il numero di ottano sia 98 mentre, di contro, consideriamo come ipotesi alternativa (H1) l'opposta. I dati raccolti ci aiuteranno a determinare se accettare o rifiutare la prima, e quindi la seconda.

es:: H0 ⇒ μ = 98    H1 ⇒ μ ≠ 98

5. Decisione

z = 2,34 → z > zα

ES:

Quindi l'ipotesi nulla Ho viene rigettata con livello di significatività del 5%

Se invece facciamo lo stesso esempio di test statistico ma ad una coda, con la richiesta che il numero da ottenere debba essere di ALMENO pari a 38, avremo:

1. Formulazione delle ipotesi

Ho: μ ≥ 38 H1: μ < 38

ES:

2. Individuazione delle statistica coinvolta

TL.C.: x ~ N(μ, σ/√n ) e z = x - μ/σ/√n

ES:

3. Definizione livello di significatività di rigetto α

α = 0,05 con α = P(z < -zα) ovvero coda a sinistra

ES:

→ -z0,05 = 1,64 (da tabelle)

4. Raccolta dati campionari

ES:

x = 39 z = 39-38/(1,7/√25) = 2,34

5. Decisione

ES:

z = 2,34 → z = > -z0,05

L'ipotesi nulla non viene rigettata con livello di significatività del 5% ma:

se x = 37 allora z = ... = -2,34 e z < -zα dove -zα = -z0,05 e pertanto l'ipotesi nulla Ho verrebbe rigettata con livello di significatività del 5%

Descrizione

"Stabiliamo i gradi di libertà"; gdl = k - c dove

k = 4 (intervalli)

c = 3 perché abbiamo trovato tre vincoli "di studio statistico" ovvero media (x), varianza s, dev. standard sx e numero osservazioni n.

Quindi gdl = k - c = 4 - 3 = 1 e ora (tramite tabella) troviamo il x2div critico che ci fa da spartiacque nella nostra decisione. Una volta trovato vediamo se è maggiore, minore del x2 trovato e calcolato con i dati di partenza del problema:

x2div = x20,05,1 = 3,84

x2 = 4,8 < x20,05,1

A questo punto deduciamo: non c'è forte evidenza che l'ipotesi H0 sia da rigettare e pertanto possiamo assumere che la temperatura sta NORMALMENTE DISTRIBUITA.

Se invece di k = 4 intervalli avessi preso k' = 6 intervalli per le probabilità (dato che non è noto) bisogna ricondursi alla distribuzione NORMALE STANDARD al fine di trovare la probabilità d’esser per esso.

In qualsiasi caso anche se variano i gradi di libertà e di conseguenza il x2div critico riscontreremo lo stesso risultato del test statistico precedente, ovvero con k=4 intervalli.

Cosa succede se utilizzo la DIFFERENZA DELLE DISTRIBUZIONI anziché la DISTRIBUZIONE DIFFERENZA? Per fare ciò non dovremmo tenere conto di r(x) ma soltanto fare i calcoli partendo dalle altre due.

es:

μ1 - μ2 ≠ (x̄1 - x̄2) ± zα/2 * SD = 8,4 ± 4,36, 13,3 = 5,4 ± 26,07

Stesso valore centrale, ma l'accoppiamento induce la variabilità interna, dato che consideriamo le coppie di prove come eseguite in condizioni omogenee!

Ora facciamo la stessa cosa ma con il test statistico e separiamo:

  1. Formulazione ipotesi H0 e H1

H0: μ1 - μ2 ≤ 0   H1: μ1 - μ2 > 0

  1. Identificazione della statistica utilizzata

d ~ N(μd, σd2)   D = (x̄1 - x̄2) ~ N(μd, σd2),   z = D/SD

  1. Definizione livello significatività di rigetto α

α = Pr(z ≥ zα) = 0,05,   zα = 1,65  test a una coda in alto

  1. Raccolte dati campionari

z = 8,4 - 0/(3,7/√n) = 2,4

z = 24,3 - 202,9/13,7 = 0,63

  1. Decisione

Z > Zα    Z < Zα

"H0 viene rigettato"   "H0 non viene rigettato"

Non considerare le condizioni OMOGENEE per ogni prova aumenta la variabilità e modifica la decisione finale!

Dettagli
Publisher
A.A. 2023-2024
36 pagine
SSD Ingegneria industriale e dell'informazione ING-IND/26 Teoria dello sviluppo dei processi chimici

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ErMik99 di informazioni apprese con la frequenza delle lezioni di Sperimentazione industriale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Politecnico di Milano o del prof Stagni Alessandro.