i) Indichiamo con
[math]X_i[/math]
la variabile aleatoria che vale 1 se l'i-esima pen drive è priva di difetti, e vale 0 altrimenti. Allora le variabili aleatorie
[math]X_i[/math]
sono indipendenti e Bernoulliane di parametro p incognito. Se indichiamo con X la somma di tali variabili aleatorie, ovvero:
[math]X = X_1 + …. + X_n[/math]
allora X indica il numero di pen drive che sono senza difetti; X è una variabile aleatoria Binomiale di parametri n e p.
Il problema fornisce la media campionaria ottenuta dalle n pen drive esaminate.
Dalle formule note, possiamo costruire un intervallo di confidenza per la media della distribuzione:
[math] I = [\bar x_n - \frac{σ}{\sqrt(n)} ϕ_{1-α/2} , \bar x_n - \frac{σ}{\sqrt(n)} ϕ_{1-α/2} ] [/math]
dove
[math]σ[/math]
è la deviazione standard del campione (incognita),
[math]ϕ_{1-α/2}[/math]
è il quantile di ordine
[math]1-α/2[/math]
della distribuzione normale standard e
[math]\bar x_n[/math]
è appunto la media campionaria.
Analizziamo i dati che fornisce il problema:
[math]n = 500[/math]
[math]\bar x_n = 0,7[/math]
[math]1-α = 0,95[/math]
to
[math]1-α/2 = 0,975[/math]
Dalla tavola dei valori della distribuzione normale standard possiamo trovare che il quantile di ordine
[math]1-α/2[/math]
è 1,96.
Il valore di σ può essere stimato; considerando che in generale
[math]σ=\sqrt{p(1-p)}[/math]
per una variabile di Bernoulli, sappiamo che tale quantità è sicuramente minore di 0,5. Possiamo usare tale valore per approssimare la deviazione standard:
[math] I = [ 0,7 - \frac{0,5}{\sqrt(500)} \cdot 1,96 ; 0,7 + \frac{0,5}{\sqrt(500)} \cdot 1,96 ] = [/math]
[math] [ 0,7 - \frac{0,5}{10\sqrt(5)} \cdot 1,96 ; 0,7 + \frac{0,5}{10\sqrt(5)} \cdot 1,96 ] = [/math]
[math] [ 0,7 - 0,04383 ; 0,7 + 0,04383 ] = [0,6562 ; 0,7438][/math]
ii) Per risolvere il secondo punto possiamo utilizzare lapprossimazione normale; ricordiamo che la quantità
[math]\frac{S_n - nμ}{σ \cdot \sqrt(n)}[/math]
si comporta come una normale standard per n molto grande (con
[math]S_n[/math]
abbiamo indicato la somma campionaria). Quindi possiamo utilizzare questo risultato per approssimare la probabilità richiesta dal problema:
[math]P(|\bar X_n - q| >= 0,01) =[/math]
[math]P(|1/n \cdot S_n| >= 0,01) =[/math]
[math]P(|S_n| >= 0,01 \cdot n)[/math]
[math]P(|\frac{S_n - nq}{σ \cdot \sqrt(n)} | >= \frac{0,01 \cdot n}{σ \cdot \sqrt(n)})[/math]
Se chiamiamo con W una variabile aleatoria che si comporta come una normale standard otteniamo:
[math]P(|W| >= \frac{0,01 \cdot n}{σ \cdot \sqrt(n)})[/math]
Il problema fornisce tutti i dati necessari; sostituiamo i valori numerici:
[math]P(|W| >= \frac{0,01 \cdot n}{σ \cdot \sqrt(n)}) = [/math]
[math]P(|W| >= \frac{0,01 \cdot n}{0,3 \cdot \sqrt(n)} ) = [/math]
[math]P(|W| >= \frac{\sqrt(n)}{30} ) = [/math]
[math]1 - P(|W| >= \frac{\sqrt{n}}{30} ) = [/math]
[math]1 - P(-\sqrt{n}{30} >= W >= \sqrt{n}(30) ) = [/math]
[math] 1 - P( W >= \sqrt(n)(30) ) + P(W >= - \sqrt(n)(30) ) [/math]
Introduciamo la funzione Φ, ovvero la funzione di distribuzione della normale standard:
[math] 1 - P( W >= \sqrt(n)(30) ) + P(W >= - \sqrt(n)(30) ) = [/math]
[math]1 - Φ( \sqrt(n)(30) ) + Φ(- \sqrt(n)(30) ) = [/math]
[math] 2 (1 - Φ( \sqrt(n)(30) ) ) [/math]
Affinché tale quantità sia minore o uguale di 0,01 poniamo:
[math] 2 (1 - Φ( \sqrt(n)(30) ) ) >= 0,01[/math]
to
[math]1 - Φ( \sqrt(n)(30) ) >= 0,005 [/math]
[math] Φ( \sqrt(n)(30) ) >= 0,995 [/math]
Dalle tabelle della normale standard possiamo ricavare i valori numerici inversi di Φ; troviamo che 0,995 è circa Φ(2,34). Ciò significa che per rendere vera la disuguaglianza deve essere:
[math] \sqrt(n)(30) >= 2,34[/math]
Risolviamo la disequazione e troviamo il valore di n:
[math] \sqrt(n) >= 2,34*30 = 70,2[/math]
to
[math]n > 4928,04[/math]