Teoremi centrali del limite
I teoremi centrali del limite sono una famiglia di teoremi matematici riguardanti la convergenza di diverse distribuzioni alla gaussiana.
Vantaggi dei teoremi centrali del limite
- Molte distribuzioni con N elevato tendono alla gaussiana, quindi sono più facili da studiare.
- Una combinazione (la somma o la media) di varie variabili tende alla gaussiana e quindi non ha senso conoscere le distribuzioni delle singole variabili.
Per N elevato, sia la binomiale che la poissoniana tendono alla normale. La distribuzione di Cauchy-Lorentz non converge alla normale perché la sua varianza e il suo valore di aspettazione sono infiniti.
Condizioni per i teoremi centrali del limite
- "Debole" = convergono varianza e valore di aspettazione.
- "Forte" = convergono tutti i momenti.
Quanto deve essere elevato N?
Dipende dalla distribuzione. Per la binomiale, N ≈ 10-20, per la poissoniana N ≈ 5-20.
Consideriamo una variabile casuale che sia la somma di molte variabili casuali e indipendenti:
X = Σi=1N αiYi
Ogni variabile Yi seguirà una propria distribuzione con valore di aspettazione 2Yi e varianza σiY.
Distribuzione della variabile X
Per i teoremi centrali del limite, X sarà distribuita normalmente. La stessa cosa vale per gli errori random, che sono dovuti a molti fattori, ed è quindi impossibile descrivere le singole distribuzioni ma la loro somma (che genera gli errori di misura) è una distribuzione normale.
Enunciato del teorema centrale del limite
La somma (o la media) detta X di un numero sufficientemente elevato di variabili indipendenti Y è in prima approssimazione una gaussiana, indipendentemente dalle distribuzioni delle singole variabili.
Che significa elevato?
Più le distribuzioni delle singole variabili Yi sono asimmetriche, più N deve essere elevato per tendere alla gaussiana.
Quindi, dato che X tende alla normalità:
<X> = ∑i=1N ai <Yi>
σX2 = ∑i=1N ai2 σi2
Devono esistere sia il valore di aspettazione che la varianza associate alle singole variabili. Le singole variabili Yi possono avere anche distribuzioni diverse fra di loro. Anche se non conosciamo la distribuzione delle Y, sappiamo la distribuzione della media di X.
Considerazione importante
- La distribuzione di X è caratterizzata solo dal valore di aspettazione e dalla varianza perché nella somma si perdono i dettagli delle singole variabili.
- Se ogni variabile viene sommata con il proprio peso e non c'è una variabile dominante, la convergenza alla gaussiana è rallentata.
- La convergenza alla gaussiana non è uniforme. Si converge più rapidamente nel valore di aspettazione e più lentamente nelle code.
- Il teorema centrale del limite afferma quindi che la forma della distribuzione delle medie si approssima alla normale con l'aumentare della grandezza del campione (N).
Propagazione degli errori
Misure indirette: derivano da altre grandezze grazie a delle relazioni fondamentali. Le incertezze sulle singole misure si propagano sull'incertezza della funzione.
Consideriamo una sola variabile
f(x) di variabile x, della quale conosciamo un certo valore (per esempio la media x̄) e la sua incertezza. Vogliamo conoscere l'errore associato a f(x̄), quindi dobbiamo calcolare la deviazione standard di f(x).
Approssimiamo la nostra funzione con l'espansione in serie di Taylor:
f(x) = f(x0) + ∑n=1∞ 1/m! [dnf(x0)/dxn] (x-x0)n
Per approssimare f(x) ad una retta poniamo n=1 e trascuriamo gli altri termini.
f(x) = f(x̄) + df(x̄)/dx (x - x̄)
È un'approssimazione valida solo localmente se l'intervallo x̄ ± σx è piccolo e l'approssimazione è corretta.
Condizioni per utilizzare questo approccio
- Gli errori devono essere piccoli.
- La funzione deve essere derivabile.
- La derivata nel punto x0 deve esistere.
Che significa errori piccoli?
Il metodo di linearizzazione funziona se e solo se i termini successivi al primo sono trascurabili, ovvero:
<sup>d</sup>/<sub>dx</sub> [f(x̄)] / (x-x̄) >> 1/2 <sup>d<sup>2</sup></sup>/<sub>dx<sup>2</sup></sub> [f(x̄)] (x-x̄)2
⇒ 2 <sup>|<sup>d</sup>/<sub>dx</sub> [f(x̄)]|</sup> / <sup>d<sup>2</sup></sup>/<sub>dx<sup>2</sup></sub> [f(x̄)] >> (x-x̄)
La scala di "piccolezza" nell'errore
- Se la condizione viene rispettata, possiamo linearizzare la funzione.
- Quando viene rispettata? Errori (x-x̄) piccoli e rapporto tra f'(x) e f''(x) molto elevato (funzione "smooth" = liscia).
Funzione a una sola variabile
Varianza di f?
σ2 = 1/N Σi=1N [(f(xi) - f̄)2]
f̄ = 1/N Σi=1N f(xi) ≈ 1/N Σi=1N [f(x) + <sup>d</sup>/<sub>dx</sub> [f(x)] (xi-x̄) ] == 1/N Σ [f(x)] + 1/N Σ d/dx [f(x)] (xi-x̄) == N /N f(x) + 1/N <sup>d</sup>/<sub>dx</sub> [f(x)] Σ (xi-x)
La derivata è costante perché non dipende dai 1/N ∑ (xi - x̄) = 0, poiché la sommatoria degli scarti è zero ⇔ si considerano gli scarti degli xi rispetto al valore della media. = f(x̄)
Calcolo della varianza
σf2 ≈ 1/N ∑i=1N [ f(x) + dfdx (xi - x̄) - f(x̄) ]2 == 1/N ∑ [ dfdx (xi - x̄) ]2 = [ df(x̄)dx ] 2 1/N ∑ (xi - x̄)2 = [ df(x̄)dx ] 2 σx2
Quindi riassumiamo considerando l'approssimazione lineare: ≈ f(x̄)σf ≈ | df(x̄)dx | σx
Esempi
f(x) = Ax
f(x) = xn
σf = A σx
σf = n |xn-1| σx
Se f(x) fosse una funzione lineare, il risultato precedente non è un'approssimazione:
σf2 = f2 - (f̄)2
⇒ σf2 = (ax+b)2 - (ax+b)2 == a2 x̄2 + 2ab x̄ + b2 - a2 x̄2 - 2ab x̄ - b2 = a2 x̄2 - a2 x̄2 = a2 (x̄2 - x̄2) = a2 <sub>x</sub>2
σf = |a| <sub>x</sub> esattamente il risultato preciso ottenuto con l'approssimazione lineare.
Funzione a 2 variabili
f = f(x,y)
x̄ = (1/N) Σi=1N f(xi, yi) ~~ (1/N) Σ [f(x̄, ȳ) + (∂f(x̄)/∂x)(xi - x̄) + (∂f(ȳ)/∂y)(yi - ȳ)] = Espansione in serie di Taylor di f(xi, yi) troncata al 1o termine. Utilizzando le derivate parziali cioè deriviamo la funzione rispetto a una sola variabile considerando l'altra come una costante.
= (1/N) Σ f(x̄, ȳ) + (∂f(x̄)/∂x) (1/N) Σ(xi - x̄) + (∂f(ȳ)/∂y) (1/N) Σ(yi - ȳ)= N f(x̄, ȳ) ↓ =0 ↓ =0 ⇒ x̄ ~ f(x̄, ȳ) # Valore Medio
Calcolo della varianza
<sub>f</sub>2 = (1/N) Σ [f(xi, yi) - x̄]2 ~~ (1/N) Σ [f(x̄, ȳ) + (∂f(x̄)/∂x) (xi - x̄) + (∂f(ȳ)/∂y) (yi - ȳ) - f(x̄, ȳ)]2 = [d f(x)] 11 Σ (xi-x̄) [d f(y)] 11 Σ (xi-ȳ)2 + 2 [d f(x)] 11 Σ (xi-x̄) (yi-ȳ)
σf ∼ √<sup>[d f(x)]</sup>2 σX2 + <sup>[d f(y)]</sup>2 σy2 + 2 <sup>[d f(x)]</sup> <sup>[d f(y)]</sup> σxy #deviazione standard, chiamata anche formula della propagazione degli errori.
σxy = (1)/N &Sigma<sup>N</sup><sub>i=1</sub> (xi - x̄) (yi - ȳ) è definita covarianza:
- Se x e y sono indipendenti, σxy = 0
- Esprime il grado di correlazione di due variabili
La formula della propagazione degli errori può essere estesa a una funzione di n parametri e racchiude anche il caso di una sola variabile: d f(x) d2f(x) d f(y) diventa = 0
Cosa succede per variabili indipendenti?
σxy = 0 σf ∼ √<sup>[d f(x)]</sup>2 σx2 + <sup>[d f(y)]</sup>2 σy2
Somma in quadratura. Uao!! Shock!! Come detto prima, se la f(x,y) è lineare, il risultato non è un'approssimazione:
σf2 = f̅2 - (f̅)2
σf2 = (ax + by̅)2 - (ax̅ + by̅)2
= a2 (x2 - x̅2) + b2 (y2 - y̅2) + 2ab (x̅y̅ - x̅⋅y̅)
= a2σx2 + b2σy2 + 2ab σxy
La formula della propagazione degli errori in forma matriciale:
σf2 = [ [∂f(x)/∂x ∂f(y)/∂y] [σx2 σxy] ] [ ∂f(x)/∂x ]
- La i è la matrice Jacobiana (ovvero composta dalle derivate parziali)
- La iii è la matrice Jacobiana trasposta
- La ii è la matrice degli errori / di covarianza / di varianza - covarianza, contiene tutte le info sugli errori
Se x, y, z sono indipendenti, è diagonale:
f(x, y, z) ⇒ [ [σx2 σxy σxz] ]
Esempi in cui f sia a due variabili indipendenti
- Media aritmetica di N variabili
- x̄ = (1/N) ∑i=1N xi.
- σx2 = ∑i=1N (∂x/∂xi)2 σxi2 = ∑ (1/N)2 σxi2 = (N/N2) σx2 = σx2/N
- σx = σx/√N
- Somma f = x + y
- σf = √((∂f/∂x)2 σx2 + (∂f/∂y)2 σy2)
- ∂f/∂x = ∂(x+y)/∂x = ∂x/∂x + ∂y/∂x = 1 + 0 = 1
- ∂f/∂y = 1
- σf = √(σx2 + σy2)
- Differenza f = x - y
- ∂f/∂x = ∂(x-y)/∂x = ∂x/∂x - ∂y/∂x = 1
- ∂f/∂y = -1
- ∅f = √⁻̃(σx2+σy2) (COME PER LA SOMMA)
- Somma con i coefficienti f = a×x+b×y
- ∂f/∂x = a
- ∂f/∂y = b
- ∅f = √⁻̃(a2σx2 + b2σy2)
- Prodotto f = x×y
- ∂f/∂x = y
- ∂f/∂y = x
- ∅f = √⁻̃(y2σx2 + x2σy2)
- OPPURE PER UNA VERSIONE + COMODA: DIVIDIAMO ∅f2 PER x2y2: ∅f2/x2y2 = y2σx2/x2y2 + x2σy2/x2y2 = σx2/x2 + σy2/y2 ∅f/f = √⁻̃(σx2/x2 + σy2/y2)
- Prodotto tra 2 potenze \(f = x^a y^b\)
- \(\frac{\partial f}{\partial x} = \frac{\partial (x^a y^b)}{\partial x} = y^b \frac{\partial x^a}{\partial x} = a y^b x^{a-1}\)
- \(\frac{\partial f}{\partial y} = \frac{\partial (x^a y^b)}{\partial y} = x^a \frac{\partial y^b}{\partial y} = b x^a y^{b-1}\)
- Dividiamo \(\sigma_f^2\) per \(f^2\)
- \(\frac{\sigma_f}{f} = \sqrt{a^2 \frac{\sigma_x^2}{x^2} + b^2 \frac{\sigma_y^2}{y^2}}\)
- Quoziente \(f = x/y\)
- \(\frac{\partial f}{\partial x} = \frac{\partial (x/y)}{\partial x} = \frac{1}{y} \frac{\partial x}{\partial x} = \frac{1}{y}\)
- \(\frac{\partial f}{\partial y} = \frac{\partial (x/y)}{\partial y} = x \frac{\partial \frac{1}{y}}{\partial y} = - \frac{x}{y^2}\)
- \(\sigma_f^2 = \frac{1}{y^2} \sigma_x^2 + \frac{x^2}{y^4} \sigma_y^2\)
- Dividiamo la varianza per \(f^2\):
- \(\frac{y^2}{x^2} \sigma_f^2 = \frac{\sigma_x^2}{x^2} + \frac{\sigma_y^2}{y^2}\)
- \(\Rightarrow \frac{\sigma_f}{f} = \sqrt{\frac{\sigma_x^2}{x^2} + \frac{\sigma_y^2}{y^2}}\)
- Tale e quale al caso del prodotto.
Propagazione degli errori in astronomia
Misura della magnitudine
m1 - m0 = -2,5 log10 (f1⁄f0)
f0 e m0 sono riferite a una stella di riferimento. Misuriamo f1 e la sua incertezza δf1.
Qual è l'incertezza su m1?
dm1⁄df1 = d⁄df1 (-2,5 log10 (f1⁄f0) + m0) == -2.5 d(log10 (f1⁄f0))⁄df1 + dm0⁄df1 == -2,5 [d(log10(f1))⁄df1 - d(log10(f0))⁄df1] = -2,5 d log10 (f1)⁄df1 ⇒ - 2,5⁄ln(10) 1⁄f1 ≃ -1.086 1⁄f1 ⇒ σm = 1,086 σf⁄f
Formula errore della magnitudine rispetto al flusso e al suo errore
Dato che il numero dei conteggi è proporzionale al flusso, posso "sostituirlo" nella formula e inserisco come m0 = 25, ma per pura scelta arbitraria senza un significato fisico:
m = -2,5 log10 (N) + 25 con N = numero conteggi
-
Propagazione Guidata - Teoria
-
Esercizi propagazione degli errori con risultati, Fisica
-
Problemi svolti di fisica: propagazione degli errori, prodotto di grandezze
-
Problemi svolti di fisica: propagazione degli errori, somma e differenza