vuoi
o PayPal
tutte le volte che vuoi
Argomenti:
- Regressione lineare
- Media aritmetica
- Varianza
- Deviazione standard
- Metodo dei minimi quadrati
- Coefficiente di correlazione
- Modelli riconducibili al caso lineare
- Esempi interpretazione di dati statistici
ELABORAZIONE STATISTICA DEI DATI SPERIMENTALI
REGRESSIONE LINEARE
È un metodo analitico che permette di trovare la migliore linea retta che interpola una serie di punti sperimentali.
Se x è la variabile indipendente, avremo y = f(x) quindi al variare di x varia y (dipendente).
Tramite un dato esperimento dobbiamo costruire una legge che valga per ogni x, cioè dobbiamo costruire la funzione.
In statistica, si deve trovare l'espressione analitica della funzione a partire dai grafici.
Maggiore è il numero degli esperimenti più punti troviamo, più preciso sarà il grafico.
x non varia continuamente ma a tacchi
y = mx + q f(x) = mx + q% co. constante
In generale una funzione lineare è una legge
A ⟶ R tale che:
- ∀ x1, x2 ∈ A ⟹ c1x1 + c2x2 ∈ A
- f(c1x1 + c2x2) = c1f(x1) + c2f(x2)
La funzione f(x) = mx + q con m e q fissati in R è una funzione lineare, infatti f: R ⟶ R.
Innette fissate 4 costanti x1, x2, c1, c2 e la loro combinazioni lineare cioè c1x1 + c2x2 è ancora un numero reale (∈R)
e consideriamo una retta passante per l’origine (q=0)
f(c1x1 + c2x2) = m(c1x1 + c2x2) + q = c1mx1 + c2mx2
f(c1x1) + c2f(x2)
L’eq. di una retta passante per l’origine è l’espressione di una funzione lineare.
NOTAZIONI
Siano assegnati n numeri reali dove n ∈ N fissato
Siano essi y1, y2, y3 ... yn (e da non confondere con le successioni)
Il simbolo Σk=1 si dice SOMMATORIA di y1, y2, y3 ... yn e significa y1 + y2 + y3 ... + yn
Se y1 = y2 = y3 allora Σk=1 yk = y1 + y2 + y3 ... ny1
n addendi
Brevemente possiamo scrivere:
Σk=1 yk = ny1
EQUAZIONE QUADRATI
Siano assegnati n punti del piano. Siano essi (x1, y1), (x2, y2), ..., (xn, yn). Problema: Trovare due numeri reali m e q, tali che eq della dir. eq y=mx+q passi il più vicino possibile agli n punti assegnati, cioè la distanza fra la retta e gli n punti assegnati sia minima.
Osserviamo che la distanza fra (xk, yk) e Pk è:
d=|mxk+q-yk|
Indicheremo con E(m,q)=∑k=1n(mxk+q-yk)2
Chiameremo E(m,q) l'errore totale che si commette sostituendo i punti (x1, y1), (x2, y2), ..., (xn, yn) con i punti sulla retta di eq. y=mx+q.
E(m,q) è una sola variabile dipendente da un parametro. Dapprima posso pensare E(m,q) come funzione di m al variare del parametro q, e successivamente posso pensare E(m,q) come funzione di q al variare del parametro reale m. La quantità E(m,q) rappresenta l'errore totale che si commette quando si sostituiscono i punti (x1, y1), (x2, y2), ..., (xn, yn) con i punti della retta di eq. y=mx+q.
Vogliamo trovare m e q in maniera tale E(m,q) = MINIMO ERRORE
... analogamente al caso della retta di regressione si ha.
...
x' = x + 1ym
y' = mx + q'
Osserviamo che la nuova retta di regressione y' = mx + q' passa sempre per il baricentro dei punti.
Allora le 2 rette di regressione si intersecano nel baricentro dei punti.
Ricordiamo che m = Cxy/Sx2 se ho m' = Cxy/Sy2.
Il numero reale
| m