Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
argomenti del corso:
- statistica descrittiva
- calcolo delle probabilità
- inferenza statistica
Introduzione:
oggetto della statistica è un complesso di dati (numeri e altri elementi) detti fenomeno raccolti e c.s. occupa della loro analisi ed esame.
tecnica di una tabulazione dati (ex. ospedali, settori, comuni, aziende...)
variabili categoriali → non assumere dei valori numerici, ma delle etichette o label di:
Si, No es. opinione dei nuovi pro-
impatti almeno nella produzione
es. sottoporre a medicina due diverse persone tra un certo paziente (nome e malattia)
- nuovo medicina
- placebo
La divisione del loro gruppo: è posta in modo casuale e all'insaputa del paziente, della persona dell'esperimento di ogni medico. Gli indicatori della bontà di una nuova medicina e i risultati ottenuti dall'azienda per ogni 2 gruppo. Ed indicazioni del pro-
vede la media e l’intervallo degli indicatori per il gruppo.
statistica descrittiva
→ quella parte della statistica che si adempie di effettuare un’analisi numerica di una collezione di dati (tabellina e rielabora il dati)
inferenza statistica
→ si occupa del trasferimento di dati da un campione principale di terri esaminati per un gruppo molto dell’insieme
ex. 1 < x2 → se è così, mai mi consento sono: con analisi effetto quel campionia o no?
La 0 inferenza statistica te da
la risposta
Ex. Lancio della moneta: 10V → 7 testa OK
50V → 47 testa ≠ 10
(probabilitá e rischio)
L’inferenza statistica ci aiuta a trarre delle conclusioni dal particolare.
IPOTESI: le previsioni che si elaborano non sono deterministiche ma adottano il loro valore come un certo rischio.
Per questo motivo, sinonimo alla statistica, si sviluppa anche il calcolo delle probabilità.
L’inferenza statistica ci aiuta a trarre delle conclusioni dal particolare.
Insieme completo = popolazione
Insieme parziale di oggetti della popolazione = campione
Il risultato non deterministico di oggetti della popolazione composto per un determinato scopo; con le relative generalizzazioni ai valori della popolazione (determinato “ricalcolati” inferenza statistica).
Statistica descrittiva
(non alle sole numeriche, ma categoriali)
campione → n = numero dei numeri reali (il numero di unità analoghe corrispondente ai soggetti numeri) [x1, x2, x3, … xn]
In presenza di più valori ripetuti ci uno xi* con fi* è lo frequenza media con cui xi* compare nel campione.
frequenza assoluto = frequenza con lo quale un valore compare nel campipo
(Σfreq = N)
media campionaria:
x̅n = x1 + x2 + ... xn + f1 x1* + f2 x2* + … + fn xn*--------------------------------n
Si genera e si misura elaborando una coppia di variabili (X, Y).
Si dice che c'è "correlazione positiva tra le X e le Y" se, al crescere dei valori assunti da una variabile, anche l'altra cresce; analogamente, si dice che c'è "correlazione negativa" se accade il contrario, cioè al crescere di una l'altra cala!
Concetto di "piccolo" int. complesso non risolto rispetto alla "media".
Se (xi - Xm)(yi - Ym) > 0
per quasi tutte i valori allora c'è correlazione positiva tra le X e le Y.
Se (xi - Xm)(yi - Ym) < 0
per quasi tutti i valori di Xi, c'è correlazione eita negativa.
Correlazione Comprario:
- Sxy = Σni=1 (xi - Xm)(yi - Ym) = Σml=1 xlyl - mXmYm
- se Sxy > 0 = correlazione positiva (è tanto più grande rispetto al margine la correlazione!)
- se Sxy < 0 = correlazione medioia (è tanto più grande un ridicolo tanto più e marcata la correlazione!)
coefficiente di correlazione comprensorio:
r = Sxy √(Sxx · Syy)
-1 < r < 1
dove Sxy è la correlazione comprensorio stipulata in pace dirra e Sxx; = Syy sono le rodiserie.
- Sxx = Σ2i=1 (xi - Xm)2 = Σmi=1 Xi2 - m Xm2
- Syy = Σ2i=1 (Yi - Ym)2 = Σml=1 Yl2 - m · Ym2
Se r è vicino a 1 ridoss in verso di correlazione lineare positiva, è vicino a -1 ridoss in un verso di correlazione lineare negativa.
c) P(15 ≤ X ≤ 20) = P(X ≤ 20) - P(X < 15) =
= 1 - P(X ≥ 20) - P(X ≤ 15) =
= 1 - 1/2 - 3/10
d) P(X ≤ 18) mediante P(13 < X ≤ 24) = 2/5
DEFINIZIONE - Funzione di ripartizione di una variabile aleatoria
Sia X una v.a.: P(X ∊ E), E ∊ F, si chiama funzione di ripartizione di X (f.r.) la seguente funzione:
Fx(x) ::= P(X < x) X ∊ R
(::= ⇔)
OSSERVAZIONE → 0 ≤ Fx ≤ 1
Proprietà della funzione di ripartizione:
- Fx è monotona non decrescente
X1 ≤ X2 ⇒ Fx(x1) ≤ Fx(x2)
P(X ≤ X1) ≤ P(X ≤ X) ≤ P(X ≤ X2)
(-∞, X1) (-∞, X2)
- Fx è funzione continua da destra
limh→0 Fx(x + h) = Fx(x) X ∊ R
- limX→-∞ Fx(x) = 0
- limX→+∞ Fx(x) = 1
p(X) > 0 ∀ x
∫ℝ p(u) du = 1
⇒ ∃ una v.a. X assolutamente continua la cui densitá
fX(x) = p(x) X∉N
Esercizio: sono v.a. assolutamente contin. per esempio misure di pesi (arche di Noé in continuare il discilo) oppure il Campo di vite dei dispositivi "cara monicio di prova".
α v.a fX(x) = { x² 1≤x≤2
alture = C X² T[1,2](x)
0 altruve
TA(x) = { 1 x∈A
0 x∈Ac
determinare il valore c affinch` fX(x) sia una densità di una variabile aleatoria assolutamente continua.
p(X) > 0
∫ℝ f(x) dx = 1
- C > 0
- 1 = ∫ℝ C X² T[1,2](x) dx = ∫12 C x² dx = C [x³/3]12 =
= C/3 (8-1) = 7/3 C = 1 ⇒ C = 3/7
p(x) = 3/7 X² T[1,2](x)
Dimostrazione 1
E(aX + b) = ∫R(ax + b)fX(x)dx =
= a∫RxfX(x)dx + b∫RfX(x)dx =
= a(E(X)) + b
Dimostrazione 2
Var(aX + b) = ∫R(ax + b - E(ax + b))2fX(x)dx =
= ∫R(ax + b - aE(X) - b)2fX(x)dx =
= a2∫R(x - E(X))2fX(x)dx = a2Var(X)
Nota: La formula è utile per il calcolo pratico delle soluzioni degli esercizi.
Dimostrazione 3
Var(X) = ∫R(x - E(X))2fX(x)dx =
= ∫Rx2fX(x) - 2∫RE(X) x fX(x)dx + E(X)2∫RfX(x)dx =
= E(X2) - 2E(X)E(X) + E(X)2 =
= E(X2) - E(X)2
Nota: La derivazione è utile per la risoluzione degli statistici doppi esercizi.
Mediana
d'una v.a X assolutamente continua
Definizione
Se X una v.a. assolutamente continua, la mediana di X è un numero m ∊ R tale che
P(X ≥ m) = P(X ≤ m) = 1/2.
⇔ FX(m) = 1/2
Nota: L'ottenere dell'enunciato della mediana è praticato dalla continuità della FX (è dallo sia non denso).