Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STAT. DESCRITTIVA
VARIABILE/CARATTERE X: fenomeno d'interesse
MODALITÀ: valori/livelli/categorie diversi che può assumere la variabile di interesse
UNITÀ STATISTICA: entità sperimentale osservabile che presenta la variabile x
POPOLAZIONE: è l'insieme completo delle unità statistiche esistenti nel quale si indaga varia la variabile x. Dimensione della popolazione: N
CAMPIONE: sottoinsieme di unità osservate nella popolazione. Definito con la dimensione del campione (m < N)
TIPO DI CAMPIONAMENTO: procedimento usato per selezionare un campione di dimensione m da una popolazione contenente N unità statistiche
PARAMETRO: caratteristica specifica della popolazione
STATISTICA: caratteristica specifica del campione
VARIABILI
- QUALITATIVE (categoriche)
- Si manifestano attraverso categorie non numeriche
- SCONNESSE
- ORDINALI
- QUANTITATIVE (numeriche)
- Rappresentate in forma numerica
- DISCRETE (numeri interi)
- CONTINUE (numeri reali)
DISTRIBUZIONE INDIVIDUALE DEI DATI
Data una variabile X osservata su un campione di m unità statistiche, la distribuzione individuale dei dati [a1, a2, a3 ... am] è insieme delle modalità osservate nell'ogni unità.
- Da cui si costruisce la distribuzione di frequenza (che sintetizza i dati)
- N: numero di modalità che può assumere X
- mi: FREQUENZA ASSOLUTA: numero di volte per cui X assume modalità xi
- gi = frequenza relativa
- Pui = frequenza percentuale = gui * 100
- Ni = frequenza cumulata (somma frequenze assolute)
- Fu = frequenza relativa cumulata
Per una variabile quantitativa continua:
Si può fare una distribuzione di frequenza per classi di valori (contigue senza interruzioni)
- wu = ampiezza della classe = max valore - min valore contenuto
Si fa una distribuzione di frequenza per classi anche per variabili discrete con un range di valori molto ampio.
GRAFICI:
- VAR. QUALITATIVE:
- grafici a barre (asse x serie di simboli)
- grafici a torta
- VAR. DISCRETA:
- istogrammi, grafici a barre con ramiere o imparature
- grafici ad aste
- funzione di ripartizione
- funzione a scalini
Ss = √1/(m-1) Σu (xiu - x̄ )2 mu
dipende dalle unità di misura
VARIANZA CAMPIONARIA
Scarto quadratico medio al quadrato
S2 = 1/(m-1) Σu (xiu - x̄ )2 mu
COEFFICIENTE DI VARIAZIONE CV = S/x̄
CAMPO DI VARIAZIONE xmax - xmin
SCARTO INTERQUARTILE Q3 - Q1
BOX-PLOT grafico a scatola
→ la posizione indica come è distribuito il minore e l'ultimo 25%
ANALISI CONGIUNTA DI DUE VARIABILI
Date due variabili x e y vogliamo effettuare un'analisi congiunta per valutare se esiste una relazione funzionale fra le due variabili con:
- indicatori sintetici → calcolando coeff. di correlazione
- modello di regressione → modello statistico a meno di un errore
Probabilità (Approccio classico)
Se tutti i casi sono equiprobabili, la probabilità di ogni evento A è:
P(A) = numero di casi favorevoli / numero di casi possibili
Probabilità condizionata
Esempio: A = {TT, TTC, TCI, CTT}
P(A) = 4/8 = 0,5
A|B = {TT, TTC, TCT}
P(A|B) = 3/4 = 0,75 aumenta la probabilità
Assiomi e proprietà
- 0 ≤ P(A) ≤ 1
- Evento certo → P(Ω) = 1
- P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
- P(A) = 1 − P(Ā)
- P(A ∩ B) = P(A|B)P(B) = P(B|A)P(A)
Se A ∩ B = Ø
P(A ∪ B) = P(A) + P(B)
Se A e B sono indipendenti:
- P(A ∩ B) = P(A) · P(B)
- P(A|B) = P(A) e P(B|A) = P(B)
Indipendenza (II)
Due eventi A e B sono indipendenti, A ⊥ B se e solo se P(A ∩ B) = P(A)P(B)
Vuol dire che il verificarsi di B non influisce sulla probabilità di A e viceversa.
Coppie di Variabili Aleatorie Continue
-
P((X, Y) ∈ C) = ∬(x,y) ∈ C g(x, y) dx dy
Con C = {x, y ∈ ℝ2: x ∈ A, y ∈ B}
-
P(X ∈ A , Y ∈ B) = ∬B A g(x, y) dx dy
-
F(a, b) = P(X ≤ a, Y ≤ b) = ∫-∞b ∫-∞a g(x, y) dx dy
-- da g di ripartizione a g di probabilità:
g(x, y) = (∂2F(x, y)) / (∂x ∂y)
Distribuzioni Condizionate
P(E | F) = P(E, F) / P(F)
-
nel caso di variabili discrete
PX|Y(x | y) = P(X, y) / P(y) P(y) > 0
-
variabili continue
gX|Y(x | y) = g(x, y) / g(y) g(y) > 0
Densità Condizionale
Valore Atteso
-
E(X) = Σi xi P(X = xi)
Discrete
-
E(X) = ∫-∞+∞ x g(x) dx
Continue
Se X = Y
= g(x)
VARIABILI CONTINUE
- Uniforme, normale o gaussiana, esponenziale, beta, gamma, chi2 di Student, F di Fischer
NORMALE O GAUSSIANA
Serve a trattare misure affette da errori.
- X∼N(μ,σ2)
- f(x|μ,σ2) = 1/√2πσ2 exp(−1/2σ2 (x−μ)2) funzione di densità di probabilità
- con μ∈ℝ, σ2∈ℝ+ (parametri), X∈ℝ
- E(X)=μ
- VAR(X)=σ2
→ media, mediana e moda coincidono
STANDARD
Variabile aleatoria di riferimento, con media=0 e varianza=1
- Z∼N(0,1)
- P(-2σ2