vuoi
o PayPal
tutte le volte che vuoi
STATISTICA 1
TERMINOLOGIA
- Popolazione totale dei casi in cui si manifesta il fenomeno oggetto di studio
- Campione parte scelta della totalità dei casi
- Unità statistica caso singolo - individuale
- Carattere concentrazione, oggetto che rileviamo. Il carattere si può manifestare secondo modalità diverse
- Qualitativo
- Sconnesso (con nessun legame di qualità)
- Ordinalabile (es. livello di istruzione)
- Quantitativo
- Discreto (quantità numerabile e ordinabile, scala unitaria) - Giorni
- Continuo (quantità possono assumere tutti i valori e sono soggette a unità di misura) - In altezza
- Qualitativo
- N = popolazione totale
- Ni = frequenza assoluta
- Ni+ = frequenza assoluta cumulata
- Fi = frequenza relativa = N
- Fi+ = frequenza relativa cumulata
RAPPRESENTAZIONI GRAFICHE: VARIABILI QUALITATIVE
- DIAGRAMMA A BARRE (rettangoli separati)
- DIAGRAMMA A TORTA
Per sapere il d° di ogni spicchio bisogna fare proporz. 360° ✕ Ni/Ntotale= α
RAPPRESENTAZIONI GRAFICHE: VARIABILI QUANTITATIVE
- Variabile discreta → Diagramma a bastoncini
- Variabile continua → Istogramma
Numero classi
- ai = ampiezza classe
ai = numero atomi di frequenza
In questo modo rendiamo omogeneo il confronto. La distribuzione è visualizzata dall'area.
INDICI DI POSIZIONE
Parametro che sintetizza l'ordine e/o grandezza della distribuzione fattoriale.
I indici di P:
- non analitici: moda, mediana e percentili
- analitici: medie potenziate
PROPRIETÀ GENERALI
degli I.P.: g(x)
- Principio di InternaLità di Cauchy ➔ min(x) ≤ g(x) ≤ max(x)
- Moltiplicativa ➔ g(k ⋅ x) = k ⋅ g(x)
- Monotonicità ➔ x > y ⇒ allora g(x) > g(y)
-
MODA
Il valore a cui è associata la frequenza maggiore
- La posso calcolare sia x variabili quantitative sia x variabili quantitative
- Nel caso di classi di intervallo, come procedo?
- Scelgo la classe che ha densità di frequenza maggiore (=classe modale)
- Come valore per convenzione ➔ scelgo il valore centrale
NB: Può succedere ➔ 2 MODI di fi modai ➔ CARATTERE BINOMIALE
-
MEDIANA
= valore assunto dalla variabile x che divide una popolazione in
2 parti uguali:
- la mediana occuore la posizione centrale nella distribuzione di freq. ordinata
- => si può calcolare solo x le variabili quantitative e qualitative ordinali
- Osservazioni con N pari ➔ N/2 e N/2 + 1 Indlruolo le 2 posizioni centrali
- Osservazioni con N dispari ➔ N/2 + 1 poszione centrale
- Tabella ai frequenze:
- ordino le modalità
- calcolo la posizione detla mediana
- individuo la "i" Ni > alla posizione della mediana ➔ trovo la mediana
- Classi di intervallo:
- calcolo le fi
- calcolo le Fi
- enter ce posizione sulla caluna Ni
ESEMPIO
- Xi - Xi-1 | Ni | fi | Fi
- 1-4 || 50 | 0,25 | 0,25
- 4-9 || 75 | 0,375 | 0,375
- 9-15 || 75 | 0,875 | 0,875
(15 Matt
➔ A = 15, l = 5 | = * : 0,75
x = 1,461 => m = 4,461 * 12,461 = ⇒ Mediana
VARIANZA
σ2 = VAR(x)
quadrato dello scarto quadratico medio
σ = scarto quadratico medio
Per confrontare la variabilità tra caratteri quantitativi anche espressi con unità di misura differenti uso il coefficiente di variazione c.v. = σ/μ
Situazioni estreme:
- Minima variabilità → Tutte le N unità statistiche assumono lo stesso valore
σ2 = 0
- x = {5,5,5,5,5}
- Massima variabilità → la variabilità aumenta se aumenta la distanza dei valori dalla media fissata
Si dimostra che
σ2max = (b - a)2(μ - a)
VARIANZA NORMALIZZATA
σ2N = σ2/σ2maxbassa variabilità alta variabilità
PROPRIETÀ OPERATORE VARIANZA
σ2x = VAR(x)
VAR(c) = 0
VAR(ax) = a2 VAR(x)
VAR(x + y) = VAR(x) + VAR(y)
[NB Media tot = 1a media (A) · Na + 2a media (B) · Nb]VAR(x) > 0 sempre è non monotona
Regressione Lineare
Regredire: cercare una relazione funzionale tra variabili con metodi statistici
- Studio della relazione di Y dipendente da X mediante una funzione
Funzione di regressione: è sperata che passi per se medie condizionate e rappresentata analiticamente da un polinomio completo di grado (n-1)
Studio:
- Scelta del modello della funzione interpolante
Grado Polinomio = 0y = c
Grado Polinomio = 1y = cx
Grado Polinomio = 1y = a + bx
- Scelta dei parametri in modo da rendere minima
- Valutazione della bontà del modello con k parametri
- Se il modello non è bene, lo cambio
Stima dei Parametri
I parametri sono scelti in modo da rendere minima la media dei quadrati degli scarti dei valori osservati y e quelli teorici y*
M[{y - y*}{y - y*}'] = min
y = a1 + bx
M[{y - a - bx}2] = min
{HL(y - a)2} = HL{y - y*}2a = y
Quando a,b e c trovo la miglior retta che minimizza l’errore quadratico
y = = My - b Mx
= COV(XY)σx2
Cosa è la Covarianza (Cov(XY))? È la media dei prodotti degli scarti di ogni variabile dalla propria media aritmetica
Cov(X,Y) = M(x - x)(y - y)= M(xy) - Mx My
! La covarianza può assumere valori + o – e fornisce informazioni sulla tipologia della relazione lineare esistente tra le variabili x e y