Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
CAPITOLO 1
RILEVAZIONI STATISTICHE E DISTRIBUZIONI DI FREQUENZA
LA STATISTICA STUDIA INSIEMI DI FENOMENI, DETTI COLLETTIVI (cioè che si ripetono su più unità), ALL'INTERNO DEI QUALI CERCA DI INDIVIDUARE DELLE REGOLARITÀ. DOPO AVER RACCOLTO E ANALIZZATO LE INFORMAZIONI TRAMITE STRUMENTI PRECISI LE INFORMAZIONI DI BASE SONO LE RILEVAZIONI STATISTICHE.
RILEVAZIONE STATISTICA
- Raccolta di informazioni su uno o più fenomeni attraverso strumenti statistici.
RILEVAZIONE DI POPOLAZIONI (TOTALE) (es. Il censimento)
Il fenomeno viene osservato sull’intera popolazione, intesa come insieme di elementi (persone - animali) che hanno in comune una o più caratteristiche prefissate.
Prima si deve definire:
- Unità di rilevazione - oggetti su cui vengono raccolte le informazioni.
- Caratteri - fenomeni dell’unità di rilevazione su cui si vuole raccogliere informazioni.
Rilevazioni campionarie (parziali)
Il fenomeno viene osservato solo su una parte delle unità statistiche.
Rilevazione semplice
Per ogni unità statistica si assegnano informazioni su un solo carattere (ad es "reddito").
Rilevazione multipla
Su più di un carattere simultaneamente.
Le rilevazioni statistiche si possono classificare anche in base al tipo di carattere che viene rilevato:
- Qualitativo -> Mutabile -> le cui modalità sono qualitate
- Quantitativo -> Variabile -> quantitative (cioè si manifestano con 1 numero)
Quindi le rilevazioni possono generare variabili e mutabili. Le variabili possono essere discrete o continue a seconda che il carattere possa assumere un num. infinito, finito di valori. Le mutabili sono sempre discrete.
Es.:
- X = num di figli = variabile discreta (perché una famiglia non può avere 1,5 figli)
- X = reddito = continua
mi
Carattere sulla forma di distribuzione assoluta
fi
Insieme frequenze relative
Partendo dalle frequenze assolute ottengo le fi, ma conoscendo solo le fi non posso arrivare alle Mi se non conosco N.
fi
Distribuz. con frequenze relative
Fi
Distribuz. con frequenze relative cumulate
Conoscendo le fi posso arrivare a Fi, e viceversa. Sono equivalenti:
- f2=F1
- f2=F2-F1
Esempio
0 < f < 1
Monotona non decrescente
La media non cambia
La variabile discreta perché tra 2 e 3 non c’è nulla
Come giustifichiamo allora Mx = 2,9?
Questo valore è rappresentativo della variabile, che è discreto cioè non posso avere un’osservazione 2,9 ma si può avere un indice 2,9si fa riferimento alle unità statistiche, all’osservazione che può assumere essere certi indici.
Medie con distribuzione di frequenza semplice per classi
Aprossimazione:
X0 + X1 = C1 valore centrale
Xk-1 + Xk - Ck
di base aver calcolato tutti i valori centrali
Mx = 1/N Σi=1k Ci Mi
Es (5) Proprietà
(DATI NON RAGGRUPPATI)
- X
- Y -> esprimiamo i redditi in migliaia di €
- 800 --> 0,8
- 1000 --> 1
- 1200 --> 1,2
- 3000 --> 3
Mx = 1000
My = 1
È una trasformaz lineare perchè:
a = 0
b = 1/1000
Y1 = 1/1000 • 800 = 0,8
Per la 5a proprietà : My = a + b • 1000 = 1/1000 • 1000 = 1
MEDIANA DISTRIBUZ DI FREQUENZA PER CLASSI
PER TROVARE LA MEDIANA CONSIDERIAMO UN'IPOTESI DI LINEARITÀ: LE DISTRIB SONO EQUIDISTRIBUITE CIOÈ SONO RAPPRESENTATE DA UNA RETTA
Prendiamo sull'asse y il valore 0.5, ricordando che Fi ≥ 0.5
Devo trovare sull'asse X quel punto che corrisponde all'ordinata pari a 0.5 (cioè Me)
Lo trovo utilizzando la geometria euclidea, considerando il triangolo ABC e il suo simile A'B'C'
- AB: Xi - Xi-1
- AB': Me - Xi-1
- BC: Fi - Fi-1
- B'C': 0.5 - Fi-1
AB : AB' = BC : B'C'
(Xi - Xi-1) : (Me - Xi-1) = (Fi - Fi-1) : (0.5 - Fi-1)
Me - Xi-1 = (Xi - Xi-1) . 0.5 - Fi-1 / Fi - Fi-1
Me = (Xi - Xi-1) . 0.5 - Fi-1 / Fi - Fi-1 + Xi-1
* Per definiz la Mediana è quel valore che divide a metà, cioè corrisponde a una Fi=0.5
2 casi:
H2 ≥ M non esistono valori eccezionalmente grandi H2 ≤ M almeno 1 osservaz. è più grande di H2
Es:
0.7, 0.8, 0.8, 1.1, 1.1, 1.3, 1.5, 2.5…N = 10 m = 0.7 Q1 = 0.8 Q2 = M = 1 Q3 = 1.3 M = 2.5 H1 = 0.8 - 1.5 (1.3 - 0.8) = 0.05 H2 = 2.05
Poichè b non dipende da i lo mettiamo in evidenza rispetto alla E:
CASO PARTICOLARE (TRASFORMAZ. LINEARE)
(supponiamo che sia strettam positiva, cioè la varianza anche se di poco c'è)
x: VAR. STATISTICA
DISTRIBUZ. TRASFORMATA Z:
x - Mx/σx . Zi = Xi - Mx/σx
Z - Mx/σx + 1/σx
PARTICOLARE TIPO DI TRASFORMAZ. LINEARE, DETTA STANDARDIZZAZIONE
Poichè My = a + b Mx → Mz = Mx/σx + 1/σx
σ2z - (1/σx)2 σ2x = 1
LA MEDIA DELLA VAR. STANDARDIZZATA E’ SEMPRE 0, LA VARIANZA È SEMPRE 1
La Curtosi (Kurtosi)
Indagando la pesantezza delle code (cosa a quanto sono elaborate, fluttuano dalle medie)
Una coda si dice pesante quando ha una distanza dall'asse x maggiore rispetto ad un'altra (le sue frequenze sono più alte, e ci sono più unità statistiche che hanno un certo carattere).
La curtosi a dice quanto è rappresentativa la media aritmetica, infatte quando la coda è pesante, ciò dice che ci sono molte unità statistiche che hanno valori molto diversi dalla media, di conseguenza la media rappresenta poco l'intera distribuzione.
Indice di curtosi:
Y2 = (1 / Nσx4) Σ (Xi - Mx)4 mi - 3.
1/N Σi=1k ((Xi - Mx) / σx)4 mi - 3 = 1/N Σi=1k zi4 - 3
1/N Σi=1k zi4 mi = 0
Y2
- < 0: distribuzione platicurtica = poche osservazioni lontano dalle medie
- = 0: " mesocurtica =
- > 0: " leptocurtica = curtosi elevata: molte osservazioni lontane delle medie
Limite inferiore di y2:
Y2 > -2
Y2 > 1/N Σ zi4 mi - 1
(anche in questo caso prendendo una distribuzione a parte ti rendi conto che M = 0 e σi = 1