Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
Statistica: ci sono tante definizioni, oltre a scienze di impostare due obiettivi: indagine in quei fatti e compie e maneie.
Unità statistica: elemento unità elementare di cui ci osservano i dati.
Popolazione obiettivo: insieme di tutte le unità statistiche che omogenee rispetto ad uno o più caratteristiche.
Da cui si riflettano alcune variabili (caratteri), caratteristiche delle unità. Selezione delle unità omogenee per alcuni aspetti ed alcune delle caratteristiche variabili tra unione e obiettivo.
Le variabili possono essere:
-
Quantitative - cioè possono essere messe in corrispondenza con dei numeri esprimibili in scala numerica; tipicamente vengono distinte in:
- Quantitative discrete: che si mettono in corrispondenza con i numeri interi. Sono tipicamente i conteggi (es. quanti figli si ha, quanti auto...)
- Quantitative continue: chiamate anche a scala di interessi lo sono variabili che si possono esprimere anche con numeri decimali (pes, altezze ecc.); sono fenomeni potenzialmente sempre raffinati.
-
Qualitative - non si possono mettere in corrispondenza con dei numeri (o se non per conversioni o etichette), si possono dividere in:
- Ordinali - si possono mettere in ordine, ma non posso fare le operazioni (es. titoli di studio)
- Nominali - non si possono mettere in ordine (es. il tipo di bevona)
Esistono due tipologie di rilevazioni statistiche:
- Dati sperimentali dove il ricercatore fa esper. di lavoro e ha possibilità di controllo
- Dati osservazionali non si ha la possibilità di controllo
Caratteristiche della popolazione obiettivo
Indagine o per campionamento (estrazione della popolazione) o censimento - si studia la popolazione, occorre la lista degli individui
Is data → propone allargando se la popolazione è quella che conosco, per es. sono uno che lavora in banca e voglio rilevare questa società non posso accedere a quest o di lista
Fasi dell'indagine
- Definire gli obiettivi, le unità e le variabili da rilevare e la scelta del periodo di riferimento (➩ importante, es., se ISTAT vuole calcolare la disoccupazione)
- Individuazione della lista e della popolazione
- Piano di campionamento parte da rilevazioni puramente casuali e si fanno anche davvero complicate, molto importante
- Raccolta dei dati fase più costosa, scelta della rilevazione, formulazione questionario (le quale deve essere chiaro, non ambiguo ed essere capito da tutti)
- Registrazione dei dati, il questionario si "forza" ad ogni passagg. poi registraz. di supporti vari controllo e correzione (per es. essere fatto in tante modalità)
- Elaborazione ed analisi dei dati
Esperimento - completo, accurato e conoscere produrre ed è un errore statistico, per es. sono dati elevati, tempi effetti di elaborazione
Campionamento - si assume un sottinsieme, basta così, basta così, indagini più mirate ed approfondite per es. è variabile esempio - modello rilevamento territorio, può essere stimato
Esercizio
- Variabile qualitativa nominale
- Esempio: colore occhi
Modalità: nero, marrone, azzurro, verde
M = 20
Xj Mj fj Pj N 4 4/20 20% M 7 7/20 35% A 6 6/20 30% V 3 3/20 15%M = 20
Se il collettivo è enorme alcune modalità possono essere raggruppate
Esempio occhi:
- Scuri (nero, marrone)
- Chiari (azzurro, verde)
M = 20, 1.00, 100
Esercizio
Xj mj fj Pj Fj 5-20 3 0,15 15% 15 20-40 6 0,30 30% 45 40-50 5 0,25 25% 70 50-70 3 0,15 15% 85 70-100 3 0,15 15% 100M = 20, 1.00, 100
Come si legge Fj?
- Un 65% del campione ha un'età che non supera i 40 anni
- Un 70% del campione ha un'età che non supera i 50 anni
5-10 → [5, 10)
5 è compreso, 10 è escluso
Propietà di Linearità
Se abbiamo un collettivo in cui è stata fatto una misura e se ognuna di queste dosi è trasformata/traslata/molticplicata/divisa per una costante, la trasformazione lineare si riflette sulle operazioni medie.
yi = a + bxi ȳ = a + bx̄ … ym
ȳ = 1/m Σ (a + bxi)
= 1/m Σ a + 1/m Σ bxi
= a + b * 1/m Σ xi media è
= a + bx̄
Esempio numerico
Tipociti del diagramma di stock
yi = 100 + xi
ȳ = 100 + x̄
Se alimento del 5%, come cambia la media
yi = 1,05 x̄ = x̄ + 0,05 x̄
La media aritmetica è un medio analitica , median e moda sono pesse anche, cioè non tendone conto del valore dei dati, ma soltanto dell'andamento relativo.
Formule
Xinf + 0,5
Fm-1 Fm
fm
frequenza cumulata della classe precedente
frequenza della classe della moda
quindi:
25 + 0,5 - 0,2 (50 - 25) = 46,23
0,55 - 0,2
La Moda
È una media, un indice di posizione che si può calcolare
fra qualsiasi tipo di dato.
Xmoda è la modalità cui compete frequenza maggiore.
A differenza della mediana e della media, la moda può
non essere unica.
es.
Xj Mj A 4 B 10 C 25 D 11modalità con freq. maggiore
Calcolo della moda in dati raccolti in classe:
Se i dati sono raccolti in classi di intervalli, la classe modale
è quella cui corrisponde densità maggiore.
Es di istogramma a 3 mode
V(x) = 1/m ∑ (x̄ - xj)2 mj
formula per dati ordinati in tabella
NOTA!!
(∑ xj)2 ≠ ∑ xj2
ESEMPIO
Calcoliamo la varianza di tutti gli individui che guadagnano 2000
- xj: 2
- mj: 30
x̄ = 2
V(x) = {2-2}2 + {2-2}2 + ... + {2-2}2
= 0
non c'è variabilità all'interno del collettivo, tutti guadagnano la stessa
- xj: 1
- mj: 15
- xj: 3
- mj: 15
x̄ = 2
V(x) = 1/30 [(1-2)2 + ... + (1-2)2 + (3-2)2 + ... + (3-2)2]
= 30 - 1/30
∑ xj2 mj - x̄2
- 150/30 - 22 = 5 - 4 = 1
∑ xj2 mj
- 15
- 135
- 150