Statistica e inflazione
Inflazione: processo di aumento del livello generale dei prezzi dell’insieme dei beni e servizi destinati al consumo delle famiglie. Generalmente si misura attraverso la costruzione di un indice dei prezzi al consumo.
Tipi di statistica
Statistica descrittiva: descrive fenomeni osservati su un insieme di unità (popolazione di riferimento) che costituisce la parte di universo che ci interessa. Gli elementi di questo insieme possono essere persone, cose, animali.
Statistica probabilistica: studio del meccanismo generatore delle realizzazioni campionarie.
Statistica inferenziale: consente, avvalendosi di metodi probabilistici, di trarre conclusioni generali sulla popolazione.
Fasi della ricerca statistica
- Astrazione: individuazione delle variabili osservabili.
- Individuazione della popolazione.
- Rilevazione: sperimentazioni, questionari.
- Registrazione dei dati: organizzazione dei dati, classificazione.
- Elaborazione dei dati: sintesi, interpretazione e inferenza.
I dati
Regole fondamentali:
- Verifica delle fonti.
- Verifica della qualità dei dati.
- Creazione della matrice dei dati.
Caratteri:
- Unità statistiche o sperimentali: (righe).
- Supporto fisico/materiale dell’indagine.
- Popolazione/universo.
- Campione.
- Caratteri (colonne).
Proprietà dell’unità sperimentale:
- Qualitativi.
- Quantitativi.
Modalità del carattere:
- Attributi = qualitative.
- Misure = quantitative.
Caratteri qualitativi
Modalità = attributi.
- Sconnessi (scala nominale): comune di residenza, tipo di industria, tipo di fabbricazione.
- Ordinati (scala ordinale): titolo di studio, grado di vendibilità, risultato esame.
Caratteri quantitativi
Modalità = misure.
- Discreti: insieme di modalità finito o numerabile, numeri interi.
- Continui: insieme di modalità infinito, numeri reali.
Statistica descrittiva univariata
Si occupa di tutti gli elementi descrittivi per l’analisi di un solo carattere estratto dalla matrice dei dati come:
- Distribuzioni di frequenza.
- Grafici.
- Indici di posizione.
- Indici di variabilità/mutabilità.
- Indici di forma.
Distribuzione di frequenza
Per organizzare i dati elementari in prospetti sintetici delle osservazioni è utile costruire una distribuzione o tabella utilizzando la nozione fondamentale di frequenza.
Simbologia:
- xi = modalità distinte.
- ni = frequenze (i=1,2…k = numero di modalità differenti).
- NB. n e k sono solitamente diversi tra loro.
Tipi di frequenza
Frequenza assoluta = numero di unità statistiche che presentano una data modalità (ni). ni >=0 la somma di ni è uguale a n.
Frequenza relativa = numero di unità statistiche sul totale che rappresentano una data modalità (fi). fi = ni/n e compreso tra 0 e 1, e la somma di tutte le fi è uguale a 1.
Frequenze percentuali: moltiplicandolo per 100 si ottengono le frequenze percentuali.
Frequenza cumulata = numero (Ni, se uso le frequenze assolute) o frazione (Fi, se uso le frequenze relative) di unità statistiche che presentano una data modalità minore o uguale alla i-ma. Ni = frequenze assolute cumulate, N1 = n1, Nk = n. Fi = frequenze relative cumulate, F1 = f1, Fk = 1.
Ha senso calcolare le frequenze cumulate solo per caratteri quantitativi o qualitativi ordinabili (sono quindi esclusi i caratteri qualitativi sconnessi).
Classi
Se il carattere presenta molte modalità distinte può essere conveniente accorpare le modalità in classi.
Gli intervalli:
- Devono essere disgiunti (no sovrapposizioni).
- Devono essere esaustivi (devono contenere il minimo ed il massimo osservati).
- Si intendono chiuse a destra.
NB se l’ampiezza delle classi non è costante non calcolo la frequenza ma la densità di frequenza. Densità frequenza (di) = frequenza (o relativa) rapportata all’ampiezza dell’intervallo di = ni/ai di = fi/ai.
Rappresentazioni grafiche
Ne vedremo di tre categorie diverse:
- Rappresentazioni di distribuzioni di frequenza.
- Grafici delle frequenze cumulate.
- Grafici per serie storiche.
Rappresentazioni di distribuzioni di frequenza
Asse ascisse = modalità.
Asse ordinate = frequenze (assolute, relative, densità).
Caratteri qualitativi sconnessi
Diagramma a torta: Per trovare l’angolo = 360 x (ni/n).
Caratteri qualitativi ordinati
Diagramma a rettangoli separati: In corrispondenza di ogni modalità si disegna un rettangolo che ha come altezza la frequenza (anche per i qualitativi sconnessi se i caratteri sono tanti).
Caratteri quantitativi discreti
Diagramma a bastoncini: Per ogni modalità si disegna un segmento con altezza la frequenza.
Caratteri quantitativi continui
Istogramma: Per ogni classe si disegna un rettangolo con base l’ampiezza della classe e con altezza la frequenza o densità.
Grafico delle frequenze cumulate
Grafico a gradini: Sull’asse delle ascisse le modalità ordinate, sull’asse delle ordinate o Ni o Fi. Nel caso in cui abbiamo un carattere quantitativo in classi la funzione gradini è approssimata ipotizzando che le unità statistiche siano equiparate dentro la classe.
Grafico per serie storiche o temporali
Serie dipendenti dal tempo. Grafico in coordinate cartesiane ortogonali in cui il tempo (variabile T) è sull’asse delle ascisse, mentre i valori della serie sono sull’asse delle ordinate.
Indici di posizione
Sono indici sintetici che evidenziano le caratteristiche essenziali della distribuzione del carattere. Consentono il confronto.
Definizione: un indice di posizione è una funzione di dati.
Proprietà generali
- Internalità: (condizione di Cauchy): l’indice di posizione deve essere compreso tra il minimo ed il massimo valore osservato (se non c’è questa proprietà non è un indice di posizione: è imprescindibile).
- Monotonicità: se una variabile statistica ha tutte le modalità minori o uguali a quelle di un’altra variabile allora la stessa relazione vale sugli indici di posizione.
- Moltiplicatività: (no per i qualitativi) se le modalità di una variabile sono tutte moltiplicate per una costante allora il valore dell’indice di posizione della nuova variabile si può ottenere moltiplicando la costante all’indice di posizione iniziale. (utile per il cambiamento di unità di misura)
Se valgono tutte le proprietà si ha un indice di posizione in senso stretto, se almeno una (non la prima) non vale si ha un indice di posizione in senso lato.
Indici
Non analitici: moda, percentuali di ordine p, mediana.
Analitici: medie potenziate.
Moda
Modalità / valore a cui è associata la massima frequenza. Si calcola in modo differente a seconda della tipologia del carattere.
Caratteri qualitativi/quantitativi discreti: Mo(X) = max ni, se il carattere è qualitativo la moda è un attributo, prendo il valore con il massimo ni.
Caratteri quantitativi continui: Mo(x) = max ni.
- Classi con la stessa ampiezza: prendo il valore centrale della classe con il maggiore ni.
- Con ampiezza diversa: prendo il valore centrale della classe con la massima densità di frequenza.
- La moda è media in senso lato poiché non vale la proprietà della monotonicità.
- La moda può non essere unica (distribuzione plurimodale, o senza moda).
Percentili e mediana
Modalità/valori che dividono la distribuzione di frequenza ordinata in più parti. Non si possono calcolare nei caratteri qualitativi sconnessi.
- Quartili: dividono in 4 parti la distribuzione.
- Decili: 10 parti.
Il percentile xp di ordine p (0 < p < 1) è quella modalità che è:
- Preceduta da almeno px100% dei casi.
- Superata da almeno (1-p)x100% dei casi.
Mediana
Modalità/valore che occupa la posizione centrale nella distribuzione ordinata dei dati:
- Preceduta da almeno 50% dei casi, superata da almeno 50% dei casi.
Per individuare la mediana è necessario calcolare la posizione centrale, che dipende dalla numerosità totale di n:
- N dispari = posizione centrale (n+1)/2, vado a vedere Ni corrispondente e la mediana è la x corrispondente.
- N pari = posizione centrale: n/2 ed n/2 +1, vado a vedere le Ni corrispondenti e prendo la x.
Quindi devo considerare la colonna delle frequenze cumulate e individuare la prima frequenza cumulata maggiore o uguale della posizione cercata.
Caratteri quantitativi continui raggruppati in classi
Si individua l’intervallo mediano.
Me(X) = h +(P-Ni-1) x ai/ni
- hi-1 = limite inferiore della classe mediana.
- Ni-1 = frequenza cumulata della classe precedente alla classe mediana.
- P = posizione mediana,
- n pari P = n/2 o n/2 +1.
- n dispari P = (n+1)/2.
- ai = ampiezza classe mediana.
- ni = frequenza assoluta classe mediana.
Se nel caso di n pari abbiamo due mediane per trovare quella totale: (Me1+Me2)/2. La mediana non è influenzata dai valori estremi della distribuzione.
Mediana calcolata con le frequenze relative
- Caratteri qualitativi o quantitativi discreti: la mediana è la modalità cui corrisponde la prima frequenza relativa commutata maggiore o uguale a 0.5.
- Caratteri quantitativi in classi: si individua l’intervallo mediano, cioè la classe cui corrisponde la prima frequenza relativa cumulata maggiore o uguale a 0.5, la mediana si calcola con la formula Me(x) = hi-1+(0.5-Fi-1) x ai/fi.
Proprietà di minimo della mediana: la mediana minimizza la somma dei valori assoluti degli scarti di ogni valore da un indice di posizione.
Medie potenziate
Solo per caratteri quantitativi.
- r=1 Media aritmetica.
- r=-1 Media armonica - xi=0 toglie il significato - Valori positivi e negativi potrebbero condurre il denominatore nullo.
- r=2 Media quadratica. Richiede la positività di xi.
- r che tende a 0 Media geometrica - Per r=0 la media non è definita.
Questa formula contiene una produttoria invece che una sommatoria, la radice non è quadrata, ma è n-esima (n=numero di dati) - le frequenze sono alla potenza e non moltiplicate alle modalità.
I calcoli sono troppo grandi, così conviene passare ai logaritmi:
- Calcolare il logaritmo della media geometrica come media aritmetica dei logaritmi.
- Ricavare la media geometrica dal precedente passo, calcolando la funzione inversa del logaritmo.
Teorema fondamentale delle medie potenziate
Monotona non decrescente = r<= s allora la media di r è minore o uguale della media di s. Ogni media potenziata è una media in senso aritmetico: armonica <= geometrica <= aritmetica <= quadratica. Se sono tutte uguali la variabile è degenere = tutti valori uguali.
Proprietà media aritmetica
Proprietà media aritmetica:
- I proprietà (o proprietà di minimo),
- Proprietà associativa.
Associa ad ogni X la sua media aritmetica.
- M(c)=M(costante)=c.
- M(cX)=c M(X).
- M(X+-Y)=M(X)+-M(Y) operatore lineare.
- M(X) è un cioè se Y=aX+b allora M(Y)=aM(X)+b.
I proprietà
La media aritmetica rende nulla la somma (media) degli scarti di ogni valore da un indice di posizione.
II proprietà: proprietà di minimo
La media aritmetica minimizza la somma (media) dei quadrati degli scarti di ogni valore da un indice di posizione.
Proprietà associativa della media aritmetica
Media totale = media delle medie parziali.
Variabilità e indici di forma
Per rendere completi gli indici di posizione bisogna affiancargli degli indicatori di variabilità. La variabilità è l’attitudine di un carattere ad assumere modalità differenti.
- Indici di mutabilità o eterogeneità: per i caratteri qualitativi.
- Indici di variabilità o dispersione: per i caratteri quantitativi.
Proprietà generali degli indici di variabilità e mutabilità
- Non negatività: V(X) >= 0. Un indice di variabilità è sempre maggiore o uguale a 0. È nulla se tutte le modalità della distribuzione sono uguali: ed è il caso della distribuzione degenere.
- Monotonicità: Un indice assume valori tanto più grandi quanto è maggiore la diversità tra le modalità della distribuzione.
- Invarianza per traslazione V(X+b) = v(X): Un indice di variabilità non cambia se a ciascun termine della distribuzione si aggiunge una quantità costante, positiva o negativa.
Indice di eterogeneità di Gini
Per i caratteri qualitativi indici normalizzato. Per confrontare tra di loro questi indici è necessario avere a disposizione gli In = I/Imax.
Situazioni estreme
- Minima mutabilità: esiste una sola modalità a cui corrisponde tutta la frequenza, tutte le altre hanno frequenza nulla E = 0.
- Massima mutabilità: tutte le modalità hanno la stessa frequenza f = 1/k E = 1-1/k.
Indice di Gini normalizzato 0 <= En <= 1.
La varianza e le sue proprietà
Per i caratteri quantitativi utilizzati...
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.