Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Statistica
- La statistica descrittiva ha come oggetto di studio la popolazione di cui vengono raccolti ed analizzati dei dati.
Segue un processo di sintesi dei dati, ossia l'ordine dei dati dai quali si ricavano delle informazioni utilizzando appositi strumenti di sintesi.
Nozioni di Base
- Popolazione (collettivo statistico): è l'insieme delle persone coinvolte nell'indagine, nonché l'insieme di riferimento per l'analisi.
- Unità statistiche: è chiamato così il singolo individuale componente il collettivo statistico.
- Carattere/variabile statistica: ogni aspetto che può essere oggetto di rilevazione/casuale fenomeno di interesse.
- Modalità del carattere: i modi con cui i caratteri si presentano nelle unità statistiche del collettivo.
Es. Carattere: stato civile - "celibe-nubile, sposato-vedovo..."
Classificazione delle Variabili Statistiche
X: U = X ⊆ ≤
- Qualitative - esprimono una qualità dell’unità statistica (modalità=valore verbale)
- Nominali - permettono di affermare solo che una modalità è uguale o diversa dalle altre.
- Ordinali - permettono di ordinare le modalità.
- Quantitative - esprimono una quantità misurabile
- Discrete - le modalità sono un numero finito o infinito numerabile.
- Continue - le modalità sono un intervallo numerico.
L'elenco di tutte le modalità possibili verificate al termine dell'indagine è un insieme finito.
Proprietà di Nχ(x)
- Nχ(x) ≥ 0 ∀ x ∈ S
- ∑ Nχ(x) = N
Frequenza relativa: viene indicata con Pχ(x) ed è l'applicazione che va dal supporto all'intervallo compreso da 0 ad 1
Proprietà di Pχ(x)
- 0 ≤ Pχ(x) ≤ 1 ∀ x ∈ S
- ∑ Pχ(x) = 1
Condizione di normalizzazione
P(X∈_ ) =
Perchè viene introdotto tale indicatore?
È utile per confrontare tra loro popolazioni aventi ampiezze differenti. Infatti in questo caso non è opportuno adottare la frequenza assoluta per indicare l'incidenza di una valore individuato; la frequenza relativa normalizza la frequenza assoluta, uso la rende indipendente dall'ampiezza della popolazione analizzata.
Operatore frequenza relativa P( ) prende il nome di PROPORZIONE (cioè mettendo un intervallo generico di valori della variabile) ed è dato dalla somma delle frequenze relative all'interno dell'intervallo.
Variabili Quantitative Continue Raggruppate in Classi
- Quando le modalità del carattere sono numeriche
Xi [xi - xi+1); Pi; i = 1, 2, ..., k
Le frequenze assolute e relative non sono sufficienti a rappresentare in modo sensato il fenomeno. In questo caso deve essere aggiunta la densità di frequenza relativa.
I singoli valori delle freq. relative non si possono allacciare alla classe, ma i dati aventi valori più numerosi hanno quantitativamente f.i. relative più alte.
Si calcola dunque l’ampiezza della classe ai = ci - ci-1
E si rapporta fX(xi ci, xi+1) all’ampiezza ottenendo fX(x) perché la densità di f.i. relativa.
La densità così calcolata è rappresentata con grafico ad istogramma (convenzione)
L’area dell’istogramma è b x R ci = Pi/ai
e corrisponde dunque alla fi.
Proprietà
- fX(x) ≥ 0
- Condizione di Normalizzazione
fX(x) =
- 0 x < xi
- Pi/ai xi ≤ x < xi+1
- 0 x ≥ xi
FX(x) = ∫ from -∞ to x (fX(t)) dt =
- ∑ from j=1 to i Pj x < xi
- Pi(x - xi) / xi+1 - xi xi ≤ x < xi+1
Il grafico è una retta spezzata che ha come coeff. angolare la densità di frequenza relativa
3. Media di una trasformazione di dati
T = g(x) E(T) = E(g(x))
Es. x = reddito in lire
- xi Pi Ti s⋅Pi
- 1 0,2 5 1
- 2 0,5 4,5 2,5
- 3 0,3 15 4,5
μ = 10,5
- xi Pi 5⋅xi Pi
- 1 0,2 5 1
- 2 0,5 4,5 2,5
- 3 0,3 4,5 9 μ = 10,5
Variabile disgreta
E(T) = Σi ti ⋅ Pi (L) = E(g(x)) = Σ g(xi) ⋅ P(xi)
Variabile continua
∫ t ⋅ f(t) dt = ∫ (x=c)
3a. Disuguaglianza di Jensen
T = g(x) con g(x) funzione convessa, cioè con tendenza un'unica verso l'altro
allora
E(g(x)) ≥ g(E(x))
se g(bx) è concava ε(g(x)) ≤ g(E(x))
se g(x) è lineare vale quanto segue
3b. Media di funzione costante
T=g(x) g(x)=a (variabile T è degeneri)
Σ[Ti] ⋅ Σ[g(xi)] media di una costante costante stessa
Dimostrazione
Σ[g(x)] = Σ g(x) Px(xi) - D =a Px(xi) = aΣ Px(xi) = a
per condizione di normalizzazione
Formule per il calcolo delle medie potenziate a seconda delle tipologie di variabili statistiche.
NB: Per le v.s. continue calcolo solo la media aritmetica.
- Dati grezzi (1/p) mg j= N ∑ xi N i=1
- v.s. discreta (1/p) mg j= K ∑ (ci) P(xi) i=1
- v.s. in classi (1/p) mg j= K ∑ (xi) Px i
* valore centrale delle classi
xc + xj+1 ───────────── 2
- v.s. continua
Formula della media aritmetica ∫ +∞-∞ x β(x) dx
Indici di posizione
- Mediana
- Medie
- Moda
- Quantili
Tutti gli indici di posizione possono essere calcolati per le variabili quantitative.
Per quanto concerne le v. qualitative, invece, il discorso cambia,
Le variabili qualitative nominali hanno la moda come unico indice.
Le variabili " ordinale" hanno anche una mediana, ed è il valore che, in una distribuzione ordinata lascia a destra ed a sinistra lo stesso numero di valori.
Statistica Bivariata
Si prendono in esame le distribuzioni doppie, visione congiunta di due caratteri nelle unità statistiche del collettivo.
Simboli:
Distribuzione Statistica Doppia: { (xi, yj) }, nx, y (xi, yj), i = 1..R, j = 1..C
Distribuzione Congiunta → in una tabella, a doppia entrata, pongo x sulle righe e y sulle colonne.
- x1, y1, x1, yr, ... yc, ni
Massima Dipendenza
Frequenza Congiunta Assoluta = Nxi, yj = Unità statistiche presentano congiuntamente la modalità xi e yj.
Proprietà:
- ∑μ=1R ∑j=1C Mxi, yj (xi, yr) = N
Distribuzione Marginale ni: conta il numero di volte in cui il presenta la modalità (xi), senza condizionale da l'esistenza dalle modalità avversi dall'altro variabile (y).
Proprietà:
- ∑j=1C Mxi, yj (xi, yr) = Mxi (significa sommo le Pi di xi e tj con la differenza che il la x tenuto ferma.)
Distribuzione Marginale Mj: conta le volte in cui il presenta la modalità (yj), a prescindere dalle modalità avversi dall'altra variabile (x).
Proprietà:
- ∑i=1R Mxi, yj (xi, yj) = (yj)