INTRODUZIONE ALLA STATISTICA DESCRITTIVA
La popolazione di riferimento è l'insieme di individui che si intende studiare. Gli elementi che la costituiscono si chiamano unità statistiche. La loro numerosità è il numero N che le quantifica.
- Le variabili statistiche sono le caratteristiche X rilevate sulle unità statistiche. Esse si dividono in:
- variabili quantitative: sono espresse da numeri e possono essere:
- discrete, se sono esprimibili con numeri interi o naturali,
- continue, se sono esprimibili con numeri reali.
- variabili qualitative: sono definite da aggettivi o espressioni e possono essere:
- nominali, se non esiste nessun ordinamento naturale,
- ordinali, se invece possono essere ordinate.
La modalità è il valore distinto assunto da una variabile.
La classe di rappresentare è un insieme di un certo numero di modalità della variabile che sono consecutivi nella lista ordinata e contraddistinta da un'ampiezza ai e la densità di delle classi legate dalle formule fi = ai·di (=area dell'istogramma).
La frequenza assoluta è il numero di unità statistiche che soddisfano la stessa variabile statistica.
La frequenza relativa è il rapporto tra le frequenze assolute e le numerosità.
Fii = Fi/N
La funzione di ripartizione empirica applicata ad un punto x è data dalle frequenze di tutti i dati minori di x divise per le numerosità.
Fc (x) = ∑Fi / N per xs ≤ x
La frequenza cumulata è data dalle somme delle frequenze delle modalità inferiori o uguali ad un certo valore delle variabile. Può essere relativa o assoluta.
- Un diagramma a bastoncino è tipico delle variabili discrete.
- Un istogramma permette di avere una ragione di insieme sulle distribuzioni di frequenze e si applica anche a classi con ai diverse.
INTRODUZIONE ALLA STATISTICA DESCRITTIVA
✭ La popolazione di riferimento è l'insieme di individui che ci interessa studiare. Gli elementi che la costituiscono si chiamano unità statistiche. La loro numerosità è il numero N che le quantifica.
✭ Le variabili statistiche sono le caratteristiche x rilevate sulle unità statistiche. Esse si dividono in:
- Variabili quantitative: sono espresse da numeri e possono essere:
- Discrete: si sono esprimibili con numeri interi o naturali.
- Continue: si sono esprimibili con numeri reali.
- Variabili qualitative: sono definite da aggettivi o espressioni e possono essere:
- Nominali: se non esiste nessun ordinamento naturale.
- Ordinali: se invece possono essere ordinate.
✭ La modalità è il valore distinto assunto da una variabile.
✭ La classe di rappresentare è un insieme di un certo numero di modalità della variabile che sono consecutivi nella lista ordinata ed è contraddistinta da un'ampiezza ai. La densità di delle classi è legata dalla formula fi = ai di (area dell'istogramma).
✭ La frequenza assoluta è il numero di unità statistiche che soddisfano la medesima modalità statistica.
✭ La frequenza relativa è il rapporto tra le frequenze assolute e le numerosità.
✭ La funzione di ripartizione empirica applicata ad un punto x è data dalle frequenze di tutti i dati minori di x divise per le numerosità.
✭ La frequenza cumulata è data dalla somma delle frequenze delle modalità inferiori o uguali ad un certo valore della variabile. Può essere relativa o assoluta.
- Un diagramma a bastoncini: tipico delle variabili discrete.
- Un istogramma: permette di avere una visione di insieme sulle distribuzioni di frequenze e si implica anche in classi diverse.
Indicatori di Posizione (o Centralità)
Per sintetizzare dati forniti in un solo parametro che ci indichi dove le distribuzioni sono posizionate, si usano degli indici di centralità:la moda viene al centro usata per le variabili qualitative nominate e le mode, di quelle ordinale, a cui aggiungere le mediane e per quelle quantitative anche le medie.
1. La media aritmetica
La media è il rapporto tra la somma di tutte le unità statistica per il numero stesso.
Se hai dati raggruppati in classi si usa l'approssimazione con m(x).Se tutte i dati sono uguali, allora anche la media è quel valore.
- Siano x1, x2,..., xm i dati ripetuti x1 = x2 = ... = xn = k
- Allora m(x) = ... = km = k
2. La media è sempre compresa tra il più piccolo e il più grande dei valori osservati
Dim: Voglio dire che m(x) >= min(xi)
Voglio dim. che m(x) <= max(xi)
Conclusione: min(xi) <= m(x) <= max(x