La statistica descrittiva
La statistica descrittiva organizza e sintetizza le osservazioni statistiche e permette di avere una visione d'insieme sulle caratteristiche generali di una serie di dati.
Unità statistica, caratteri e modalità, popolazione
Distribuzioni di frequenza (tabelle, rappresentazioni grafiche)
Misure di posizione o di tendenza centrale
Misure di variabilità
Unità statistica e popolazione
L'unità statistica è l'oggetto dell'osservazione del fenomeno di interesse (es. l'individuo di una popolazione)
La popolazione è un insieme di unità che presentano alcune caratteristiche in comune
Caratteri e modalità
Caratteri: caratteristiche "misurate" sull'unità (es: pressione sanguigna, positività ad un test diagnostico)
Ciascun carattere è presente in un'unità con una determinata modalità (es. pressione sanguigna=130/75, positività del test diagnostico)
qualitative e quantitative Caratteri qualitativi: caratteri che descrivono una qualità dell'unità statistica (es. gruppo sanguigno, sesso, fumatore oppure no, stato di salute) - Caratteri qualitativi sconnessi (modalità non ordinabili): scale categoriche nominali - Caratteri qualitativi ordinati (modalità ordinabili): scale categoriche ordinali Caratteri quantitativi: caratteri che possono essere misurati (le modalità sono numeri) (es. pressione sanguigna, livello di colesterolo nel sangue, numero di sigarette fumate al giorno) - Scale intervallari, razionali o più semplicemente quantitative Caratteri - Variabili Il termine "variabile" richiama il fatto che si osservano dati il cui valore varia tra gli individui osservati. - Caratteri qualitativi sconnessi: variabili categoriche nominali - Caratteri qualitativi ordinali: variabili categoriche ordinali - Caratteri quantitativi: variabili quantitativecome il valore con la frequenza più alta). Mediana: valore centrale della distribuzione (definita come il valore che divide la distribuzione in due parti uguali). Media: valore medio della distribuzione (definita come la somma di tutti i valori divisa per il numero totale di valori). Quartili: valori che dividono la distribuzione in quattro parti uguali (definiti come il 25%, il 50% e il 75% dei valori). Misure di Variabilità Varianza: misura della dispersione dei valori intorno alla media (definita come la media dei quadrati delle differenze tra ogni valore e la media). Scarto quadratico medio: radice quadrata della varianza (definita come la radice quadrata della media dei quadrati delle differenze tra ogni valore e la media). Coefficiente di variazione: rapporto tra lo scarto quadratico medio e la media (definito come lo scarto quadratico medio diviso per la media). Campo di variazione: differenza tra il valore massimo e il valore minimo della distribuzione. Queste misure forniscono informazioni sulla distribuzione dei valori e sulla loro variabilità all'interno della popolazione.Per distribuzioni quantitative e qualitative:
Mediana: modalità che occupa il posto "centrale" nella distribuzione (definita per distribuzioni qualitative ordinate e quantitative)
Media: somma dei valori (uno ogni osservazione) diviso il numero delle osservazioni (media aritmetica) (definita solo per le distribuzioni quantitative)
Quartili: generalizzazione della mediana, i quartili dividono la distribuzione in quattro parti, ciascuna lo stesso numero di osservazioni
Moda: è la modalità associata alla frequenza più grande, ovvero la modalità più frequente.
Il calcolo della moda richiede solamente di raggruppare le unità rispetto alle modalità del carattere. È quindi possibile calcolare la moda per ogni tipo di carattere, anche per caratteri sconnessi.
Mediana: modalità associata all'unità di posizione centrale, ovvero la modalità dell'unità che ha il 50% delle osservazioni più
piccole e il 50% più grande. Il calcolo della mediana richiede l’ordinamento delle unità rispetto alle modalità del carattere. E’ quindi possibile calcolare la mediana per caratteri almeno ordinabili. Non è possibile calcolare la mediana per caratteri sconnessi.
Se N è dispari la posizione centrale è (N+1)/2. Se N è pari le posizioni centrali sono due N/2 e (N/2)+1 e quindi bisogna calcolare la media dei due valori.
La media è la somma delle modalità di tutte le unità diviso la numerosità. Il calcolo della media richiede la somma delle modalità. E’ quindi possibile calcolare la media per caratteri quantitativi. Non è possibile calcolare la media per i caratteri sconnessi e per i caratteri ordinabili.
distribuzione per unità distribuzione di frequenze
Quartili: Può essere utile talvolta suddividere la distribuzione in 4 distribuzioni parziali, ognuna avente la quarta parte della
La numerosità totale.
La modalità che fa da cardine fra la prima e la seconda distribuzione parziale si chiama primoquartile.
La modalità che fa da cardine fra la seconda e la terza distribuzione parziale si chiama secondoquartile (coincide con la mediana).
La modalità che fa da cardine fra la terza e la quarta distribuzione parziale si chiama terzo quartile.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.