Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
La statistica descrittiva
La statistica descrittiva organizza e sintetizza le osservazioni statistiche e permette di avere una visione d'insieme sulle caratteristiche generali di una serie di dati.
Unità statistica, caratteri e modalità, popolazione
Distribuzioni di frequenza (tabelle, rappresentazioni grafiche)
Misure di posizione o di tendenza centrale
Misure di variabilità
Unità statistica e popolazione
L'unità statistica è l'oggetto dell'osservazione del fenomeno di interesse (es. l'individuo di una popolazione)
La popolazione è un insieme di unità che presentano alcune caratteristiche in comune
Caratteri e modalità
Caratteri: caratteristiche "misurate" sull'unità (es: pressione sanguigna, positività ad un test diagnostico)
Ciascun carattere è presente in un'unità con una determinata modalità (es. pressione sanguigna=130/75, positività del test diagnostico)
qualitative e quantitative Caratteri qualitativi: caratteri che descrivono una qualità dell'unità statistica (es. gruppo sanguigno, sesso, fumatore oppure no, stato di salute) - Caratteri qualitativi sconnessi (modalità non ordinabili): scale categoriche nominali - Caratteri qualitativi ordinati (modalità ordinabili): scale categoriche ordinali Caratteri quantitativi: caratteri che possono essere misurati (le modalità sono numeri) (es. pressione sanguigna, livello di colesterolo nel sangue, numero di sigarette fumate al giorno) - Scale intervallari, razionali o più semplicemente quantitative Caratteri - Variabili Il termine "variabile" richiama il fatto che si osservano dati il cui valore varia tra gli individui osservati. - Caratteri qualitativi sconnessi: variabili categoriche nominali - Caratteri qualitativi ordinali: variabili categoriche ordinali - Caratteri quantitativi: variabili quantitativecome il valore con la frequenza più alta). Mediana: valore centrale della distribuzione (definita come il valore che divide la distribuzione in due parti uguali). Media: valore medio della distribuzione (definita come la somma di tutti i valori divisa per il numero totale di valori). Quartili: valori che dividono la distribuzione in quattro parti uguali (definiti come il 25%, il 50% e il 75% dei valori). Misure di Variabilità Varianza: misura della dispersione dei valori intorno alla media (definita come la media dei quadrati delle differenze tra ogni valore e la media). Scarto quadratico medio: radice quadrata della varianza (definita come la radice quadrata della media dei quadrati delle differenze tra ogni valore e la media). Coefficiente di variazione: rapporto tra lo scarto quadratico medio e la media (definito come lo scarto quadratico medio diviso per la media). Campo di variazione: differenza tra il valore massimo e il valore minimo della distribuzione. Queste misure forniscono informazioni sulla distribuzione dei valori e sulla loro variabilità all'interno della popolazione.Per distribuzioni quantitative e qualitative:
Mediana: modalità che occupa il posto "centrale" nella distribuzione (definita per distribuzioni qualitative ordinate e quantitative)
Media: somma dei valori (uno ogni osservazione) diviso il numero delle osservazioni (media aritmetica) (definita solo per le distribuzioni quantitative)
Quartili: generalizzazione della mediana, i quartili dividono la distribuzione in quattro parti, ciascuna lo stesso numero di osservazioni
Moda: è la modalità associata alla frequenza più grande, ovvero la modalità più frequente.
Il calcolo della moda richiede solamente di raggruppare le unità rispetto alle modalità del carattere. È quindi possibile calcolare la moda per ogni tipo di carattere, anche per caratteri sconnessi.
Mediana: modalità associata all'unità di posizione centrale, ovvero la modalità dell'unità che ha il 50% delle osservazioni più
piccole e il 50% più grande. Il calcolo della mediana richiede l’ordinamento delle unità rispetto alle modalità del carattere. E’ quindi possibile calcolare la mediana per caratteri almeno ordinabili. Non è possibile calcolare la mediana per caratteri sconnessi.
Se N è dispari la posizione centrale è (N+1)/2. Se N è pari le posizioni centrali sono due N/2 e (N/2)+1 e quindi bisogna calcolare la media dei due valori.
La media è la somma delle modalità di tutte le unità diviso la numerosità. Il calcolo della media richiede la somma delle modalità. E’ quindi possibile calcolare la media per caratteri quantitativi. Non è possibile calcolare la media per i caratteri sconnessi e per i caratteri ordinabili.
distribuzione per unità distribuzione di frequenze
Quartili: Può essere utile talvolta suddividere la distribuzione in 4 distribuzioni parziali, ognuna avente la quarta parte della
La numerosità totale.
La modalità che fa da cardine fra la prima e la seconda distribuzione parziale si chiama primoquartile.
La modalità che fa da cardine fra la seconda e la terza distribuzione parziale si chiama secondoquartile (coincide con la mediana).
La modalità che fa da cardine fra la terza e la quarta distribuzione parziale si chiama terzo quartile.