Statistica
Statistica: raccolta sistematica e ordinata di dati. Deriva da status, che concerne l'insieme dei fenomeni che interessano una comunità. È infatti un'analisi quantitativa dei fenomeni collettivi che hanno attitudine a variare, con lo scopo di descriverli e di individuare leggi e modelli che possono spiegarli e prevederli. ("momento empirico di tutte le scienze")
Obiettivi della statistica
Permette di:
- Organizzare
- Riassumere
- Presentare
- Analizzare
- Interpretare
- Trarre delle conclusioni
Tipi di indagine
Un'indagine ad hoc effettuata sulle persone può essere esaustiva dal momento che riguarda tutta la popolazione o campionaria se si considera solamente un campione scelto adeguatamente.
La statistica inferenziale permette di riportare i dati del campione nella totalità, quando siamo nell'impossibilità di misurare tutta la popolazione ma abbiamo la necessità di farlo.
Quella descrittiva invece permette di raccogliere informazioni sulla popolazione, o su di un campione, e le sintetizza descrittivamente attraverso indici e grafici.
Concetti fondamentali
Costante: caratteristica che non cambia nelle diverse unità di osservazione.
Variabile: caratteristica che varia da un'unità di osservazione all'altra. È proprio sulle variabili che si basa l'indagine statistica.
Tipi di variabile
Qualitative
Di tipo non numerico (categoriche, alfanumeriche, mutabili). Si distinguono in:
- Nominali: quando non hanno nessun ordine di grandezza ma possono essere confrontate (es: tipo di diabete).
- Ordinali: quando è possibile individuare in maniera univoca un ordine (es: intensità del dolore).
Le nominali a loro volta possono essere divise in:
- Dicotomiche: se hanno due sole modalità (es: genere).
- Politomiche: (es: colore dei capelli).
Quantitative
Sono dati numerici che possono essere ordinati e su cui è possibile applicare operazioni matematiche.
- Discrete: quando sono "contabili", ossia le modalità assumono un numero finito di valori (es: numero di figli).
- Continue: se invece sono "misurabili", ossia le modalità assumono tutti i valori di un determinato intervallo (es: altezza).
Sintesi dei dati
Tabella di frequenza
Associa ad una variabile il numero di volte in cui questa si presenta (frequenza assoluta). È possibile trovare la frequenza relativa (percentuale) dividendo quella assoluta per la totalità.
Grafici
- Areogramma → Variabile qualitativa nominale
- α360°: = 100 : f%
- I valori percentuali evidenziano il peso di ciascuna modalità rispetto al totale.
- Diagramma a barre → Variabile qualitativa ordinale
- Istogramma → Variabile quantitativa continua
- Area= frequenza relativa
- Diagramma di dispersione → Misure di sintesi numerica variabile quantitativa discreta
- Si utilizzano per caratterizzare gli elementi con un solo indicatore.
Misure di centralità
Moda → la modalità della variabile con frequenza maggiore. È il valore delle osservazioni che si è verificato con maggior frequenza in una distribuzione di dati. È possibile applicarla a tutte le variabili e non necessita di calcoli.
Media aritmetica → somma di tutti i valori numerici della variabile rapportata al numero totale di osservazioni μ = (∑ xi) / n
Mediana → il valore dell'osservazione che occupa la posizione centrale di una distribuzione ordinata di dati. Si applica a variabili ordinali discrete e continue, non è influenzata da valori esterni e non si individua con dei calcoli.
Misure di variabilità
Scarto quadratico medio → Radice quadrata della media aritmetica del quadrato delle differenze di ciascun valore della variabile dalla media della distribuzione: indica di quanto i valori della variabile si discostano mediamente dalla media aritmetica.