vuoi
o PayPal
tutte le volte che vuoi
STATISTICA
La statistica si occupa dei dati e della loro analisi rendendo visibile natura e significato delle informazioni ad essi associati.
Statistica descrittiva — metodi e tecniche per l’esplorazione e la sintesi dei dati
Inferenza statistica — metodi e principi per inferire le caratteristiche generali di un fenomeno osservando una parte o una descrizione dello stesso
In statistica si hanno tre “oggetti” importanti:
- Unità statistica — l’oggetto dell'osservazione
- Variabile — carattere dell'unità statistica che può venire assumendo almeno due espressioni diverse
- Modalità — espressione unica di una variabile in un'unità
MATRICE dei DATI
1 A A’ 2 B B’ 3 C C’RIGHE = UNITÀ STATISTICHE
COLONNE = VARIABILI
CELLE = MODALITÀ
VARIABILI
- Qualitative — modalità in forma di nomi aggettivi ecc.
- Nominali — non ordinabile (gruppo sanguigno)
- Ordinali — ordinabile (livello di istruzione)
- Quantitative — modalità espresse come numeri
- Discrete — valori finiti rappresentati con numeri interi (numero di figli)
- Continue — valori infiniti risultati di una misurazione (altezza)
DISTRIBUZIONI
Rappresentano il modo in cui le modalità si distribuiscono in ogni unità.
Distribuzione per unità
modalità osservate in ciascuna unità
STUDENTE TITOLO DI STUDIO A Media superiore B Media superiore C Laurea triennale D Laurea magistraleDistribuzione di frequenze
insieme delle coppie (modalità; frequenze)
fj Frequenza assoluta
numero di osservazioni di una modalità xj della variabile X
Le coppie (xj, fj) si possono rappresentare come distribuzione di frequenze assolute
MODALITÀ X FREQUENZE ASSOLUTE X1 f1 ... ... Xj fj ... ... Xn fnTOTALE N = ∑j=1n fj
Pj Frequenza relativa
frazione di unità che presentano la modalità xj della variabile X
Pj = fj / NSe moltiplicato per 100 si ottengono le frequenze percentuali
Istogramma
Costruito con rettangoli che hanno come base l'ampiezza delle classi, e altezza la densità di frequenza di, distinguendosi per l'area che rappresenta la frequenza relativa pi
- Se Δi delle classi è uguale, si costruisce un istogramma a basi uguali
- Se le pi sono simili o Δi sono variabili si disegnano rettangoli con aree uguali ma basi e altezze diverse
Grafico scatola e baffi (o box plot)
Viene utilizzato per confrontare due gruppi presentando gli indici visivamente
- Forma costruendo 3 punti base
- Una scatola che racchiude i valori tra Q1 e Q3 (range interquartile)
- I baffi esterni alla scatola da Q1 al valore minimo e da Q3 al valore massimo
- Una linea orizzontale nella scatola all'altezza di Q2 (mediana)
In caso di valori estremi "lontani" dagli altri si indicano come punti esterni detti outlier
TEST DIAGNOSTICI
La qualità di un test diagnostico è misurata da sensibilità e specificità ottenuti attraverso esperimenti che confrontano il metodo con un gold standard.
RISULTATO MALATTIA Presente (H) Assente (S) TOTALE Positivo (+) a b a+b Negativo (-) c d c+d TOTALE a+c b+dSensibilità
Probabilità che il test risulti positivo dato che il soggetto è malato (H)
P(+|H) = a/a+c
Specificità
Probabilità che il test risulti negativo dato che il soggetto è sano (S)
P(-|S) = d/b+d
Falso positivo
Test risulta positivo su un soggetto sano (S)
P(+|S) = b/b+d
Falso negativo
Test negativo su un soggetto malato (H)
P(-|H) = c/a+c