vuoi
o PayPal
tutte le volte che vuoi
Popolazione: campo di indagine, universo in cui si vuole applicare l’indagine statistica
Campione: sottogruppo della popolazione che deve essere il più rappresentativo possibile dell’intera
collettività
Unità statistiche elementi (individui, farmaci, ospedali) appartenenti alla popolazione
Variabili o caratteri caratteristiche delle unità statistiche, informazioni che caratterizzano le unità statistiche
Qualitative indicano una caratteristica non misurabile (gruppo sanguigno, colore occhi)
Quantitative indicano un dato misurabile, cioè associabile ad un numero (peso, altezza, PA)
Le variabili qualitative possono essere dicotomiche o binarie (es. m o f, vivo o morto) che esprimono una
qualità in solo due modalità; nominali (es. residenza, laurea conseguita) che esprimono una qualità in più di
due modalità; ordinali o classificate (es. stadio del tumore) oltre alle due modalità hanno anche un aumento
o diminuzione
Le variabili quantitative possono essere discrete (es. numero di decessi, di figli; numeri naturali); continue o
dimensionali (es. altezza, peso; numeri dati da uno strumento per misurare)
La proporzione è una variabile creata dal rapporto fra variabili discrete al numeratore e al denominatore
Nella proporzione gli eventi al numeratore fanno parte di quelli al denominatore e, dunque, sono compresi
in esso (es. n. morti/n. abitanti) se poi si moltiplica per 100 otteniamo una percentuale
Ex. durante un’intervista a dei donatori di sangue si sono registrate le seguenti caratteristiche:
genere - qualitativa; peso (kg) - quantitativa; altezza (cm) - quantitativa; età (anni) - quantitativa discreta;
titolo di studio (dipl. inf, dipl. sup., laurea, post laurea) - qualitativa ordinale; professione - qualitativa;
stato civile - qualitativa nominale; numero di figli - quantitativa discreta; ha già donato il sangue -
quantitativa dicotomica; vive rapporto stabile - qualitativa dicotomica; numero di ospedalizzazioni nei due
anni precedenti - quantitativa discreta
Una variabile continua può essere convertita in una variabile ordinale raggruppando insieme unità con valori
simili. Es. il peso alla nascita di un singolo bambino (variabile continua) può essere convertito in classi di pesi
alla nascita (variabile ordinale) come mostrato nella figura seguente, per una migliore visualizzazione grafica
Una variabile continua può essere inoltre resa dicotomica dividendo i dati in due soli gruppi, ovviamente
creare due soli gruppi comporta una perdita maggiore di informazioni. Es. due sole classi di peso alla nascita,
minore o pari a tot. e maggiore di tot.
Statistica descrittiva
Le frequenze servono a descrivere le variabili qualitative
Frequenza assoluta numero di osservazioni corrispondente ai diversi valori della variabile (tramite conteggio)
Frequenza relativa proporzione tra il numero di osservazioni e il totale da cui questo proviene
Frequenza relativa percentuale si ottiene moltiplicando le frequenze relative per 100 e ovviamente indica
quante volte un fenomeno si manifesta su una casistica di 100 osservazioni
Ex. si vuole valutare l’efficacia di uno psicofarmaco nel curare forme di balbuzie. L’esperimento coinvolge
dei pz assegnati in modo casuale a 2 gruppi, A e B: al gruppo A (150pz) viene somministrato il farmaco, al
gruppo B (100pz) un placebo. Osserviamo che il gruppo A è quello più grande e ci chiediamo “è per questo
motivo che ha il maggior numero di miglioramenti?” Nel gruppo A sono migliorati in 50, nel B in 30.
Calcoliamo la frequenza relativa A(50/150=0,33); B(33/100=0,33). I risultati sono praticamente uguali
Le frequenze vengono rappresentate in tabelle (a singola entrata, a doppia, a “n” entrate)
Appunti di Andrea Pezzano La Sapienza - Infermieristica C 2020-2021
23/4/21
I descrittori delle variabili quantitative possono essere suddivisi in:
Indici o misure di tendenza centrale rappresentano uno strumento che consente di sintetizzare
l’andamento generale di una distribuzione di dati (moda; media aritmetica; mediana)
Indici o misure di dispersione o variabilità consente di descrivere la variabilità intorno a questo
indicatore, cioè valutano sinteticamente le disuguaglianze tra i valori (massimo e minimo; varianza;
devianza standard; percentili)
Media è data dalla somma di tutti i valori rilevati in un campione divisa per la numerosità dello stesso. Si
utilizza su valori grandi
Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,
18, 22, 17, 46, 28, 28, 19. Sommando i valori viene 400. Dividiamo il totale per il numero dei valori
(400/15=26,67)
Mediana valore centrale di una serie ordinata di dati, ovvero è il valore che divide in due la distribuzione dei
valori (n). Non è sensibile ai valori estremi a differenza della media
Se n dispari, la mediana è il valore al centro della distribuzione ordinata (n+1)/2
Se n pari, la mediana è la media dei due valori al centro della distribuzione ordinata ovvero media tra
n/2 e (n/2)+1
Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,
18, 22, 17, 46, 28, 28, 19. Si ordinano i 15 valori e si calcola il punto centrale, poiché n=15 è dispari la
a
mediana è il valore che si trova al centro della distribuzione (15+1)/2=8. Il valore in 8 posizione è 25 (17,
17, 18, 19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46, 51)
Ex. Le età di 14 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 30, 21, 27, 25, 19, 18,
22, 17, 46, 28, 28, 19. Si ordinano i 14 valori e si calcola il punto centrale, poiché n=14 è pari la mediana è
a a
la media dei due valori al centro della distribuzione ordinata 14/2=7 e (14/2)+1=7+1=8. Il valore in 7 e 8
posizione sono 22 e 25 (17, 17, 18, 19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46). La media sarà
22+25=47/2=23,5
Moda si definisce moda di un insieme di dati o di una distribuzione di frequenza la modalità (il valore) della
variabile cui corrisponde la massima frequenza
Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,
18, 22, 17, 46, 28, 28, 19. Si ordinano i 15 valori per evidenziare subito il più o i più frequenti: 17, 17, 18,
19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46, 51
Indici di dispersione misurano la variabilità del fenomeno oggetto di studio, valutano le disuguaglianze tra valori
Varianza valore sintetico che vuole esprimere la media delle distanze al quadrato di ogni singola osservazione
dalla media aritmetica del campione. Usa le proprietà degli operatori aritmetici e opera su dati quantitativi
(continui e discreti). Sempre ≥0. È sensibile ai valori estremi (è una media di scarti quadratici quindi distanze
al quadrato). La sua unità di misura è quella della media ma al quadrato
Ex. i volumi espiratori forzati in 13 adolescenti asmatici in litri sono pari a: 2.3; 2.1; 3.5; 2.6; 2.8; 2.8; 4.0; 2.2;
2.6; 3.0; 4.0; 2.8; 3.3. Si calcolano gli scarti dalla media (2.9 litri) quindi 2.3-2.9; 2.1-2.9; 3.5-2.9; ecc e
otterremo i seguenti valori -0.6; -0.8; +0.6; -0.3; -0.1; -0.1; +1.1; -0.7; -0.3; +0.1; +1.1; -0.1; +0.4. Poi si
calcolano i quadrati degli scarti: 0.36; 0.64; 0.36; 0.09; 0.01; 0.01; 1.21; 0.49; 0.09; 0.01; 1.21; 0.01; 0.16. Si
calcola la media dei quadrati degli scarti (somma dei quadrati degli scarti diviso 12)
2
0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16=4.65. 4.65/(13-1)= 0.3875 litri
Deviazione standard radice quadrata della varianza quindi √0.3875=0.622
Range o campo di variazione differenza tra valore massimo e minimo
Ex. I volumi dei 13 adolescenti, min=2.1 max=4.0 il range sarà 4.0-2.1= 1.9
P-esimo quantile dato per cui almeno p% delle osservazioni sono minori di esso e 1-p% delle osservazioni
sono maggiori o uguali ad esso. Percentili o Centili: suddivisione in 100 parti le osservazioni (1%, 2%). Decili:
suddivisione in 10 parti (10%, 20%) Quintili: suddivisione in 5 parti (20%, 40%). Quartili: suddivisione in 4
gruppi (25%, 50%, 75%). Consideriamo n osservazioni. Calcoliamo l’espressione (n*p)/100
Appunti di Andrea Pezzano La Sapienza - Infermieristica C 2020-2021
Se il risultato non è un numero intero (3.2; 4.5; 7.65); il p-esimo percentile sarà l’osservazione che si
trova alla posizione data da n*p/100 approssimato per eccesso
Se il risultato è un numero intero (1; 2; 3); il p-esimo percentile sarà la media tra l’osservazione nella
posizione (n*p/100) e l’osservazione successiva ((n*p/100)+1)
Ex. Calcolare il 75-esimo percentile nel nostro esempio di 13 osservazioni. Calcoliamo l’espressione (n*p)/100
quindi (13*75)/100= 9,75 non è un intero quindi approssimiamo a 10. Il p-esimo percentile sarà
a
l’osservazione in 10 osservazione dopo aver ordinato i dati: 2.1; 2.2; 2.3; 2.6; 2.6; 2.8; 2.8; 2.8; 3.0; 3.3; 3.5;
4.0; 4.0. il 75% del mio campione è al di sotto di 3.3; il restante quarto (25%) è superiore
La distanza interquartile è la differenza tra il 75° e il 25° percentile
L’istogramma si trova su un piano cartesiano (x e y), il grafico a barre utilizza solo l’asse delle y. Il diagramma
a scatola (box plot) presenta dentro il box la mediana; la base inferiore rappresenta il 25° percentile, la base
superiore il 75° percentile; le due linee al di fuori della scatola rappresentano i valori più estremi
26/4/21
Test di significatività statistica
L’inferenza è preceduta dal campionamento. Il procedimento per fare un test statistico è scandito da:
Formulare l’ipotesi nulla (H )
0
Tra i gruppi considerati non c’è nessuna reale differenza rispetto ad un certo parametro. Viene invece definita
ipotesi alternativa (H ) l’ipotesi complementare, quella che contiene l’obiettivo proposto
a
Es. secondo noi le mele non sono tutte rosse, hanno la buccia di colore diverso. Prendo una cassa chiusa di
mele (campione) formulo l’ipotesi nulla, H = tutte le mele contenute nella cassa sono rosse (non c’è
0
differenza nel colore). Una volta aperta la cassa; se trovo una mela verde H è rifiutata, ho fornito un
0
controesempio ovvero le mele hanno diversi colori della buccia; se trovo tutte mele rosse allora non rifiuto
H dato che non posso asserire che tutte le mele esistenti sono rosse
0 Stabilire il livello di errore (alfa)
Una volta formulate le ipotesi è necessario fissare l’errore che siamo disposti a commettere con il nostro test.
Es. la giuria ha a disposizione delle “prove” sulla base delle quali deve valutare se l’innocenza dell’imputato
è o non è compatibile con le prove a disposizione. Il rice