Anteprima
Vedrai una selezione di 1 pagina su 5
Appunti Statistica Pag. 1
1 su 5
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Popolazione: campo di indagine, universo in cui si vuole applicare l’indagine statistica

Campione: sottogruppo della popolazione che deve essere il più rappresentativo possibile dell’intera

collettività

Unità statistiche elementi (individui, farmaci, ospedali) appartenenti alla popolazione

Variabili o caratteri caratteristiche delle unità statistiche, informazioni che caratterizzano le unità statistiche

 Qualitative indicano una caratteristica non misurabile (gruppo sanguigno, colore occhi)

 Quantitative indicano un dato misurabile, cioè associabile ad un numero (peso, altezza, PA)

Le variabili qualitative possono essere dicotomiche o binarie (es. m o f, vivo o morto) che esprimono una

qualità in solo due modalità; nominali (es. residenza, laurea conseguita) che esprimono una qualità in più di

due modalità; ordinali o classificate (es. stadio del tumore) oltre alle due modalità hanno anche un aumento

o diminuzione

Le variabili quantitative possono essere discrete (es. numero di decessi, di figli; numeri naturali); continue o

dimensionali (es. altezza, peso; numeri dati da uno strumento per misurare)

La proporzione è una variabile creata dal rapporto fra variabili discrete al numeratore e al denominatore

Nella proporzione gli eventi al numeratore fanno parte di quelli al denominatore e, dunque, sono compresi

in esso (es. n. morti/n. abitanti) se poi si moltiplica per 100 otteniamo una percentuale

Ex. durante un’intervista a dei donatori di sangue si sono registrate le seguenti caratteristiche:

genere - qualitativa; peso (kg) - quantitativa; altezza (cm) - quantitativa; età (anni) - quantitativa discreta;

titolo di studio (dipl. inf, dipl. sup., laurea, post laurea) - qualitativa ordinale; professione - qualitativa;

stato civile - qualitativa nominale; numero di figli - quantitativa discreta; ha già donato il sangue -

quantitativa dicotomica; vive rapporto stabile - qualitativa dicotomica; numero di ospedalizzazioni nei due

anni precedenti - quantitativa discreta

Una variabile continua può essere convertita in una variabile ordinale raggruppando insieme unità con valori

simili. Es. il peso alla nascita di un singolo bambino (variabile continua) può essere convertito in classi di pesi

alla nascita (variabile ordinale) come mostrato nella figura seguente, per una migliore visualizzazione grafica

Una variabile continua può essere inoltre resa dicotomica dividendo i dati in due soli gruppi, ovviamente

creare due soli gruppi comporta una perdita maggiore di informazioni. Es. due sole classi di peso alla nascita,

minore o pari a tot. e maggiore di tot.

Statistica descrittiva

Le frequenze servono a descrivere le variabili qualitative

Frequenza assoluta numero di osservazioni corrispondente ai diversi valori della variabile (tramite conteggio)

Frequenza relativa proporzione tra il numero di osservazioni e il totale da cui questo proviene

Frequenza relativa percentuale si ottiene moltiplicando le frequenze relative per 100 e ovviamente indica

quante volte un fenomeno si manifesta su una casistica di 100 osservazioni

Ex. si vuole valutare l’efficacia di uno psicofarmaco nel curare forme di balbuzie. L’esperimento coinvolge

dei pz assegnati in modo casuale a 2 gruppi, A e B: al gruppo A (150pz) viene somministrato il farmaco, al

gruppo B (100pz) un placebo. Osserviamo che il gruppo A è quello più grande e ci chiediamo “è per questo

motivo che ha il maggior numero di miglioramenti?” Nel gruppo A sono migliorati in 50, nel B in 30.

Calcoliamo la frequenza relativa A(50/150=0,33); B(33/100=0,33). I risultati sono praticamente uguali

Le frequenze vengono rappresentate in tabelle (a singola entrata, a doppia, a “n” entrate)

Appunti di Andrea Pezzano La Sapienza - Infermieristica C 2020-2021

23/4/21

I descrittori delle variabili quantitative possono essere suddivisi in:

 Indici o misure di tendenza centrale rappresentano uno strumento che consente di sintetizzare

l’andamento generale di una distribuzione di dati (moda; media aritmetica; mediana)

 Indici o misure di dispersione o variabilità consente di descrivere la variabilità intorno a questo

indicatore, cioè valutano sinteticamente le disuguaglianze tra i valori (massimo e minimo; varianza;

devianza standard; percentili)

Media è data dalla somma di tutti i valori rilevati in un campione divisa per la numerosità dello stesso. Si

utilizza su valori grandi

Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,

18, 22, 17, 46, 28, 28, 19. Sommando i valori viene 400. Dividiamo il totale per il numero dei valori

(400/15=26,67)

Mediana valore centrale di una serie ordinata di dati, ovvero è il valore che divide in due la distribuzione dei

valori (n). Non è sensibile ai valori estremi a differenza della media

 Se n dispari, la mediana è il valore al centro della distribuzione ordinata (n+1)/2

 Se n pari, la mediana è la media dei due valori al centro della distribuzione ordinata ovvero media tra

n/2 e (n/2)+1

Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,

18, 22, 17, 46, 28, 28, 19. Si ordinano i 15 valori e si calcola il punto centrale, poiché n=15 è dispari la

a

mediana è il valore che si trova al centro della distribuzione (15+1)/2=8. Il valore in 8 posizione è 25 (17,

17, 18, 19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46, 51)

Ex. Le età di 14 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 30, 21, 27, 25, 19, 18,

22, 17, 46, 28, 28, 19. Si ordinano i 14 valori e si calcola il punto centrale, poiché n=14 è pari la mediana è

a a

la media dei due valori al centro della distribuzione ordinata 14/2=7 e (14/2)+1=7+1=8. Il valore in 7 e 8

posizione sono 22 e 25 (17, 17, 18, 19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46). La media sarà

22+25=47/2=23,5

Moda si definisce moda di un insieme di dati o di una distribuzione di frequenza la modalità (il valore) della

variabile cui corrisponde la massima frequenza

Ex. Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19,

18, 22, 17, 46, 28, 28, 19. Si ordinano i 15 valori per evidenziare subito il più o i più frequenti: 17, 17, 18,

19, 19, 21, 22, 25, 27, 28, 28, 30, 32, 46, 51

Indici di dispersione misurano la variabilità del fenomeno oggetto di studio, valutano le disuguaglianze tra valori

Varianza valore sintetico che vuole esprimere la media delle distanze al quadrato di ogni singola osservazione

dalla media aritmetica del campione. Usa le proprietà degli operatori aritmetici e opera su dati quantitativi

(continui e discreti). Sempre ≥0. È sensibile ai valori estremi (è una media di scarti quadratici quindi distanze

al quadrato). La sua unità di misura è quella della media ma al quadrato

Ex. i volumi espiratori forzati in 13 adolescenti asmatici in litri sono pari a: 2.3; 2.1; 3.5; 2.6; 2.8; 2.8; 4.0; 2.2;

2.6; 3.0; 4.0; 2.8; 3.3. Si calcolano gli scarti dalla media (2.9 litri) quindi 2.3-2.9; 2.1-2.9; 3.5-2.9; ecc e

otterremo i seguenti valori -0.6; -0.8; +0.6; -0.3; -0.1; -0.1; +1.1; -0.7; -0.3; +0.1; +1.1; -0.1; +0.4. Poi si

calcolano i quadrati degli scarti: 0.36; 0.64; 0.36; 0.09; 0.01; 0.01; 1.21; 0.49; 0.09; 0.01; 1.21; 0.01; 0.16. Si

calcola la media dei quadrati degli scarti (somma dei quadrati degli scarti diviso 12)

2

0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16=4.65. 4.65/(13-1)= 0.3875 litri

Deviazione standard radice quadrata della varianza quindi √0.3875=0.622

Range o campo di variazione differenza tra valore massimo e minimo

Ex. I volumi dei 13 adolescenti, min=2.1 max=4.0 il range sarà 4.0-2.1= 1.9

P-esimo quantile dato per cui almeno p% delle osservazioni sono minori di esso e 1-p% delle osservazioni

sono maggiori o uguali ad esso. Percentili o Centili: suddivisione in 100 parti le osservazioni (1%, 2%). Decili:

suddivisione in 10 parti (10%, 20%) Quintili: suddivisione in 5 parti (20%, 40%). Quartili: suddivisione in 4

gruppi (25%, 50%, 75%). Consideriamo n osservazioni. Calcoliamo l’espressione (n*p)/100

Appunti di Andrea Pezzano La Sapienza - Infermieristica C 2020-2021

 Se il risultato non è un numero intero (3.2; 4.5; 7.65); il p-esimo percentile sarà l’osservazione che si

trova alla posizione data da n*p/100 approssimato per eccesso

 Se il risultato è un numero intero (1; 2; 3); il p-esimo percentile sarà la media tra l’osservazione nella

posizione (n*p/100) e l’osservazione successiva ((n*p/100)+1)

Ex. Calcolare il 75-esimo percentile nel nostro esempio di 13 osservazioni. Calcoliamo l’espressione (n*p)/100

quindi (13*75)/100= 9,75 non è un intero quindi approssimiamo a 10. Il p-esimo percentile sarà

a

l’osservazione in 10 osservazione dopo aver ordinato i dati: 2.1; 2.2; 2.3; 2.6; 2.6; 2.8; 2.8; 2.8; 3.0; 3.3; 3.5;

4.0; 4.0. il 75% del mio campione è al di sotto di 3.3; il restante quarto (25%) è superiore

La distanza interquartile è la differenza tra il 75° e il 25° percentile

L’istogramma si trova su un piano cartesiano (x e y), il grafico a barre utilizza solo l’asse delle y. Il diagramma

a scatola (box plot) presenta dentro il box la mediana; la base inferiore rappresenta il 25° percentile, la base

superiore il 75° percentile; le due linee al di fuori della scatola rappresentano i valori più estremi

26/4/21

Test di significatività statistica

L’inferenza è preceduta dal campionamento. Il procedimento per fare un test statistico è scandito da:

 Formulare l’ipotesi nulla (H )

0

Tra i gruppi considerati non c’è nessuna reale differenza rispetto ad un certo parametro. Viene invece definita

ipotesi alternativa (H ) l’ipotesi complementare, quella che contiene l’obiettivo proposto

a

Es. secondo noi le mele non sono tutte rosse, hanno la buccia di colore diverso. Prendo una cassa chiusa di

mele (campione) formulo l’ipotesi nulla, H = tutte le mele contenute nella cassa sono rosse (non c’è

0

differenza nel colore). Una volta aperta la cassa; se trovo una mela verde H è rifiutata, ho fornito un

0

controesempio ovvero le mele hanno diversi colori della buccia; se trovo tutte mele rosse allora non rifiuto

H dato che non posso asserire che tutte le mele esistenti sono rosse

0  Stabilire il livello di errore (alfa)

Una volta formulate le ipotesi è necessario fissare l’errore che siamo disposti a commettere con il nostro test.

Es. la giuria ha a disposizione delle “prove” sulla base delle quali deve valutare se l’innocenza dell’imputato

è o non è compatibile con le prove a disposizione. Il rice

Dettagli
Publisher
A.A. 2018-2019
5 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher urso22 di informazioni apprese con la frequenza delle lezioni di Fisica e statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Rossi Pellegrino.