Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

Lezione III:

Variabilità

Cattedra di Biostatistica – Dipartimento di

Scienze Biomediche, Università degli Studi

“G. d’Annunzio” di Chieti – Pescara

Prof. Enzo Ballone

Lezione 3a- Misure di

dispersione o di variabilità

Misure di dispersione o di

variabilità.

Abbiamo visto che la media è una misura della

localizzazione centrale della distribuzione (il centro

di gravità).

Popolazioni con la stessa media possono avere un

grado molto diverso di variazione dei dati.

Una maniera per esprimere questa variazione è

quello di utilizzare la media come punto di

riferimento di ciascun valore, cioè di calcolare la

deviazione di ciascun dato dalla media (il suo

“scarto” dalla media). 1

Misure di dispersione o di

variabilità

Le deviazioni saranno numeri positivi per tutti i valori

al di sopra della media e numeri negativi per tutti i

valori al di sotto della media.

Se noi sommassimo queste deviazioni il risultato

sarebbe 0 (i valori positivi sarebbero elisi dai valori

negativi).

Quest'approccio non ci consentirebbe pertanto di

ottenere una misura della variabilità dei dati.

Il problema si risolve elevando al quadrato le

deviazioni dalla media (il quadrato di un numero

negativo è un numero positivo).

Misure di dispersione o di

variabilità

Se sommiamo i quadrati delle deviazioni (o “scarti”)

dalla media e dividiamo questa somma per il

numero delle osservazioni otteniamo la deviazione

quadratica media (o scarto quadratico medio) o

varianza.

Per riportare i valori all'unità di misura di partenza

possiamo estrarre la radice quadrata della varianza.

La radice quadrata della varianza è la misura di

distribuzione più usata ed è definita deviazione

standard.

Misure di dispersione o di

variabilità

Un altro modo di esprimere la variabilità di una

distribuzione è quella di riferirsi al range di una

distribuzione (il valore minimo e il valore massimo).

Il range dipende esclusivamente dai valori estremi,

perciò se il campione di dati è piccolo esso può dare

una stima erronea del range della popolazione

(questo perché i valori estremi sono rari e possono

non essere rappresentati in un piccolo campione). 2

Esempio 10: I gruppo II gruppo III gruppo

Si considerino inizialmente, le

seguenti due distribuzioni di

valori riferiti all’età di 10

individui 20aa 10aa 35aa

30aa 25aa 37aa

40aa 40aa 40aa

50aa 55aa 43aa

60aa 70aa 45aa

L'età media (media aritmetica)

è pari a 40 anni per tutti gruppi,

ma nel secondo i dati sono più R=40aa R=60aa R=10aa

“dispersi” attorno alla media.

Le misure di dispersione

utilizzate:

Pertanto oltre ai valori medi vanno introdotti anche

indici di misura della VARIABILITA' (o

Dispersione) dei dati.

Le misure di dispersione più usate sono:

campo di variazione (range);

1. devianza;

2. varianza;

3. deviazione standard;

4. coefficiente di variazione (indice di variabilità relativa);

5. differenza interquartile.

6.

Campo di variazione o range

R = Xmax - Xmin .

Limiti del campo di variazione

è troppo influenzato dai valori estremi;

tiene conto dei due soli valori estremi, trascurando tutti gli altri.

tende ad aumentare con l’aumento del numero di osservazioni.

Occorre allora un indice di dispersione che consideri tutti i dati (e

non solo quelli estremi), confrontando questi con il loro valor

medio. n

∑ ( - x) = 0

x

Tuttavia va ricordato che: i

i=1 n

Si potrebbe calcolare la somma dei valori assoluti: , ma

| - x |

x

i

i=1

tale quantità è difficile da trattare matematicamente.

Un indice alternativo è quello di considerare la somma dei

quadrati degli scarti dalla media aritmetica

n

DEVIANZA =

∑ 2

)

(x - x

i

i= 1 3

Esempio 5’: X i

Valori del tasso (glicemia

2

)

(x - x

- x i

x

mg/100cc

glicemico in 10 i

)

soggetti 103 +8 64

97 +2 4

90 -5 25

119 +24 576

107 +12 144

71 -24 576

94 -1 1

81 -14 196

92 -3 9

96 +1 1

10 10

_ 2

= ∑ ∑

| - x| = 94 )

x ( - x = 1596

x

x 95 i

i =

i=1 i 1

Devianza e Varianza

La quantità 1596 esprime la Devianza della

distribuzione (Dev).

Il limite della Devianza come misura di dispersione è

quello di aumentare con il numero di osservazioni.

Per ottenere una misura che non dipenda dalla

numerosità si può dividere la devianza per il numero

n. di dati, ottenendo la Varianza:

n 2

( - x )

xi

∑ 1596

2 2

i = 1

σ = = = 159 . 60 ( / 100 )

mg cc

10

n

Devianza e Varianza

In pratica il denominatore n è quasi sempre

sostituito da (n-1) in modo da ottenere una

stima corretta della dispersione della variabile

nella popolazione da cui il campione in

esame è stato estratto.

n 2

∑ ( - X )

x i 1596

= = =

2 i =1

S 177 . 3 ( mg / 100 cc )

n - 1 9 4


PAGINE

10

PESO

1.74 MB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Materiale per il corso di Biostatistica e Statistica Medica del prof. Enzo Ballone dell'università degli studi Chieti - Pescara della facoltà di Medicina e Chirurgia riguardante i seguenti argomenti: misure di dispersione e misure di variabilità; campo di variazione o range; devianza e varianza; indici di variabilità relativa; i quantili.


DETTAGLI
Esame: BIOSTATISTICA
Corso di laurea: Corso di laurea magistrale in medicina e chirurgia (ordinamento U.E. - 6 anni)
SSD:
A.A.: 2011-2012

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di BIOSTATISTICA e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Gabriele D'Annunzio - Unich o del prof Bellone Enzo.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Biostatistica

Probabilità - Statistica medica
Dispensa
Media aritmetica, moda e mediana - Statistica medica
Dispensa
Test chi quadro
Dispensa
Campionamento statistico
Dispensa