Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

Metodo dei minimi quadrati

Esempio 4

b = - 0.225 : ogni sigaretta in più fumata comporta

in media una diminuzione di capacità vitale pari a

0.225 l.

a = 6.99 : valore medio di CV per non fumatori.

Metodo dei minimi quadrati

Valore predittivo dell'analisi della

regressione

La semplice rappresentazione grafica dei valori

osservati e della retta di regressione fornisce

alcune indicazioni importanti per l'interpretazione

delle relazioni esistenti tra le due variabili.

Il valore del coefficiente angolare indica quanto

aumenta in media la variabile dipendente Y

all'aumento di una unità della variabile

indipendente X.

Metodo dei minimi quadrati

Se si cambia la scala della variabile

indipendente o predittiva X (per esempio

l'altezza misurata in mm o in m e non più in

cm) lasciando invariata quella della variabile

dipendente o predetta Y, muta

proporzionalmente anche il valore del

coefficiente angolare b. 10

Metodo dei minimi quadrati

Nell'analisi della regressione:

è frequente, specialmente negli utilizzi predittivi, il

ricorso al tempo come variabile indipendente;

viene spesso dimenticato che qualsiasi previsione

o stima di Y derivata dalla retta è valida solo entro

il campo di variazione della variabile indipendente

X;

non è dimostrato che la relazione esistente tra le

due variabili sia dello stesso tipo anche per valori

minori o maggiori di quelli sperimentali rilevati.

Metodo dei minimi quadrati

Significatività della retta di regressione

Con il metodo dei minimi quadrati è sempre

possibile ottenere la retta che meglio si adatta ai

dati rilevati, indipendentemente dalla dispersione

dei punti intorno alla retta.

Tuttavia il semplice calcolo della retta non è

sufficienti ai fini dell’analisi statistica.

Metodo dei minimi quadrati

La retta potrebbe indicare:

una relazione reale tra le due variabili, se il

valore di b è alto e la dispersione dei punti intorno

alla retta è ridotta;

relazione casuale o non significativa, quando

la dispersione dei punti intorno alla retta è

approssimativamente uguale a quella intorno alla

media. 11

Metodo dei minimi quadrati

Metodo dei minimi quadrati

Metodo dei minimi quadrati

Il coefficiente angolare b della retta di regressione, che

determina la quantità di variazione di Y per ogni unità

aggiuntiva di X, è calcolato da osservazioni

sperimentali.

Ciò che tuttavia interessa al ricercatore è la relazione

esistente nella popolazione, e sebbene il valore di b

sia differente da zero, non è detto che nella

popolazione al variare di X si abbia una variazione di

Y.

La significatività del coefficiente di regressione nella

popolazione (b) può essere saggiata mediante la

verifica dell’ipotesi nulla: β

H : = 0.

0 12

Metodo dei minimi quadrati

Accettando H si assume che il valore reale del

0 β

coefficiente angolare sia = 0, dunque al variare di

X, Y resta costante e uguale al valore dell'intercetta

a, pertanto non esiste alcun legame tra X e Y. β ≠

Rifiutando H . si accetta l’ipotesi alternativa H :

0 1

0. dunque al variare di X si ha una corrispondente

variazione sistematica di Y.

Un metodo per la verifica della significatività

della retta calcolata è il test F di Fisher-Snedecor,

che si basa sulla scomposizione delle devianze.

Metodo dei minimi quadrati

La somma dei quadrati delle distanze tra i tre

punti y . e definiscono le tre devianze:

y

y

i i

devianza totale, devianza della regressione o

devianza dovuta alla regressione, devianza

d'errore o devianza residua:

Metodo dei minimi quadrati

n − 2

(y y

)

Devianza Totale = i

=

i 1 ∧

n −

Devianza di Regressione = 2

( y y

)

i

=

i 1

Devianza Residua = n −

2

(y y )

∑ i i

=

i 1

Devianza Totale = Devianza di Regress. +

Devianza Res. 13

Metodo dei minimi quadrati

Dal rapporto della devianza dovuta alla regressione

e quella residua con i rispettivi gradi di libertà (1 ed

n-1 gdl rispettivamente) si stimano la varianza

dovuta alla regressione e la varianza residua.

Il rapporto:

Varianza di Regression e

VarianzaRe

sidua

determina il valore del test F con 1 e n-2 gdl

(F ).

(1.n-2)

Metodo dei minimi quadrati

Se l’F calcolato è inferiore a quello tabulato

per la probabilità prefissata e i gdl

corrispondenti. si accetta l’ipotesi nulla H 0

(non esiste regressione lineare

statisticamente significativa)

Se l’F calcolato supera quello tabulato si

rifiuta l'H e si accetta H (la regressione

0 1

lineare tra le due variabili è significativa)

Metodo dei minimi quadrati

β

Se = 0, la varianza dovuta alla regressione e

quella residua sono stime indipendenti e non viziate

della variabilità dei dati

β ≠

Se 0, la varianza residua è una stima non

viziata della variabilità dei dati, mentre la varianza

dovuta alla regressione è stima di una grandezza

maggiore della varianza residua.

Di conseguenza. il rapporto tra le due varianze è da

β

ritenersi utile alla verifica dell'ipotesi = 0. 14

Metodo dei minimi quadrati

Rifiutare H :

0

non significa che non esiste relazione tra le due

variabili. ma solamente che non esiste una

relazione di tipo lineare

significa che potrebbe esistere una relazione di

tipo differente, come quella curvilinea di secondo

grado o di grado superiore

Metodo dei minimi quadrati

La trasformazione di uno o di entrambi gli assi è

spesso sufficiente per ricondurre una relazione di

tipo curvilineo a quella lineare:

la crescita esponenziale di una popolazione nel tempo.

generata da tassi costanti. diviene lineare con la

trasformazione logaritmica del tempo, di norma riportato

sull'asse delle ascisse

la relazione curvilinea tra lunghezza e peso di individui

della stessa specie diviene lineare con la trasformazione

mediante radice cubica del peso. correlato linearmente al

volume

l'analisi statistica permette qualsiasi tipo di trasformazione

che determini una relazione lineare tra due variabili

Metodo dei minimi quadrati

Esempio 1

Con le misure delle caratteristiche ETA’ e PAS rilevate

sugli 8 individui è stata determinata le retta di regressione .

∧ = + ⋅

PAS 68.56 1.54 ETA'

Supposto il campione estratto dalla popolazione oggetto di

studio significativo, con le tecniche dell’inferenza statistica

occorre verificare:

se la retta può essere assunta come rappresentativa di un

rapporto lineare tre le due variabili;

se è corretto affermare che, nella popolazione di

riferimento, ad una variazione di età corrisponde un

cambiamento lineare della pressione sistolica;

β β ≠

se, mediante il test F, = 0 (ip. H ) oppure 0 (ip. H ).

0 1 15

Metodo dei minimi quadrati

Si calcola la seguente tabella:

6543

. 1

F = =14.61

(1.6) 447

. 9

Metodo dei minimi quadrati

il valore critico riportato nelle tavole di F per 1 e 6

gdl e per un livello di significatività =0.01 è pari a

13.75;

il valore calcolato di F è superiore a quello critico;

per p<0.01 si rifiuta H : si può supporre un

0

rapporto lineare tra le variazioni di età e pressione

sistolica.

La stima della significatività della retta o verifica

dell'esistenza di una relazione lineare tra le variabili

può essere condotta anche con il test t di Student,

con risultati equivalenti al test F.

Metodo dei minimi quadrati

Il test t è :

fondato su calcoli didatticamente meno evidenti di

quelli del test F. ma offre il vantaggio di poter

essere applicato sia in test unilaterali (β>0 ?

β<0

oppure ?) che in test bilaterali (β≠0?);

basato sul rapporto tra il valore del coefficiente di

regressione b (che rappresenta la risposta media

di Y ai diversi valori di X entro il suo intervallo di

variazione) ed il suo errore standard SE(b): 16

Metodo dei minimi quadrati

Varianza Residua

SE(b) =

DEV(X)

− β

b

t =

(n-2) SE(b)

β

dove è il valore atteso e i gdl sono n-2.

F

Osservazione: t(n-2) = .

(1,

n 2)

Regressione

COEFFICIENTE DI DETERMINAZIONE

Per una regressione lineare semplice, ma più in

generale per qualsiasi regressione da quella

curvilinea a quella lineare multipla, il coefficiente

2

di determinazione r è la proporzione di

variazione totale della variabile dipendente

spiegata da quella indipendente:

Devianza di Regression

e

2

r = Devianza Totale

Regressione

Espresso a volte in percentuale ed indicato in alcuni

2

testi con R o Rsq, serve per misurare “quanto”

della variabile dipendente Y sia predetto dalla

variabile indipendente X e, quindi, per valutare la

bontà dell’equazione di regressione ai fini della

previsione sui valori della Y.

E' una misura che ha scopi descrittivi dei dati

raccolti. Non è legata ad inferenze statistiche, ma a

scopi pratici, specifici dell'uso della regressione

come metodo per prevedere Y conoscendo X. 17

Regressione

Il suo valore, compreso tra 0 e 1, è tanto più elevato

quanto più la retta passa vicino ai punti, fino a

raggiungere 1 (o 100%) quando tutti i punti

sperimentali sono collocati esattamente sulla retta e

quindi ogni Y può essere predetto con precisione

i

totale dal corrispondente valore di X

i

Nell'esempio con le 8 osservazioni di età e

pressione. il valore del coefficiente di

determinazione è:

6543.1

2

r = = 0,71

9230.9

Regressione

Ciò significa che, noto il valore dell'età, quello della

pressione è stimato mediante attraverso la retta di

regressione con una approssimazione di circa il 71%.

2

Il restante 1−r =29% è determinato dalla variabilità

individuale di scostamento dalla retta ed indica la parte di

variabilità della variabile risposta imputabile

eventualmente ad altri fattori diversi dall’età.

2

La valutazione del valore di r è in stretto rapporto con la

disciplina oggetto di studio. Si può ritenere in alcuni ambiti

che il modello lineare abbia un buon fitting con i valori

2

sperimentali se r > 0.6, ma va detto anche che nelle

scienze sociali spesso si reputa alto un valore uguale a

0.30 mentre i fisici stimano basso un valore pari a 0.98.

Correlazione Lineare Semplice

Una misura della bontà del modello lineare può

essere ottenuta studiando l’interdipendenza tra due

caratteri statistiche quantitativi X e Y.

Uno degli indici molto noto per una tale misura è il

Coefficiente di Correlazione Lineare r:

CODEV(X, Y)

r = ⋅

DEV(X) DEV(Y) −1

Tale quantità, indicata anche con R, varia tra e

1. 18


PAGINE

21

PESO

268.39 KB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Materiale didattico per il Corso di Biostatistica e Statistica Medica del prof. Enzo Ballone dell'università degli studi Chieti - Pescara della facoltà di Medicina e Chirurgia riguardante: regressione e correlazione; relazione tra due variabili quantitative; regressione lineare semplice; metodo dei minimi quadrati; correlazione lineare semplice.


DETTAGLI
Esame: BIOSTATISTICA
Corso di laurea: Corso di laurea magistrale in medicina e chirurgia (ordinamento U.E. - 6 anni)
SSD:
A.A.: 2011-2012

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di BIOSTATISTICA e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Gabriele D'Annunzio - Unich o del prof Bellone Enzo.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Biostatistica

Probabilità - Statistica medica
Dispensa
Media aritmetica, moda e mediana - Statistica medica
Dispensa
Test chi quadro
Dispensa
Campionamento statistico
Dispensa