Anteprima
Vedrai una selezione di 10 pagine su 219
Calcolo delle probabilità e inferenza statistica Pag. 1 Calcolo delle probabilità e inferenza statistica Pag. 2
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 6
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 11
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 16
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 21
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 26
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 31
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 36
Anteprima di 10 pagg. su 219.
Scarica il documento per vederlo tutto.
Calcolo delle probabilità e inferenza statistica Pag. 41
1 su 219
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

N(∆, σ²CO)

Di

Dove: ∆ = µB − µA è la differenza tra le medie dei trattamenti B e A (questo è ciò che vogliamo

• testare),

σ²CO = VAR(YiB − YiA) è la

• varianza della differenza, che è la somma delle varianze di YiB

e YiA, dato che le due variabili sono indipendenti.

Sistema di ipotesi

Il nostro obiettivo è verificare se la differenza tra i trattamenti è significativa. Definiamo quindi il

sistema di ipotesi come segue:

H₀: ∆ = 0 (l'ipotesi nulla afferma che non c'è differenza tra i trattamenti A e B),

• H₁: ∆ ≠ 0 (l'ipotesi alternativa afferma che esiste una differenza tra i trattamenti A e B).

Statistica del test

La statistica test che utilizziamo per verificare questa ipotesi è costruita sulla base della media

campionaria delle differenze. La media campionaria delle differenze è:

∆̂ = (ΣDi) / n

Dove: ΣDi è la somma delle differenze osservate tra i trattamenti A e B per ciascun paziente,

• n è il numero totale di pazienti nel campione.

∆̂ segue una distribuzione normale con valore atteso ∆ (la vera differenza

Questa media campionaria

σ²CO

tra le medie) e varianza / n, dove n è il numero di pazienti nel campione. Quindi:

∆̂ N(∆, σ²CO

∼ / n)

Per standardizzare questa statistica e renderla confrontabile con una distribuzione normale standard,

calcoliamo il valore di Z, che segue una distribuzione normale standard (media 0 e varianza 1):

− ∆) / (σ√CO

Z = (∆̂ / n) ∆̂ si discosta dalla differenza ipotizzata ∆, in

Questa formula ci dice quanto la media campionaria

termini di errori standard. Z segue una distribuzione normale standard, ovvero:

Z N(0, 1)

Decisione del test

Per decidere se rifiutare l'ipotesi nulla, confrontiamo il valore calcolato di Z con i valori critici della

distribuzione normale standard, a seconda del livello di significatività scelto (ad esempio, α = 0.05).

Se |Z| è maggiore del valore critico, rifiutiamo l'ipotesi nulla e concludiamo che esiste una differenza

A e B. Altrimenti, non possiamo rifiutare H₀ e concludiamo che non c'è

significativa tra i trattamenti

evidenza sufficiente per affermare che i trattamenti sono differenti.

Esempio di calcolo

Supponiamo di avere i seguenti dati:

• La media delle differenze tra i trattamenti (∆̂ ) è 1.2,

La varianza combinata delle differenze (σ²CO) è 4,

• Il numero di pazienti nel campione (n) è 10,

La differenza ipotizzata sotto H₀ è ∆ = 0.

Calcoliamo la statistica Z:

1. Calcoliamo l'errore standard:

σ√CO / n = √(4) / √10 = 2 / √10 ≈ 0.632

2. Calcoliamo Z:

Z = (1.2 − 0) / 0.632 ≈ 1.9

Confrontiamo Z con il valore critico per un livello di significatività α = 0.05 (bilaterale). Il

3. valore critico per Z è circa 1.96.

Poiché |1.9| < 1.96, non possiamo rifiutare l'ipotesi nulla. Questo significa che non ci sono prove sufficienti

per affermare che esista una differenza significativa tra i trattamenti A e B.

Considerazioni importanti

• Assunzione di normalità: L'assunzione di normalità delle variabili YiA e YiB è cruciale. Se questa

assunzione non è valida, potrebbe essere necessario utilizzare test non parametrici, come il test di

Wilcoxon, che non richiedono che i dati seguano una distribuzione normale.

• Test bilaterale: In questo esempio, abbiamo utilizzato un test bilaterale, poiché stiamo testando se la

differenza tra i trattamenti è significativamente diversa da zero, senza specificare a priori quale

trattamento potrebbe essere migliore.

Introduzione al Test T

Quando si esegue un test per verificare la differenza tra due trattamenti (come nel caso degli esempi

precedenti), la variabilità della risposta (σ²CO) è un parametro sconosciuto. Pertanto, dobbiamo stimarlo

usando la varianza campionaria.

La varianza campionaria per le differenze tra i trattamenti è calcolata come:

S²CO = Σ(Di − D)² / (n − 1)

Dove:

• sono le differenze osservate per ciascun paziente (YiB − YiA),

Di

• D è la media campionaria delle differenze,

• n è il numero di pazienti.

Questa varianza è utilizzata per stimare la variabilità della differenza tra i trattamenti.

Statistica Test T

Ora che abbiamo una stima della varianza campionaria, sostituendo σ²CO con S²CO nell'espressione

di Z, otteniamo la statistica T:

T = (D − ∆) / (S√CO / √n)

Dove:

• D è la media campionaria delle differenze,

∆ è la differenza ipotizzata tra i trattamenti sotto l'ipotesi nulla (solitamente ∆ = 0),

• S√CO è la stima dell'errore standard delle differenze,

• n è il numero di pazienti.

Poiché la statistica T dipende da due variabili aleatorie (D e S²CO), essa non segue più una

distribuzione normale, ma segue una distribuzione t di Student. La distribuzione t dipende dai gradi

di libertà, che nel caso delle differenze tra trattamenti sono pari a n - 1, dove n è il numero di pazienti.

La distribuzione t di Student

La distribuzione t di Student, sotto l'ipotesi nulla (∆ = 0), è descritta da:

t(n − 1)

T

Dove: t(n − 1) è la distribuzione t con

• n - 1 gradi di libertà.

Comportamento della distribuzione t

Man mano che il campione cresce (cioè, man mano che n aumenta), la stima della varianza S²CO

diventa più precisa e la distribuzione t di Student si avvicina a una distribuzione normale. In effetti,

n → ∞,

per la distribuzione t converge alla normale.

Esempio di Calcolo

Nel nostro esempio, le informazioni fornite sono le seguenti:

• D = 1.58 (media delle differenze),

• SCO = 1.23 (deviazione standard delle differenze),

• n = 10 (numero di pazienti).

La statistica test T è calcolata come:

T = (D − ∆) / (S√CO / √n)

Sostituendo i valori:

T = (1.58 − 0) / (1.23 / √10) T = 1.58 / (1.23 / 3.162) T = 1.58 / 0.389 T ≈ 4.062

Intervallo di Confidenza

Per calcolare l'intervallo di confidenza al 95%, utilizziamo la distribuzione t di Student con n - 1 = 9

α = 0.05

gradi di libertà. Il valore critico t per (test bilaterale) è:

t(α/2, 9) = 2.262

L'intervallo di confidenza per la differenza delle medie (∆) è dato da:

1) * (S√CO / √n)

IC = D ± t(α/2, n -

Sostituendo i valori:

IC = 1.58 ± 2.262 * (1.23 / √10) IC = 1.58 ± 2.262 * 0.389 IC = 1.58 ± 0.881

Quindi l'intervallo di confidenza è:

IC ≈ (0.70, 2.46)

Regione di Rifiuto

determinare se rifiutare l'ipotesi nulla (H₀: ∆ = 0), dobbiamo confrontare il valore di T con i valori

Per α = 0.05, t(α/2, 9) =

critici della distribuzione t. Per il valore critico per n - 1 = 9 gradi di libertà è

2.262.

La regione di rifiuto è quindi definita come:

R = {t : |t| > 2.262} = (−∞, −2.262] [2.262, +∞)

Poiché il valore osservato di T (4.062) è maggiore di 2.262, rifiutiamo l'ipotesi nulla. In altre parole,

c'è evidenza sufficiente per affermare che la differenza tra i trattamenti A e B è statisticamente

significativa.

P-value

Il p-value è la probabilità di osservare un valore di T almeno grande quanto quello calcolato (4.062)

sotto l'ipotesi nulla. In questo caso, il p-value è 0.0028, che è molto inferiore al livello di significatività

α = 0.05. Questo significa che c'è una probabilità molto bassa di ottenere un valore di T così estremo

se l'ipotesi nulla fosse vera.

Il p-value fornisce una misura quantitativa dell'evidenza contro l'ipotesi nulla. Un p-value basso

(come 0.0028) indica che l'ipotesi nulla è molto improbabile, quindi possiamo rifiutarla con una

probabilità di errore di prima specie pari a 0.05.

Riepilogo delle Conclusioni

1. Test T: Abbiamo utilizzato la distribuzione t di Student per testare la differenza tra i

trattamenti A e B. T ≈ 4.062.

2. Statistica T calcolata:

3. Intervallo di confidenza: (0.70, 2.46).

4. Regione di rifiuto: |T| > 2.262.

5. Decisione: Poiché T è maggiore di 2.262, rifiutiamo l'ipotesi nulla.

6. P-value: 0.0028, che ci conferma la validità del rifiuto dell'ipotesi nulla.

Il risultato suggerisce che il trattamento B è significativamente migliore rispetto al trattamento A, con

una differenza tra i trattamenti che non è dovuta al caso.

Introduzione al modello con dati indipendenti

Nel caso in cui i pazienti vengano assegnati in modo casuale ai trattamenti (gruppo A e gruppo B), le

risposte osservate nei due gruppi sono indipendenti l'una dall'altra. Quindi, supponiamo che:

N(µA, σA²), per i pazienti del gruppo A (i = 1, ..., nA),

• ∼

YiA N(µB, σB²), per i pazienti del gruppo B (j = 1, ..., nB).

• ∼

YjB

Media e deviazione standard

Poiché i due gruppi sono indipendenti, le variabili di risposta per ciascun gruppo hanno media µA e

µB e deviazioni standard σA e σB rispettivamente. La media campionaria per ciascun gruppo sarà

distribuita normalmente:

N(µA, σA²/nA),

• ∼

Y_A N(µB, σB²/nB).

• ∼

Y_B

Le ipotesi

Nel test per la differenza tra i due trattamenti, formuliamo il sistema di ipotesi per verificare se i due

trattamenti hanno lo stesso effetto sulla variabile risposta (ore di sonno):

H₀:

• µA = µB (ipotesi nulla: non c'è differenza tra i trattamenti),

H₁: µA ≠ µB (ipotesi alternativa: i trattamenti sono diversi).

Equivalente a:

H₀: µA − µB = 0 (ipotesi nulla: la differenza tra le medie è zero),

• H₁: µA − µB ≠ 0 (ipotesi alternativa: la differenza tra le medie è diversa da zero).

Test preliminare: Test F di Fisher per la verifica delle varianze

Nel test t per campioni indipendenti, una delle assunzioni fondamentali è che le varianze delle due

popolazioni siano uguali. Questo implica che la variabilità nella risposta ai trattamenti sia simile nei

due gruppi. Tuttavia, prima di applicare il test t, è necessario verificare questa ipotesi.

Dettagli
Publisher
A.A. 2024-2025
219 pagine
SSD Scienze mediche MED/01 Statistica medica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher leandro.92 di informazioni apprese con la frequenza delle lezioni di Statistica biomedica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma Tor Vergata o del prof Nardi Alessandra.