Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
N(∆, σ²CO)
∼
Di
Dove: ∆ = µB − µA è la differenza tra le medie dei trattamenti B e A (questo è ciò che vogliamo
• testare),
σ²CO = VAR(YiB − YiA) è la
• varianza della differenza, che è la somma delle varianze di YiB
e YiA, dato che le due variabili sono indipendenti.
Sistema di ipotesi
Il nostro obiettivo è verificare se la differenza tra i trattamenti è significativa. Definiamo quindi il
sistema di ipotesi come segue:
H₀: ∆ = 0 (l'ipotesi nulla afferma che non c'è differenza tra i trattamenti A e B),
• H₁: ∆ ≠ 0 (l'ipotesi alternativa afferma che esiste una differenza tra i trattamenti A e B).
•
Statistica del test
La statistica test che utilizziamo per verificare questa ipotesi è costruita sulla base della media
campionaria delle differenze. La media campionaria delle differenze è:
∆̂ = (ΣDi) / n
Dove: ΣDi è la somma delle differenze osservate tra i trattamenti A e B per ciascun paziente,
•
• n è il numero totale di pazienti nel campione.
∆̂ segue una distribuzione normale con valore atteso ∆ (la vera differenza
Questa media campionaria
σ²CO
tra le medie) e varianza / n, dove n è il numero di pazienti nel campione. Quindi:
∆̂ N(∆, σ²CO
∼ / n)
Per standardizzare questa statistica e renderla confrontabile con una distribuzione normale standard,
calcoliamo il valore di Z, che segue una distribuzione normale standard (media 0 e varianza 1):
− ∆) / (σ√CO
Z = (∆̂ / n) ∆̂ si discosta dalla differenza ipotizzata ∆, in
Questa formula ci dice quanto la media campionaria
termini di errori standard. Z segue una distribuzione normale standard, ovvero:
∼
Z N(0, 1)
Decisione del test
Per decidere se rifiutare l'ipotesi nulla, confrontiamo il valore calcolato di Z con i valori critici della
distribuzione normale standard, a seconda del livello di significatività scelto (ad esempio, α = 0.05).
Se |Z| è maggiore del valore critico, rifiutiamo l'ipotesi nulla e concludiamo che esiste una differenza
A e B. Altrimenti, non possiamo rifiutare H₀ e concludiamo che non c'è
significativa tra i trattamenti
evidenza sufficiente per affermare che i trattamenti sono differenti.
Esempio di calcolo
Supponiamo di avere i seguenti dati:
• La media delle differenze tra i trattamenti (∆̂ ) è 1.2,
La varianza combinata delle differenze (σ²CO) è 4,
•
• Il numero di pazienti nel campione (n) è 10,
La differenza ipotizzata sotto H₀ è ∆ = 0.
•
Calcoliamo la statistica Z:
1. Calcoliamo l'errore standard:
σ√CO / n = √(4) / √10 = 2 / √10 ≈ 0.632
2. Calcoliamo Z:
Z = (1.2 − 0) / 0.632 ≈ 1.9
Confrontiamo Z con il valore critico per un livello di significatività α = 0.05 (bilaterale). Il
3. valore critico per Z è circa 1.96.
Poiché |1.9| < 1.96, non possiamo rifiutare l'ipotesi nulla. Questo significa che non ci sono prove sufficienti
per affermare che esista una differenza significativa tra i trattamenti A e B.
Considerazioni importanti
• Assunzione di normalità: L'assunzione di normalità delle variabili YiA e YiB è cruciale. Se questa
assunzione non è valida, potrebbe essere necessario utilizzare test non parametrici, come il test di
Wilcoxon, che non richiedono che i dati seguano una distribuzione normale.
• Test bilaterale: In questo esempio, abbiamo utilizzato un test bilaterale, poiché stiamo testando se la
differenza tra i trattamenti è significativamente diversa da zero, senza specificare a priori quale
trattamento potrebbe essere migliore.
Introduzione al Test T
Quando si esegue un test per verificare la differenza tra due trattamenti (come nel caso degli esempi
precedenti), la variabilità della risposta (σ²CO) è un parametro sconosciuto. Pertanto, dobbiamo stimarlo
usando la varianza campionaria.
La varianza campionaria per le differenze tra i trattamenti è calcolata come:
S²CO = Σ(Di − D)² / (n − 1)
Dove:
• sono le differenze osservate per ciascun paziente (YiB − YiA),
Di
• D è la media campionaria delle differenze,
• n è il numero di pazienti.
Questa varianza è utilizzata per stimare la variabilità della differenza tra i trattamenti.
Statistica Test T
Ora che abbiamo una stima della varianza campionaria, sostituendo σ²CO con S²CO nell'espressione
di Z, otteniamo la statistica T:
T = (D − ∆) / (S√CO / √n)
Dove:
• D è la media campionaria delle differenze,
∆ è la differenza ipotizzata tra i trattamenti sotto l'ipotesi nulla (solitamente ∆ = 0),
• S√CO è la stima dell'errore standard delle differenze,
•
• n è il numero di pazienti.
Poiché la statistica T dipende da due variabili aleatorie (D e S²CO), essa non segue più una
distribuzione normale, ma segue una distribuzione t di Student. La distribuzione t dipende dai gradi
di libertà, che nel caso delle differenze tra trattamenti sono pari a n - 1, dove n è il numero di pazienti.
La distribuzione t di Student
La distribuzione t di Student, sotto l'ipotesi nulla (∆ = 0), è descritta da:
t(n − 1)
∼
T
Dove: t(n − 1) è la distribuzione t con
• n - 1 gradi di libertà.
Comportamento della distribuzione t
Man mano che il campione cresce (cioè, man mano che n aumenta), la stima della varianza S²CO
diventa più precisa e la distribuzione t di Student si avvicina a una distribuzione normale. In effetti,
n → ∞,
per la distribuzione t converge alla normale.
Esempio di Calcolo
Nel nostro esempio, le informazioni fornite sono le seguenti:
• D = 1.58 (media delle differenze),
• SCO = 1.23 (deviazione standard delle differenze),
• n = 10 (numero di pazienti).
La statistica test T è calcolata come:
T = (D − ∆) / (S√CO / √n)
Sostituendo i valori:
T = (1.58 − 0) / (1.23 / √10) T = 1.58 / (1.23 / 3.162) T = 1.58 / 0.389 T ≈ 4.062
Intervallo di Confidenza
Per calcolare l'intervallo di confidenza al 95%, utilizziamo la distribuzione t di Student con n - 1 = 9
α = 0.05
gradi di libertà. Il valore critico t per (test bilaterale) è:
t(α/2, 9) = 2.262
L'intervallo di confidenza per la differenza delle medie (∆) è dato da:
1) * (S√CO / √n)
IC = D ± t(α/2, n -
Sostituendo i valori:
IC = 1.58 ± 2.262 * (1.23 / √10) IC = 1.58 ± 2.262 * 0.389 IC = 1.58 ± 0.881
Quindi l'intervallo di confidenza è:
IC ≈ (0.70, 2.46)
Regione di Rifiuto
determinare se rifiutare l'ipotesi nulla (H₀: ∆ = 0), dobbiamo confrontare il valore di T con i valori
Per α = 0.05, t(α/2, 9) =
critici della distribuzione t. Per il valore critico per n - 1 = 9 gradi di libertà è
2.262.
La regione di rifiuto è quindi definita come:
R = {t : |t| > 2.262} = (−∞, −2.262] [2.262, +∞)
∪
Poiché il valore osservato di T (4.062) è maggiore di 2.262, rifiutiamo l'ipotesi nulla. In altre parole,
c'è evidenza sufficiente per affermare che la differenza tra i trattamenti A e B è statisticamente
significativa.
P-value
Il p-value è la probabilità di osservare un valore di T almeno grande quanto quello calcolato (4.062)
sotto l'ipotesi nulla. In questo caso, il p-value è 0.0028, che è molto inferiore al livello di significatività
α = 0.05. Questo significa che c'è una probabilità molto bassa di ottenere un valore di T così estremo
se l'ipotesi nulla fosse vera.
Il p-value fornisce una misura quantitativa dell'evidenza contro l'ipotesi nulla. Un p-value basso
(come 0.0028) indica che l'ipotesi nulla è molto improbabile, quindi possiamo rifiutarla con una
probabilità di errore di prima specie pari a 0.05.
Riepilogo delle Conclusioni
1. Test T: Abbiamo utilizzato la distribuzione t di Student per testare la differenza tra i
trattamenti A e B. T ≈ 4.062.
2. Statistica T calcolata:
3. Intervallo di confidenza: (0.70, 2.46).
4. Regione di rifiuto: |T| > 2.262.
5. Decisione: Poiché T è maggiore di 2.262, rifiutiamo l'ipotesi nulla.
6. P-value: 0.0028, che ci conferma la validità del rifiuto dell'ipotesi nulla.
Il risultato suggerisce che il trattamento B è significativamente migliore rispetto al trattamento A, con
una differenza tra i trattamenti che non è dovuta al caso.
Introduzione al modello con dati indipendenti
Nel caso in cui i pazienti vengano assegnati in modo casuale ai trattamenti (gruppo A e gruppo B), le
risposte osservate nei due gruppi sono indipendenti l'una dall'altra. Quindi, supponiamo che:
N(µA, σA²), per i pazienti del gruppo A (i = 1, ..., nA),
• ∼
YiA N(µB, σB²), per i pazienti del gruppo B (j = 1, ..., nB).
• ∼
YjB
Media e deviazione standard
Poiché i due gruppi sono indipendenti, le variabili di risposta per ciascun gruppo hanno media µA e
µB e deviazioni standard σA e σB rispettivamente. La media campionaria per ciascun gruppo sarà
distribuita normalmente:
N(µA, σA²/nA),
• ∼
Y_A N(µB, σB²/nB).
• ∼
Y_B
Le ipotesi
Nel test per la differenza tra i due trattamenti, formuliamo il sistema di ipotesi per verificare se i due
trattamenti hanno lo stesso effetto sulla variabile risposta (ore di sonno):
H₀:
• µA = µB (ipotesi nulla: non c'è differenza tra i trattamenti),
H₁: µA ≠ µB (ipotesi alternativa: i trattamenti sono diversi).
•
Equivalente a:
H₀: µA − µB = 0 (ipotesi nulla: la differenza tra le medie è zero),
• H₁: µA − µB ≠ 0 (ipotesi alternativa: la differenza tra le medie è diversa da zero).
•
Test preliminare: Test F di Fisher per la verifica delle varianze
Nel test t per campioni indipendenti, una delle assunzioni fondamentali è che le varianze delle due
popolazioni siano uguali. Questo implica che la variabilità nella risposta ai trattamenti sia simile nei
due gruppi. Tuttavia, prima di applicare il test t, è necessario verificare questa ipotesi.