Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STATISTICA MEDICA
L'altra volta abbiamo visto degli esempi in cui si supponeva di conoscere già media e DS della popolazione in esame, nella realtà però non è quasi mai possibile - normalmente si confrontano fra loro dei campioni provenienti da popolazioni ignote. Quindi dobbiamo introdurre un nuovo concetto: grado di libertà. È il numero di modi in cui io posso cambiare la composizione del gruppo senza cambiare il vincolo. Il vincolo di un campione è la sua media. In altre parole, se ho un gruppo di n soggetti, in quanti modi posso modificare il campione mantenendo lo stesso valore medio?
Esempio: Supponiamo di avere un campione che ha 3 valori (1, 2, 3). Media = 2. Se cambio un valore solo cambia anche la media. Se invece cambio due valori - sostituisco 1 e 3 con 0,5 e 3,5 - ottengo la stessa media! Posso cambiarli anche tutti e 3 - 1,5 - 2 - 2,5. Media sempre 2! Quindi in quanti modi posso cambiare il mio campione?
senza cambiare il valor medio? Ocambio 2 valori o ne cambio 3 —> quindi ho 2 gradi di libertà. Se avessi 10 soggetti neposso cambiarne 2 o 3 o 4 … fino a 10. Quindi i gradi di libertà saranno 9. Teniamo quindicome regola generale: grado di libertà = n -1. 10 soggetti - grado di libertà 9, 25 soggetti -grado di libertà 24 e così via. Gradi di libertà = df o gl.Supponiamo ora di conoscere la media della popolazione ma non la DS. Quindi se stiamoguardando se un campione appartiene alla popolazione, utilizziamo la DS che calcoliamoper il campione (è l’unica che possiamo calcolare). Non è detto però che questa DS siauguale a quella della popolazione. Più n del campione è grande più la DS che otterremosarà simile alla DS della popolazione (se invece n è piccolo c’è la probabilità che si allontanimaggiormente dalla DS della popolazione). Quindidevo utilizzare una distribuzione la cui ampiezza (incertezza) dipenda in modo inverso da n (n di soggetti in un campione) e di conseguenza dai gradi di libertà (essendo n - 1). Se n è piccolo dobbiamo avere una distribuzione molto più larga rispetto alla normale, perché ho molta più incertezza legata alla definizione della DS. Al contrario se n è molto grande, posso considerare la distribuzione normale come riferimento (quindi la distribuzione è molto simile a z, ovvero la distribuzione normale). Mi serve dunque una distribuzione che dipenda da n. Questa distribuzione si chiama t di student. La t di student è fatta in modo molto simile alla normale ma la sua larghezza dipende dai gradi di libertà -> tanto più bassi sono i gradi di libertà tanto più questa distribuzione sarà schiacciata e avrà maggior incertezza. 1 mercoledì 18 novembre 2020 Se utilizzo una distribuzione che dipende dailibertà, utilizzo il valore di t corrispondente a una distribuzione normale standard (z). Altrimenti, cerco il valore di t nella tabella dei valori critici della distribuzione t di Student, utilizzando i gradi di libertà corrispondenti. Il parametro t viene calcolato come il rapporto tra la differenza tra il valore medio del campione e il valore medio della popolazione diviso per la deviazione standard del campione diviso per la radice quadrata del numero di dati. Nel calcolo, utilizzo la deviazione standard del campione perché sto utilizzando la distribuzione t di Student anziché la distribuzione normale. La curva nera nel grafico rappresenta la distribuzione normale. Quando i gradi di libertà diminuiscono, la curva si abbassa rispetto alla normale e ha code più larghe, indicando una maggiore variabilità. Questo accade quando utilizzo la distribuzione t di Student. Dal punto di vista pratico, il calcolo è semplice perché esistono tabelle predefinite (come quelle per la distribuzione z). Basta cercare i gradi di libertà nella prima colonna della tabella e trovare il valore corrispondente di t.libertà ladistribuzione è uguale allanormale. Man mano chediminuiscono i gradi di libertà ivalori di t cambiano. Comunquedal punto di vista dei calcolicambia solo che qua uso letabelle della distribuzione t eprima usavo quelle delladistribuzione z.
2 mercoledì 18 novembre 2020
Ridefiniamo il teorema del limitecentrale in questa situazione: se noiabbiamo una popolazione dipartenza con valor medio noto e DSignota ed estraggo infiniti campionidi grandezza n —> la distribuzionedi campionamento con n -1 (gradi dilibertà) sarà una t di student che havalor medio u e larghezza s/radicedi n dove s è la DS del campione.Ovviamente suppongo che tutti le DSdei vari campioni siano simili fraloro e quindi il nostro s è una DSmedia dei nostri campioni.Il fatto di usare la DS del campionefa sì che io abbia più incertezzanella curva che mi descrive ladistribuzione di campionamento —> la maggior incertezza la vedo
perché le code sono piùallargate rispetto alla curva normale (grigia). Unica a differenza rispetto a quello visto l’altra volta (z): qua usiamo la DS del campione e la distribuzione t di student. Anche in questo caso però conosciamo la media della popolazione, ma nella maggior parte dei casi in realtà non conosceremo nemmeno questa (quindi sia media che DS ignote). Quindi dovremo confrontare tra loro dei campioni che vengono da popolazioni ignote. Il caso più frequente è quello in cui si confrontano le medie di due campioni. —> quindi andiamo a vedere la probabilità che le due medie siano uguali. Andiamo a verificare se l’ipotesi nulla è vera. Se la probabilità che si verifichi l’ipotesi nulla è inferiore al 5% concludiamo che l'ipotesi nulla non è vera e dunque che c’è una differenza significativa fra le due medie. In base al tipo di disegno dello studio che abbiamo decideremo se
Quando abbiamo campioni appaiati?
Quando, ad esempio, andiamo a vedere se c'è una differenza di valori in una determinata variabile tra due tempi diversi negli stessi soggetti. Prendo dei parametri vitali di dei bambini alla nascita e li vado a rivedere dopo 3 mesi (guardo la differenza che c'è). Lo studio in questo caso può essere longitudinale (seguendo i pazienti nel tempo) oppure sperimentale.
Mercoledì 18 novembre 2020.
Quando abbiamo campioni indipendenti?
Quando confrontiamo campioni di soggetti diversi tra loro e quindi totalmente indipendenti gli uni dagli altri. Ad esempio, bambini nati prematuri e bambini nati a termine. Abbiamo due gruppi di pazienti totalmente slegati fra loro. I casi più frequenti in cui abbiamo campioni indipendenti sono gli studi trasversali e gli studi caso-controllo.
QUINDI IN BASE ALLO STUDIO CHE...
FACCIAMO DOBBIAMO RIVOLGERCI A TEST STATISTICI DIVERSI. Alcuni casi di altri possibili appaiamenti tra dati: —> il più importante. Da ricordare solo questo. (DA RICORDARE SOLO CONCETTI PRINCIPALI NON FORMULE)- CAMPIONI APPAIATI: Qui il vantaggio è che ogni soggetto è controllo di se stesso e dunque posso più facilmente controllare eventuali fattori di confondimento che ci sono nei soggetti. Perché per esempio al tempo 2 i soggetti sono gli stessi che al tempo 1 (non ho la variabilità di 2 gruppi ma di 1 solo). X1: tempo 1, X2: tempo 2. Come faccio a vedere se c'è una differenza fra i due tempi? Calcolare la variabile differenza (d) —> differenza fra X2 e X1. Nella tabella vediamo i calcoli. Di questa variabile d posso calcolare la media e la DS. Che media mi aspetto? Che non ci sia differenza fra i due tempi e dunque che sia 0. Quindi ricado nel caso di prima in cui la media è nota e la DS no. Non conosco la media.
dellapopolazione ma quella del campione si,ovvero la media della variabile differenza.
4 mercoledì 18 novembre 2020
Possiamo applicare quindi la formula vista prima: —> valor media del campione - 0 /Sd su radice di n. Dove Sd è la DSdella variabile differenza.
Quindi vale il teorema del limitecentrale: se ho una popolazione cheha media 0 e DS σ (non nota) eestraggo infiniti campioni digrandezza n, avrò una distribuzionedi campionamento che ha comeforma una t di student e che hamedia 0 e larghezza Sd/radice di n(dove Sd è la DS del campione).
Trovo t dalla tabelle pretende e riesco a risalire al valore della probabilità (p).
Esempio calcolo:
Poi vado a vedere nella tabella di prima 2,98 a cosa corrisponde. Con 9 gradi di libertà, 2,98a due code mi risulta che ho una significatività compresa tra 0,01 e 0,02. Quindi concludoche la mia differenza è significativa perché < di 0,05 (5%).
5 mercoledì 18 novembre
2020Altro esempio: Ho un parametro misurato in 2 tempi diversi. La media da inizio turno a fine turno cambia. Voglio calcolare la differenza tra queste, ovvero la variabile differenza che è uguale alla differenza tra le medie.
Suppongo che Sd sia 7,4 (deviazione standard della variabile differenza). Abbiamo 8 gradi di libertà (9 - 1), quindi calcoleremo t con 8 gradi di libertà: valore medio osservato - 0 / 7,4 (deviazione standard di d) / radice di 9. Otteniamo 3,69 e quindi la p è 0,006 -> differenza tra IT e FT significativa (quindi molto improbabile che la differenza sia casuale).
2. CAMPIONI INDIPENDENTI: Caso più complesso perché ho due gruppi diversi (es. sani e malati) e quindi 2 medie, 2 deviazioni standard, ma soprattutto 2 numeri di soggetti (non è detto che il numero di soggetti nel campione 1 debba essere per forza lo stesso del campione 2, es. 100 soggetti sani e 30 malati). -> ho variabilità interindividuale in entrambi i gruppi e quindi posso avere molte
più variabili di confondimento.
Quanti gradi di libertà abbiamo? Sommo i gradi di libertà del campione 1 a quelli del campione 2. Quindi se ho n soggetti nel campione 1 e n soggetti nel campo 2, farò (n - 1)1 2 1+ ( n - 1) = sommiamo tutti i soggetti togliamo 2.2
Per fare questo test dobbiamo avere alcune ipotesi:
- Che i campioni di partenza provengano da una distribuzione normale (gaussiana) edunque che siano normali a loro volta (essendo statistica parametrica e quindi basata su media e DS);
- E che ci sia omoscedasticità: i 2 campioni dovrebbero avere varianze simili.