vuoi
o PayPal
tutte le volte che vuoi
REGOLE PER PREPARARE TABELLE
Le tabelle devono avere chiare didascalie
Si devono indicare i totali
Devono essere chiaramente indicate le unità di misura
Le tabelle non devono essere complesse
MEDIA: aritmetica o geometrica
SINTESI DEI DATI n√(xMA=Σ∗∤n o MG = )(x )…(x )1 2 n
Posizione o tendenza centrale
MEDIANA: cioè posta nel bel mezzo
Es: 34, 64, 68, 70, 74
MODA: frequenza con cui si verifica una osservazione
Dispersione o variazione
Picchi stretti e netti: Grado di asimmetria
leptocurtiche
Grado di accentramento di una distribuzione (curtosi)
Picchi ampi e bassi: platicurtiche
Calcolo degli scarti: (x – m) , dove m è la media
DEVIAZIONE MEDIA Σ(∗−m)/n 2
V(x) = – 1 VARIANZA Σ(∗−m) /n
I gradi di liberta (g.l) si riferiscono al numero di quantità indipendenti tra tutte quelle osservate. Sono il numero totale di quantità presenti nell'insieme meno il numero di vincoli imposti alle
quantità stesse. DEVIAZIONE STANDARD (DS) DS(x) = V(x)√ Sorgenti di dispersione in medicina Biologiche: età, sesso, razza, anamnesi medica. Temporale: variazioni dello stato emotivo, dei ritmi cardiaci. Errore di misura: dovuti all'osservatore, agli strumenti, etc... STATISTICA ANAGRAFICA Tassi di mortalità: i tassi costituiscono l'elemento essenziale dei metodi statistici anagrafici. In questo caso, il tasso è definito: N morti (in un periodo)/popolazione a rischio Il tasso grezzo di mortalità annuale è definito come il numero totale delle morti in un anno, diviso il numero totale dei soggetti componenti la popolazione a metà anno. Esistono i tassi di morte specifici, come ad esempio il tasso di mortalità infantile. Tassi di morbosità: danno l'informazione circa l'effetto di una malattia su una popolazione. N casi malattia/popolazione a rischio Il tasso di prevalenza si riferisce ai casi.Il tasso d'incidenza si riferisce al numero dei nuovi casi della malattia. Una tavola di sopravvivenza della popolazione è un modo conveniente per sintetizzare l'esperienza di mortalità di una larga comunità, come una regione o una nazione.
La teoria della probabilità costituisce il supporto matematico dei metodi per eseguire inferenze statistiche, cioè indagini o esperimenti basati su una verifica delle ipotesi, che porta ad accettarla o rifiutarla.
La probabilità di un evento è la frequenza relativa con cui l'evento si verifica in una lunga serie di prove ripetute in condizioni simili. L'evento complementare è il non verificarsi dell'evento stesso. Pr(A)=[1 - Pr(A)]
Due eventi che non possono verificarsi insieme sono definiti come eventi che si escludono a vicenda (mutuamente esclusivi). Pr(A) o (B) = Pr(A) + Pr(B)
PRINCIPIO
DELLA SOMMAA = n /n (numero di casi favorevoli/numero totale di eventi)
ATalvolta le probabilità di verificarsi di un particolare evento dipende dal verificarsi diun altro evento. (probabilità condizionali)
Pr (B/A) Probabilità che si verifichi l’evento B, dato chel’evento A si è già verificato.
Pr(A e B) = Pr(B/A) Pr(A) Principio del prodotto
*LA DISTRIBUZIONE NORMALE
La distribuzione normale o gaussiana ha un ruolo importante nelle tecniche diinferenza statistica. L’aggiustamento dei dati avviene tramite trasformazione logaritmica,cioè il calcolo logaritmico di ciascuna osservazione.
La distribuzione normale è una distribuzione di probabilità continua teorica. È definitada due quantità: la sua media () e la DS ().
Cambiando si avrà uno spostamento dell’intera curva lungo l’asse delle ascisse.,Cambiando si cambia il grado di dispersione. La distribuzione è unimodale, o
La forma di σ, campana, simmetrica intorno ad x = μ = 0, σ = 1 curva normale standardizzata
μ σz = x - μ / rapporto critico μ σ
INFERENZA SULLE MEDIE
L'inferenza statistica è il processo per mezzo del quale dai risultati osservati in un campione si possono trarre conclusioni riguardanti le popolazioni. La forza dell'inferenza dipende dalla dimensione del campione (maggiore è la dimensione, più forte è l'inferenza), dalla variabilità della risposta oggetto di studio (minore è la variabilità, più forte è l'inferenza)
DISTRIBUZIONE DELLA CAMPIONAMENTO
POPOLAZIONE Procedura di campionamento all'infinito. Campione di n osservazioni, determinazione della media e reintroduzione delle osservazioni nella popolazione.
DISTRIBUZIONE DI CAMPIONAMENTO DELLE MEDIE DEI CAMPIONI DI DIMENSIONE N
La media delle distribuzione di campionamento delle medie è eguale alla media della
popolazione μ. La DS della distribuzione è .
· σ/√nLa forma della distribuzione è incirca normale.
·Z = m - μ RAPPORTO CRITICOσ/√nDS ERRORE STANDARD DELLA MEDIA ES(m) = σ/√n2V(m) = [ES(m)] VARIANZA DELLA MEDIA
Una qualsiasi quantità calcolata su un campione è chiamata statistica campionaria. Ogni statistica campionaria ha una distribuzione di campionamento e la DS della distribuzione di campionamento risultante è definita errore standard della statistica.
TEST DI SIGNIFICATIVITÀ SU UNA MEDIA
Basi logiche per saggiare le ipotesi statistiche. Si accetta o si rifiuta (media della popolazione). Un test richiede:
1. un’affermazione che la media della popolazione è un particolare valore μ 0.
2. probabilità sufficientemente piccola da fornire una ragionevole evidenza contro è chiamato livello di significatività, cioè il rischio di rifiutare erroneamente l’ipotesi nulla, α 0.
quando in realtà è vera. L'errore indica la probabilità di non rifiutare erroneamente l'ipotesi nulla quando in realtà è falsa.
gli scostamenti da in una o ambedue le direzioni. H : =μ μ μ0 0 0
Risultati statisticamente Test ad una o due code significativi e non significativi Valore vero > o < H0
Test ad una coda di destra Valore vero > H0
LIMITI DI CONFIDENZA: si basa sulle proprietà della distribuzione delle medie campionarie. Modo alternativo di eseguire un'inferenza circa un parametro della popolazione in base alle osservazioni su campione.
DISTRIBUZIONE t : si utilizza quando è ignota. È una distribuzione di probabilità σ teorica ed è definita da una funzione matematica. È simmetrica, a forma di campana, simile alla gaussiana, ma più dispersa. Questa distribuzione implica un fattore addizionale e i gradi di libertà.
CONFRONTO DI MEDIE: dato che la maggior parte
della medicina è comparativa. Due campioni di osservazioni da due popolazioni, le cui medie sono μ1 e μ2, e le deviazioni standard sono σ1 e σ2. Assumendo che l'ipotesi nulla H0: μ1 - μ2 = 0 sia vera, si determina la probabilità di ottenere una differenza tra le medie campionarie così grandi o ancor maggiori di quelle osservate. Se questa probabilità è sufficientemente piccola, vi è una ragionevole evidenza per dubitare di H0. CAMPIONI INDIPENDENTI E NON Ciascuna osservazione in un campione si accoppia con una sola osservazione dell'altro. Non è necessario che i numeri delle osservazioni del gruppo di controllo siano gli stessi. - Autoaccoppiamento: il soggetto serve come controllo di se stesso. - Naturalmente accoppiate: per nascita o per luogo. - Appaiamento artificiale: appaiare soggetti per caratteristiche importanti in modo che i membri di un paio siano il più possibile simili fra loro.loro. L'ultimo punto riserva due difficoltà: si richiede una conoscenza a priori delle caratteristiche rilevanti; quando le caratteristiche sono note e molte, diventa difficile ottenere un appaiamento considerando tutti i fattori. Scopo è creare omogeneità entro il paio. Z = d - 0 /σ /√nd INFERENZA SULLE PROPORZIONI La metodologia dell'inferenza statistica si può estendere ai dati che si ottengono per enumerazione, precisamente, all'analisi delle proporzioni. La distribuzione binomiale fornisce la base per l'analisi dei dati che si ottengono per enumerazione e per l'analisi delle proporzioni. Questa distribuzione riguarda n prove indipendenti con una probabilità costante di successo in ciascuna prova. La probabilità π di x successi in n prove è: x n - xn! (1 - π) π*x! (n - x)! Man mano che n aumenta, la distribuzione binomiale sempre più rassomiglia ad una distribuzione normale. La regolaGeneralmente si dice che quando nπ e n(1 - π) sono di grandezza 5 o più, la distribuzione normale si può usare come alternativa alla binomiale. Si considerino campioni ripetuti di dimensioni n da una popolazione. Ogni campione consiste in una serie di osservazioni di 1 e 0; la media per il campione è la proporzione di 1 nel campione, ed è denotata p. L'applicazione delle tre proprietà della distribuzione delle medie dà:
- La media delle medie campionarie (o proporzioni in questo caso) di campioni ripetuti di dimensioni n è quella della media della popolazione, precisamente π.
- L'errore standard della media è √(π(1 - π)/n).
- La forma è approssimativamente normale posto che n sia sufficientemente grande.
Per ottenere limiti di confidenza al 95% di una proporzione si applica:
p ± 1,96 √(pq/n)
Esempio: si consideri il tasso osservato di attacco del 56% di polmonite atipica in un campione di 25 uomini.
Quali sono i limiti di confidenza al 95% del tasso di attacco della popolazione sottostante? Risposta: 0,56 1,96 (0,56)(0,44)/25 ± √0,56 0,195 ± 0,365 – 0,755 Così si ha la certezza al 95% che, nella popolazione, il tasso di attacco è all'incirca in un intervallo oscillante dal 36.5% al 75.5%. Campione Gruppo sottoposto a Gruppo di controllo Totale trattamento Popolazione Proporzione di π πT C successi Campione Di