Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Analisi statistica
Analizzando mediante tecniche e procedimenti statistici, andiamo ad analizzare le informazioni raccolte su un campione (o su una popolazione).
La statistica descrittiva risponde al concetto di tecnica (insieme di tecniche che ci hanno permesso di raccogliere i dati su ogni unità statistica). Dobbiamo capire quale tecnica e quale formula scegliere, quale è la più appropriata.
Queste tecniche si dividono in due:
- Tecniche di classificazione: che ci consentono di classificare le informazioni che abbiamo raccolto di due variabili contemporaneamente.
- Tecniche di sintetizzazione: una variabile alla volta.
Queste tecniche possono essere applicate ad entrambi i tipi di variabili. Le tecniche che sintetizzano le informazioni non possono essere applicate sempre ma solo alle variabili quantitative, non importa se discrete o continue.
Come classificare: Classificare significa costruire tabelle semplici (le unità statistiche vengono...
Modo di essere | Frequenza assoluta | Frequenza relativa | Frequenza relativa percentuale |
---|---|---|---|
M | 201 |
201/500 X1000.40 40%F 299 299/500 X1000.6 60%500 1.0 100%
Se ottenessi più di 1.0 nel totale della frequenza relativa, mi devo allarmare perche ho sbagliatoqualcosa sicuramente.
Qual è la frequenza percentuale dei M nello schema? Il 40% dei soggetti campionati è di generemaschile.
SESSO Freq.
Caso a: si osservano 25 ricoverati in una clinica Ass.cardiologica, di questi 20 hanno ipertensione arteriosa.
M 201
Caso b: si osservano 50 soggetti in un centro di prevenzione cardiovascolare nella stessa
F 299
settimana. 500
Freq. Freq.
Ass. Rel.
A 20 20/25 80%0.8
B 20 20/50 40%0.440
La frequenza di ipertensione nei due casi è diversa, è 80% nel campione di soggetti nella clinicacardiovascolare e 40% nel centro di prevenzione cardiovascolare la frequenza di ipertensionedella clinica A è doppia rispetto a quella del centro di prevenzione B.
Caso dei 500 pz di cardiochirurgia: 25 rispondenti hanno detto di aver sofferto diAngina pectoris nei giorni
Colesterolo Freq. Ass.(mg/100ml) | |
---|---|
140 | 2 |
142 | 4 |
143 | 11 |
144 | 1 |
... | 1 |
285 | 4 |
287 | 2 |
296 | 15 |
500 | 0 |
Perché se sono alti, perderei informazioni e quindi frequenze troppo piccole, ma anche non troppo basso perché perderei valori fondamentali.
Colesterolo
Freq. Ass. | Freq. Rel. | Cumulata | % | % Cumulata |
---|---|---|---|---|
[140-160) | 20 | 0,04 | 0,04 | 4 |
[160-180) | 55 | 0,11 | 0,15 | 11 |
[180-200) | 110 | 0,22 | 0,37 | 22 |
[200-220) | 120 | 0,24 | 0,61 | 24 |
[220-240) | 95 | 0,19 | 0,80 | 19 |
[240-260) | 50 | 0,1 | 0,90 | 10 |
[260-280) | 35 | 0,07 | 0,97 | 7 |
[280-..) | 15 | 0,03 | 1 | 3 |
La parentesi quadra incluso e parentesi tonda escluso. Quindi l'estremo superiore della classe è escluso e l'estremo inferiore della classe è incluso. Senza soluzione di continuità, non può esserci mai un buco.
Tabella a doppia entrata: sesso + tipo di intervento:
SESSO/INTERVENTO | By Pass | Valvola | Riduzione | Trapianto |
---|---|---|---|---|
M | 30 | 120 | 11 | 40 |
F | 50 | 160 | 29 | 60 |
Freq. Marginale | 80 | 280 | 40 | 100 |
500Colonna
Le caselle ocra sono le frequenze assolute congiunte.
Distribuzione di frequenza subordinata:
Esercizi:
- Costruire la distribuzione di freq. % della variabile tipo di intervento entro (stosubordinando) la variabile sesso.
- Costruire la distribuzione di freq. % della variabile sesso entro la variabile tipo di intervento.
- By pass Valvola Riduzione Trapianto
- M 0.149 0,597 0,054 0,199 201 (15%) (60%) (5%) (19%) (100%)
- F 0,167 0,535 0,096 0.200 299 (17%) (53%) (10%) (20%) (100%)
- By pass Valvola Riduzione Trapianto
- M 0,375 0,428 0,275 0,4 40% (37%) (43%) (27%) (40%)
- F 0,625 0,571 0,725 0,6 60% (62%) (57%) (72%) (60%)
16% 56% 8% 20% 100%
100% 100% 100% 100% 100%
La riga azzurrina è "una media", un valore percentuale compreso tra i due sottogruppi (maschio e femmina), si trova facendo il valore assoluto "frequenza marginale di colonna" diviso 500 e poi per 100.
GRAFICI: (1,2,3 per tabelle semplici, 4 per tabelle a doppia entrata)
- AEROGRAMMI: utilizzati per
variabili qualitative nominali (es sesso, tipologia→intervento)
Ogni settore circolare è un modo di essere, l'ampiezza è proporzionale alla frequenza:
α : 360 = freq % : 100%
TITOLO
9%
10%
59%
23%
1° trim.
2° trim.
3° trim.
4° trim.
2. DIAGRAMMA A COLONNE: altra alternativa all'aerogramma, qualitative nominali. (se sono politomiche e hanno tanti modi di essere meglio il grafico a colonne); puo essere utilizzato anche per le quantitative ordinali e discrete.
Ogni modalità è una colonna (devono rimanere separate), la base è costante e l'altezza è uguale alla frequenza.
ti tolo
Serie 1 Serie 2 Serie 3 54,5 4,4 3 3,5 2,8 3 2,5 2,4 1,8 2
Categoria 1 Categoria 2 Categoria 3 Categoria 4
3. ISTOGRAMMA: variabili quantitative continue. Le colonne non sono distanziate, l'area della colonna è proporzionale alla frequenza. Qualora ti trovassi nella condizione da non avere classi della stessa ampiezza,
Non c'è da usare excel perché per questo programma la base è sempre costante.
4. POLIGONO DI FREQUENZA: variabili quantitative continue.
5. OGIVA/ SIGMOIDE: per rappresentare la distribuzione di frequenza cumulata (relativa/%)
COME SINTETIZZARE : Solo ed esclusivamente per le variabili quantitative, le variabili statistiche quantitative possono essere sintetizzate con un unico valore numerico detto:
Se applico tecniche di sintesi su un campione il valore numerico che trovo si chiama statistica (indicate con lettere dell'alfabeto latino)
Se le applico su una popolazione il valore si chiama parametro (indicato con lettere dell'alfabeto greco)
MISURE DI POSIZIONE:
1. MODA: l'unica per la quale non c'è una forma di calcolo da imparare a memoria, è il valore numerico della variabile che si presenta con la maggior frequenza tra tutti i valori che può assumere la mia variabile. Può non esistere e va ne può essere più di una (frequenza
Bimodale: un massimo assoluto nei valori della ns variabile e un massimo relativo secondo picco più alto nell'istogramma delle frequenze %) e può anche coincidere con la mediana e con la media. (≠ frequenza) N attacchi f Freq. Rel. % iangina 1 1 0.04 4 2 5 0.20 20 3 9 0.36 36 4 8 0.32 32 5 2 0.08 8 Total 25 1.00 100% Il valore del numero di attacchi di angina che si verifica per la maggior parte dei casi è 3. Quindi la moda è 3. F è l'unità statistica. Se i dati sono forniti in classi non avrà una moda, ma una classe modale e non è detto che all'interno della classe modale ci sia il valore che si ripete di più. 2. MEDIA: noi trattiamo solo media aritmetica: la media è un valore di variabile che presenta una sorta di tendenza centrale (compreso tra il valore più grande e il valore più piccolo). È la somma dei valori che una variabile assume per ogni unità statistica osservata divisa per il numero di unità statistiche.∑∑ xixiX= = ∑ finSe c'è un tabella con una frequenza dei valori, bisogna moltiplicare i valori per la frequenza, sommare tutti i risultati e dividerli per il totale dei soggetti campionati. F Kè la modalità per esprimere la frequenza delle classi dei valori. Se io dovessi determinare una media delle classi dovrei: K∑ xk fkx= n= ∑ fkdove: k=1 nANNI F x x fK k k k