Formulario Statistica
Variabili (dati cui noi siamo interessati)
- Quantitative
- Discreta: non misurabile in una scala di veri, è numerabile
- es: n° scarpe/giorni
- Continua: misurabile in una scala continua
- es: peso dei neonati
- Discreta: non misurabile in una scala di veri, è numerabile
- Qualitative
- Nominale: aggettivo/nome come descrizione.
- Ordinale: suddivisibile in categorie ordinabili per ordine logico
- es: soddisfatto/ poco soddisfatto
- Dicotomica: esistono solo 2 categorie
- es: genere M o F.
- Categoric: divisibile in categorie ma non ordinabili in senso logico
- es: attività lavorative.
Variabili e modalità
Frequenza: Σ mi ; N ; Σ pi : Σ di se disumi;100 se Σ pi.
Var. Quantitative
Istogramma:
- barre attaccate
- posizionate con ordine
- calcolo ampiezza = (n°classi)larghezza
- calcolo densità: freq/ampiez.
Medie
Media Aritmetica: x̄ somma val x per (dati semplici)
- non dati in classe): ↑val medio
- (dati in classe): 1 - calcolo val. centrale (..+.) + ..
Modo: valore più frequente.
Mediana l'osservazione che occupa la posizione centrale in un insieme di dati non smistati
- 1. mettere in ordine i dati
- 2. esima osservazione + (1 t4 solo se le osservaz sono disparu) freq dell'l* nomedia è.
Forma Distribuzione: simmetrico/asimmetrico - val med o modo
FORMULARIO STATISTICA
VARIABILI
(Dati a cui noi siamo interessati)
QUANTITATIVE
- DISCRETA: Non misurabile in una scala di numeri con decimali, es: n° scarpe/giorni.
- CONTINUA: Misurabile in numeri, scala continua es: peso dei neonati.
QUALITATIVE
- NOMINALE: Aggettivo/nome come descrizione.
- ORDINALE: Suddivisibile in categorie ordinabili per ordine logico es: soddisfatto/poco soddisfatto…
- DICOTOMICA: Esistono solo 2 categorie es: genere M o F.
- CATEGORIALE: Divisibile in categorie ma non ordinabili in senso logico es: attività lavorative.
VARIABILI
MODALITÀ
FREQUENZE - \(\sum f_i = N, \sum f_i = 1\) se dei decimali; \(100\) se \(%\).
VAR. QUANTITATIVE
Istogrammi:
- Barre attaccate
- Posizionate con ordine
- Calcolo ampiezza ("classe") larghezza
- Calcolo densità: \(\text{freq}\) per altezza / ampiezza
VAR. QUALITATIVE
Diagramma:
- Barre staccate
- Ordine sensato
- Uguale larghezza
- Altezza proporz alle freq.
- Affiancare le barre per confronti
MEDIE
Rischo outlier, Val medio
MEDIA ARITMETICA - \(\bar{X} = \frac{\sum X}{m}\)(somma val. x numero delle osservazioni) (dati semplici)
- (Dati in classe): 1. -> calcolo val. centrale \(\frac{(\text{estr. sup. + estr. inf.})}{2}\) + est. inf: \(+ 0.5\) se e
EtErogenea/OmoGenea:
Variabile nominale - eterogenea quanto il più possibile var.
- omogenea più possibile uguale (100%).
Variabile ordinale - eterogenea quanto più possibile oppos.
- omogenea quanto più possibile uguali/simili.
Percentili:
percentile (m+1) C → ₁ = 0,25·(m+1) = esima
C₃ = 0,75·(m+1) = esima → Q₂ = mediana 50%
- dati in classi → computare le freq individuare classi dove
- rientrano i quartili.
Variabili quantitative - eterogenea → calcolo campo di variazione
Dispersione: Indicatore di distribuzione
- nessuno quanto è estesa una distribuzione
- Il campo variazione delle variabile
- Il campo variazione interquartile
- Lo scarto quadratico medio e varianza
Varianza:
scarto (osservazione - media)
dati in classi :
- 1° (val. centro medio)² × freq
- così ogni val. QI
- 2° sommo i punti del 1°
- 3° somma m o 100 se freq rel.
Scarto quadratico medio:
Scarto Q medio o varianza → sommo tutte le osservazioni così bug ma.
Teoria → se i dati sono asimmetrici la misura è comprom. a degli outlier.
Quindi meglio usarlo con dati norm asimmetrici. Può dirsi quanto sia disperso la distrib.
Campo varianza interquartile:
é non utilizza tutti i dati, affidabile per outlier
o dati q simmetrici.
Box Plot:
1° trovo i seguenti dati: mediana, QS-QI, Campo varianza interqil
- limit inf: Q₁ - ( 1.5 × campo var. interq.)
- limit sup: 3 + ( 1.5
- trovate i post sopra lim inf;
- trovate osse sotto lim sup.
- indicati come outliers
Correlazioni e Regressione
Correlazione: misura la dipendenza tra due variabili.
Regressione: modo di prevedere i valori di una variabile avendo a disposizione quelli di un'altra variabile.
Metodi di statistica descrittiva estesi al caso di due variabili.
Diagramma a punti o diagramma a dispersione
- Individuare variabile dipendente y e indipendente x
- Disegnare i punti
Correlazione può essere positiva forte, positiva debole, negativa forte, negativa debole, assenza di correlazione.
Lo coefficiente
- r = +1 correlazione positiva perfetta
- 0 < r < +1 correlazione positiva
- r = 0 no correlazione
- -1 < r < 0 correlazione negativa
- r = -1 correlazione negativa perfetta
Formulario DEMOGRAFIA
DETERMINARE L'AMMONTARE DELLA POPOLAZIONE:
P(t+m) = Pt + SN + SM(N-N) + (I-E)
INCREMENTO/DECREMENTO
- Incremento assoluto: P(t+m) - P(t) = [di quante unità si è accresciuta una popolazione]
- Incremento medio/annuo: P(t+m) - P(t) / m
- mo+ = incremento
- mo- = decremento
- n° periodi (anni)
TASSO DI INCREMENTO MEDIO ANNUO ARITMETICO:
Formula inversa:
- P(t+m) = Pt * rm
- r = [P(t+m) - P(t)] / [m * P(t)]
- + r è elevato cresce la pop.
TASSO DI INCREMENTO CONTINUO
ri = ln P(t+m) - ln P(t) / M
formule inverseP(t+m) = P(t) er * m
TEMPO DI RADDOPPIO:
md = ln 2 / ri o 70 / ri
Se r rimanesse costante nei prossimi anni quanto tempo impiegherebbe una pop. per raddoppiare?
ETÀ MEDIA
Vedi statisticanon è un buon indice per valutare sinteticamente il grado di invecchiamento
INDICE DI VECCHIAIA
Iv = 100 * (P65+) / P0-14
Val. superiore a 100 = maggiore presenza di sogg anziani
INDICE DI DIPENDENZA - CARICO SOCIALE
Totale presenza di pop.non attiva su quella attiva
Id = 100 (Po-14 + Pg65+)/P15-64
Idg = 100 (Po-14)/P15-64
Ida = 100 (Pg65+)/P15-64
- O => misura il livello di carico sociale totale in presenza del pesante ogni 100 "attivi"
- O => misura il livello di carico sociale dei giovani, quindi attivi. "giovani" fase di peso in ogni 100 attivi
- O => misura il livello di carico sociale degli anziani. alto => giuntura rapporto prestazioni contributi. Gli anziani più pensione ogni 100 attivi.
INDICE DI RICAMBIO DELLA POP.IN ETÀ LAVORATIVA
Ir = 100 (Po-64)/P15-19 GENTRATA
- Ir < 100 bassa capacità di ricambio
- Ir > 100 forte
- O => misura in un dato intervallo l'intensità del potenziale ricambio della popolazione in età lavorativa. Se si ferma al sesso maschile, esprime con buona approssimazione la misura dell'in. il fenomeno del ricambio della forza lavoro.
RAPPORTO DI MASCULINITÀ
Rm = Pm . 100/Pf
O => Rm < 100 se eccesso componenti maschile
RAPPORTO DI COMPOSIZIONE RISPETTO AL SESSO
esatto R'm = Pm . 100/(Pm + PF)
- O => possono essere specifici x età
- R'm < 50 se eccesso componente maschile.
come fare piramide dell'età
TASSO GENERICO DI MORTALITÀ
mx(t) = 1000 * Mx(t)
Se specifico: N decessi ogni 1000 pers di età x mediamente nel (2005)
DIFETTO: Non tiene conto che la mortalità varia rispetto all'età.
STANDARDIZZAZIONE
DI RETTA: [POPOLAZIONE TIPO]
m'i = (i) ∑x=0 mx * Px (T)
sostituisce le struttura e età delle pop.
INDIRETTO: [TASSI TIPO]
m"i = mi / m'i → tasso generico tipo
m* = mx tipo * Px + …
denominatore: → tasso gen tipo
TAVOLA DI MORTALITÀ
determinare la velocità di estinzione di una generazione. Esaminare velocità di eliminazione di una popolazione.
- elementi delle tavole
PROBABILITÀ DI MORTE
m{b9;} attesa di decessi.
lx — sopravvienti
O — D rischio di morte tra x e x+1
qx = dx{"000d7};
qx = dx 1{"000d7}{"000bd}
NUMERO ATTESO DI DECESSI
dx = lx ▪ qx
NUMERO SOPRAVVIVENTI ETÀ X + 1
(x+1) / lx - dx = lx (1 - qx)
PROBABILITÀ DI SOPRAVVIVENZA
px = (1 — qx)
ANNI VISSUTI TRA COMPLEANNI X E X+1
Lx = -12 + D
Lx = 1 (l{b9;}L)
Si presta a rappresentare la struttura età della popolazione
Solimente k (k = 1—‼ Si pertiza devochi morti
Se k nome uso solo mi broda 6 mes. > D
SERIE RETROCUMULATA ANNI VISSUTI
Tx = {lx + lx — 3 + Lx — 2 + lx + Lx
SPERANZA DI VITA:
ex = Tx - O media che dammi di un soggetto può sostenersi di vivere al compimento dell'età X
usato come media sintetico per connotare i livelli di mortalità espresso da una tavola di mortalità.
mx = 2qx
RELAZIONE TRA Qx e mx
mx (differenza per aumentare all'incremento dei seu del tasso.)
mx - di = dx{"000d7}
qx = 2mx
di
Mortalità Infantile
(mortalità nel 1o anno di vita)
miminf(t) = 1000 · M (t) N (t) -0 vivi
Fecondità = capacità di concepire.
Fecondità (comprende più importante)
-0 realizzazione dellacapacità di concepire.
Tasso Generico di Natalità:
m(t) = 1000 · N (t) = 0 P(t) -0 no nati ogni 1000 abitanti nel (2015) esposto a effetti strutturali. Dietro = non tiene in considerazione solo della parte fertile.
Tasso Generico di Fecondità:
F(t) = 1000 · N (t) = 0 F(t) -0 no nati ogni 1000 donne in età fertile.
D : S (x1)4 = Ds -0 no femminile madre tra 15 e somm.
Tasso di Fecondità Totale (somma tassi specifici)
TFT (t) = Σ F x (t) 15 < x < 49 -0 no figli nati durante la vita (somma di una generazi di 1000 donne, indenne alta mortalità.) 1 x 2000 c’è ricambio.
Tasso Lordo di Riproduttività:
R = TFT · Nf Nt + Nm