vuoi
o PayPal
tutte le volte che vuoi
Data: 16 Settembre 2019
Esame: Faremo un esonero il 21 Ottobre, un altro ai primi di Dicembre. A Gennaio mi iscrivo all'appello ma scrivo un'email con cui accetto il voto (media dei 2 esoneri).
Statistica: a partire dal Seicento inizia studio quantitativo (numerico) degli Stati, insieme come:
- Nazioni
- Classi sociali "stato" (clero), 2° (aristocrazia)
All'inizio era l'ordine demografico; oggi indica l'analisi dei dati in qualsiasi contesto (principalmente ambito medico-sociale). Il metodo scientifico è basato sull'esperienza empirica, quindi sulla raccolta di dati sperimentali. Per questo è dato e propedeutico ai diversi corsi di studi.
Analisi statistica, elementi:
Popolazione: insieme di unità (persone, province, ecc.) che voglio analizzare (prodotti, anni)
Variabili: caratteristiche di tali unità (età, genere, prezzo, partito/govern)
Campione: sottoinsieme di unità usato quando la popolazione è molto ampia e non si riesce a disporre di su / elementi/avannabili di interesse. Es: analizzare programma i politici degli Stati, dunque la vera è: campionamento correttamente? Posso chiedere a tutti? Generalizzare? Occorre un campione rappresentativo
Variabili dicotonomiche: con 2 sole alternative
Variabili quantitative:
- Discreti: numeri interi
- Continui: non interi, non ne es. rest. a pezzi. Una quantità definita di valori (es. il voto di maturità a volte in decimali). Può contenere una varietà continua di valori (es. 6&8; 9.3; 10)
Statistica descrittiva: goal: descrivere in modo sintetico i dati della matrice x rispondere a domande come:
- Qual è la % di femmine in classe?
- È stato un miglioramento?
Statistica inferenziale: goal: stimare (aim: madure, inferire) le caratteristiche della popolazione usando i dati del campione
Numeri e identità
- 0,3782 = 37,8% = 37,82
- assoluto percentuale
Sommacontinua, simbolo
x1+x2+x3+...+xN
è equipollente a: ∑xiNi=1
Distribuzione di Frequenza
Rappresentazione del modo in cui le diverse modalità di un carattere si distribuiscono nelle unità statistiche.
- Frequenza assoluta: numero di unità registrate (fi).
- Frequenza relativa: numero di unità sul totale (fi / N).
- Frequenza percentuale: (fi / N) . 100 con simbolo %.
Grafica
Istogramma
ha rettangoli la cui altezza è la frequenza. La base è la variabile. Es: campione di 19 persone 12 M e 7 F.
Xi fi fi / N P αi F 7 0,368 36,8% 132° M 12 0,632 63,2% 228°Grafico a torta
: necessità di frequenze angolari (αi) ottenute da: (fi / N) 360
- F: 132°
- M: 228°
Grafico con riferimento tabella pag. 5 - 1a dispensa
Uso: X "grado di interesse"
Xi Fi Fi/N Basso 5 0,26 Medio 6 0,32 11 0,58 Alto 8 0,42 19 1Frequentza cumulata relativa
Procedo con ordine Frequenza cumulata: la prima corrisponde a quella assoluta, dalla 2a si somma la precedente.
Metodo semplificato e approssimativo
Non ho il quartile esatto prendo valore prima e valore dopo e faccio la media
Q1 = 13 + 14 = 13,5
Q3 = 23 + 24 = 23,5
Data: 23 settembre 2019
Metodo 2
Si individuano comunque valori Xi e Xi + 1.
Xp = Xi + (Xi +1 - Xi) P - Fi/N
f i+1/N - fi/N
Q1 = 13 + (14 - 13) 0,25 - 0,237 = 13,36
0,273 - 0,237
Perché non usare il metodo 1?
Es: Calcolo del 27° percentile col metodo 1:
Qx =
Col metodo 2:
Qx = 13 + (14 - 13) 0,27 - 0,237 = 13,9
0,273 - 0,237
Calcola il terzo quartile col metodo 2
Qx = 23 + (24 - 23) 0,75 - 0,720 = 23,1
0,762 - 0,720
Esercizio 2.1, pag. 47
- Area
- Numero
- Degenza media
- Nord
- Centro
- Sud e Isole
- 1.604.000 8,6
- 2.003.000 9,6
- 3.765.000 6,9
- 7.372.000
- X̅N = 8,6 = Σxi
- X̅C = 9,6 = Σxi
- X̅S = 6,9 = Σxi
X = "giorni di degenza"
La distribuzione binomiale è ardua quando n è un valore elevato. In questo caso si usa una distribuzione continua, ovvero quella gaussiana o normale.
Distribuzione gaussiana o normale
Linea campanulare, rappresenta funzione algebrica la cui forma è la seguente:
P(x) = 1/√2π62 e(x-μ)2/(2*62)
e = numero di Nepero
v = distribuito come
π = pigreo
μ = media della distribuzione
μx = E [X] dove: E sta per expected, valore atteso
6x2 = VAR [X] varianza
P(x), curva che vada -∞ a +∞
P(x) = è la densità di probabilità ≠ probabilità
In una variabile continua nessun valore ha probabilità zero, dunque non considerare valori singoli ma intervalli di valori
P ( a < x < b ) = b∫a f(x ) dx
Interpreta diversi fenomeni naturali (es età, peso), dunque sulla base di essi si stabilisce ciò che è normale in senso statistico (la > parte dei casi).
La Filosofia del 66% prevede che il 99% di quello che produco stia all'interno degli standard.
μ - 36 μ - 26 μ - 6 μ + 6 μ + 26 μ + 36
La distribuzione è simmetrica attorno alla media μ
- ≈ 68% della distr. cade tra ± 1σ attorno alla media
- ≈ 95% della distribuzione cade tra ± 2σ attorno alla media
- ≈ 99% della distr. cade tra ± 3σ attorno alla media
Per dire che la variabile x si inserisce nella normale:
X ∼ N (μx,6x)
(deviazioni standard)
Normale standard ha media 0 e varianza 1 se distribuita normalmente
Z ∼ N (0,1)
Conosciamo questa regola:
X ∼ N (μx,6x2) => Z = X - μx/6x ∼ N (0,1)
Data: 7 ottobre 2019
Pagina 37, riferimento alla tavola della distribuzione normale standardizzata
Es. P (0.4 < Z < 0.5) = 0.19 ovvero 19%