vuoi
o PayPal
tutte le volte che vuoi
RIPASSO STATISTICA
Statistica descrittiva
- Descrivere, monitorare, informazioni dai numeri.
- Unità statistica = soggetto su cui avviene la misurazione.
- Popolazione = insieme di unità statistiche.
- Misurano variabili:
- Quantitative (le variabili sono misurate sulle unità statistiche)
- Qualitative
V. qualitative (categoriche)
- Non ordinabili (nominale)
- Ordinabili (rilevo, situazione)
V. quantitative
- Discrete (∈ N{0,1,...})
- Continue (qualsiasi valore ∈ R)
Descrittiva = analisi e descrizione dei dati.
Statistica = inferenziale per trarre conclusioni su intere popolazioni.
-
Analisi descrittiva
- Distribuzioni di frequenza
- Distribuzione unitaria = elenco valori dati una variabile.
- Distribuzioni di frequenza = come si manifestano le variabili
- Frequenza assoluta = numero di volte cui quel dato si presenta
- Frequenza relativa = F. Assoluta /TOT
- Se la variabile quantitativa continua occorrono intervalli.
Per variabili ord., qualitative e quantitative → FREQ. CUMULATA o RETROCUMULATA
-
Otteniamo grafici
-
Diagramma a barre
- Barre rappresentano le modalità
- Lunghezza = frequenza
-
Diagramma a torta
- Area circolare divisa in frazioni
- Ciascuna rappresenta modalità
- Moltiplici.
-
Diagramma di Pareto
- Barre verticali ordine decrescente + percentuali + F. cumulata
- Utile per vedere le variabili + frequenti
-
Istogramma
- Var. suddivisa in classi (sono rappresentati alcuni punti)
-
Poligono
- X variabili continue divise in classi.
- Ascissa = punto medio
- Ordinata = freq.
-
Poligono cumulativo
- Variabili continue, classi
- Ascissa = estremo sup. intervallo
- Ordinata = frequenza cumulativa
-
Diagramma a barre
Misure di sintesi
- Tendenza centrale
- Misure variabilità / Risultati di sintesi
- Misure di forma
A) Tendenza Centrale
Valori medi
- Media aritmetica, mediana, moda
Media aritmetica: valore medio per variabile quantitativa
x = xi fi / xi n
- Se suddivisa in classi, zi = valore centro classe
- Media esposta per outliers
Mediana: valore posizione ain dell’insieme ordinato
- Se N valori dispari → mediana = vn+1 / 2
- Pari → media tra i due valori in pos. centrale
Quantili
- Misure di posizione non centrata
Divido la distribuzione in Tot pari di uguali numerosità
- Quartili (Q1, Q2, Q3)
Q1 = 25% valori, Q2 = 50%, Q3 = 75%
Pos Q1 = (n+1)/4 Pos Q2 = (n+1)/2 Pos Q3 = 3(n+1)/4
Se il risult. numerico con virgola → media tra i due valori in quella pos.
Moda: modalità della variabile maggiormente presente
Valore Medio
- Scala di misura: nominale = moda, ordinale = moda, mediana, quantili, numerica = moda, mediana, quantili, media arit.
Forma distribuzione ( ? ) media.
- ( ? ) Sìmetrica → untore
- Variabilità quantit. se il seno è molto variabile
- Distribuzione binomiale
esperimento casuale ripetuto
- eszce di probabilità
n e costante
successo
Pr(X = x) = Cnxpx(1 - p)n-x
E(x) = np Var(X) = np(1 - p)
- distribuzione di Poisson
eventi E in un tempo:
xi Po(λ)
Pr(X = x) = (e-λλx) / x!
E(X) = λ Var(X) = x
Test Chi-Quadro
tabella di contingenza è una tabella di frequenza a doppia entrata in cui le osservazioni relative a due variabili misurate con scala categoriale vengono rappresentate simultaneamente.
Per chi-quadro per la differenza tra due proporzioni
Oltre al test z per 2 proporzioni anche χ² viene costruita una TABELLA di CONTINGENZA!
- Ho: π1 = π2
- H1: π1 ≠ π2
χ² = Σ (fo - fe)²/fe fo è la frequenza osservata fe è la frequenza attesa
p̄ = (X1 + X2)/(h1 + h2)
(righe - 1) × (colonne - 1) GDL
fe₁ = p̄ ⋅ h1 e fe₂ = p̄ ⋅ h2
Il test χ² è utile per confrontare proporzioni di più popolazioni indipendenti
Tabella r righe c colonne
p̄ = Xr + Xc + Xn/hr + hc + hn
Test Chi-Quadro per l'Indipendenza
Si elaborano una tabella di contingenza r righe e c colonne: possiamo verificare l'indipendenza tra X e Y.
- Ho: X ǫ Y
- H1: X Ɣ Y
χ² = Σ (fo - fe)²/fe → fe = (tot riga × tot colonna)/n