Parte B: distribuzione di frequenze
Creare tabella con frequenze assolute e relative
fi = si contano
Pi = fi / N
| Carattere | fi | Pi |
|---|---|---|
| Modalità 1 | ||
| Modalità 2 | ||
| Totali | 20 | 1 |
Elementi necessari per aerogramma
Bisogna trovare l'ampiezza degli angoli: αi = Pi · 360
Grafico a barre
Distribuzione con classi continue di ugual ampiezza
Trovare ampiezza delle classi: W = (valore max - valore min.) / n. classi
| Carattere | fi | Pi |
|---|---|---|
| x0, x1 | ||
| H | ||
| x1-x2 | ||
| x2-x3 | ||
| Totali | 20 | 1 |
Istogramma
Per carattere quantitativo continuo o diviso in classi, si calcola la densità di frequenza e si assegna a tabella in classi
di = fi / w
La frequenza assoluta, w = ampiezza classe
La colonna più alta è la moda
Quartili
- Modalità/valori che dividono la distribuzione in 4 parti.
- Primo quartile: lascia il 25% delle frequenze alla sua sinistra e il 75% alla sua destra
- Calcolare su tabella le frequenze cumulate:
Q1 = estremo sinistro della classe + (frequenza relativa della percentuale - frequenza cum. in classe precedente) / (frequenza cum. del classe - frequenza cum. in classe precedente) * ampiezza classe
Mediana
Me = estremo sinistro della classe la cui frequenza cumulata è superiore a 0,50 + (0,50 - freq. cum. in classe precedente) / (freq. cum. in classe mediana - freq. cum. classe prec.) * ampiezza classe mediana
Il secondo quartile è la mediana: divide la popolazione in due gruppi di numerosità uguale
Il risultato sia della formula dei quartili che della mediana deve essere un valore compreso nella classe
Media
In distribuzione in classi:
M = Σi Xi * ki / N
N = numero esempi = 20
Xi è il valore centrale della classe = (estremo sinistro + estremo destro) / 2
Scarto quadratico medio
σ = √[Σi (Xi - M)2 * ki / N]
(Xi - M)2 * ki si calcolano in tabella e si fa somma
Coefficiente di variazione
cv = (σ / M) * 100 = %
Moda
- Modalità/valore che si presenta con maggior frequenza
- Non in classi: valore che si presenta con maggiore frequenza nelle fi
- In classi: si fa riferimento a densità di frequenza → di = fi / ampiezza classe
Mo = valore centrale della classe con maggiore densità di frequenza, la calcolo in tabella
| Carattere | fi | pi | Fi | xi | xi*fi | (xi - M)2 | (xi - M)2*fi | di |
|---|---|---|---|---|---|---|---|---|
| 160 - 170 | 3 | 0.15 | 0.15 | 165 | 495 | 156.3 | 468.9 | 0.2 |
| 170 - 180 | 9 | 0.45 | 0.60 | 175 | 1575 | 6.3 | 56.3 | 0.9 |
| 180 - 190 | 8 | 0.40 | 1.00 | 185 | 1480 | 56.3 | 450.0 | 0.8 |
| Totali | 20 | 1 | 3550 | 975.0 |
Parte C: tabella di contingenza
Per il carattere x in riga e y in colonna
| A | B | C | Marginali riga | |
|---|---|---|---|---|
| Sì | 4 | 3 | 4 | 11 |
| No | 2 | 2 | 3 | 9 |
| Marginali colonna | 8 | 5 | 7 | 20 |
TABELLA IN IPOTESI DI INDEPENDENZA DEI CARATTERI
| 4,4 | 2,75 | 3,85 | 11 |
| 3,6 | 2,25 | 3,15 | 9 |
| 8 | 5 | 7 | 20 |
Esiste relazione tra i caratteri? Giustifica la risposta.
Vi è dipendenza tra i caratteri in quanto la tabella in ipotesi di indipendenza è differente da quella osservata.
Misura relativa di associazione
- Contingenze: differenza tra valore osservato e atteso in ipotesi di indipendenza
| 0,4 | 0,25 | 0,15 | 0 |
| -0,4 | -0,25 | -0,15 | 0 |
SOMMA SEMPRE ZERO
Chi-quadrato
χ2 = Σi (c2 / F) c = contingenza quadrato
F = frequente atteso
In ipotesi di indipendenza χ2=0 / massimo non definito perché dipende da numerosità
Indice quadratico di contingenza
- I2C = χ2 / χ2 + N
I2CMAX = 1 / min(n, p) → Valore più piccolo tra no di colonne e di righe
I2CREL = I2C / I2CMAX
Valore compreso tra 0 e 1 = √( 1 / min(2, 3) ) → √( 1 / 2 ) → 0,7
Diagramma a dispersione
Diagramma cartesiano in cui ogni unità statistica viene rappresentata con un punto avente per coordinante i valori delle due variabili di riferimento
Retta di regressione
UNITÀ Xi Yi Xi - Mx Yi - My (Xi - Mx)2 (Xi - Mx)(Yi - My) Ŷ Ŷ - Y
- Determinare le medie: Mx = ΣXi / 5, My = ΣYi / 5
- Calcolare gli scarti dalla media di x e y → la somma è sempre zero
- Calcolare il quadrato dello scarto di x: (Xi - Mx)2 → la somma è la devianza
- Calcolare il prodotto tra gli scarti: (Xi - Mx)(Yi - My) → la somma è la covarianza
Equazione della retta di regressione
Ŷ = P0 + P1 × x
P1 = covarianza / devianza coefficiente di regressione lineare
P0 = My - P1 × Mx intercetta
Errori di previsione
Ŷ - Y su tabella
Rappresentazione grafica retta di regressione
Assegnare alle 2 variabili casuali e collocare Ŷ con equazione su una tabella
Calcolo combinatorio
Disposizioni
Per oggetti il cui ordine ha importanza
- Senza ripetizione → Dn,k = n!/(n-k)! es.: lettere con destinatario in 10 cassette postali anonime
D10,4 = 10!/(10-4)! = 10⋅9⋅8⋅7⋅6! = 5040= 64! - Con ripetizione → D'n,k = nk es.: lucchetto a 5 ruote numerate da 0 a 9
D'10,5 = 105= 100000
Combinazioni
Per oggetti il cui ordine non ha importanza
- Senza ripetizione → Cn,k = n!/(k!(n-k)!) es.: 3 volantini anonimi in 8 cassette postali anonime
C8,3 = 8!/(3!(8-3)!) = 8⋅7⋅6⋅5!/3⋅2⋅1⋅5! = 336/6 = 56 - Con ripetizione → C'n,k = (n+k-1)!/((n-1)! k!)
Permutazioni
Disposizioni in cui la formazione del gruppo richiede tutti gli elementi
Pn = n! es.: P7 = 7! = 7⋅6⋅5⋅4⋅3⋅2 = 5040
Se uno degli oggetti è fisso al primo posto: Pn-1 = (n-1)!
Se uno degli oggetti è fisso al primo oppure ultimo posto: P(n-1) + Pn-1 = 2Pn-1
es.: P7 = 6! = 6⋅5⋅4⋅3⋅2 = 720
P6 + P6 = 720⋅2 = 1440
es. 1: dimostra la validità Cn,k = Cn,n-k
si assegnano valori casuali a n e k → n = 5 k = 2
Cn,k = C5,2 = 5!/2!(5-2)! = 5!/2!3! = 5!/2!3!
Cn,n-k = C5,5-2 = C5,3 = 5!/3!(5-3)! = 5!/3!2!
Distribuzione binomiale
La probabilità di avere un certo numero di successi vale:
P(X=k) = (n)⁄(k) ⋅ (π)k ⋅ (1-π)n-k
n: lanci totali
k: n. successi
π: probabilità successo
Esempio: lanciare dado regolare 6 volte; n. d. probabilità di ottenere la faccia 6 per 6 volte
n = 6 k = 6 π = 1⁄6 la faccia 6 compare una sola volta nel dado
P(4 su 6 volte) = P(X=6) = (6)⁄(6) ⋅ ( 1⁄6 )6 ⋅ ( 5⁄6 )0 = 1⁄6666
Probabilità di ottenere numero minore di 3 non più di una volta
n = 6 K0 = 2 π = 1⁄3 i 2⁄6
Non più di una volta: 0 volte + 1 volta
P(k=0) + P(k=1) = (6)⁄(0) ( 1⁄3 )0 ( 2⁄3 )6 + (6)⁄(1) ( 1⁄3 )1 ( 2⁄3 )5 = ...
- Probabilità di solo esiti favorevoli -> K=n
- Solo esiti sfavorevoli -> K=0
- Probabilità di avere un numero dispari di eventi favorevoli -> K1 = 1 K2 = 3 K3 = 5 fino a max di n
- OPPURE = SOMMARE P(k=2 oppure k=4) = P(K2) + P(K4)
Esempio: in un lancio ripetuto di una moneta non truccata, calcolare la probabilità di ottenere 3 croci in 5 lanci
n = 6 K = 3 π = 1⁄2
P(k=3) = (6)⁄(3) ⋅ ( 1⁄2 )3 ⋅ ( 1⁄2 )3 = 6!⁄3! 3! ⋅ 1⁄8 ⋅ 1⁄8 = 20⁄64
Es. si esegue il lancio ripetuto di una moneta non truccata π = 1/2
È più probabile ottenere la sequenza TTCCTC o CTTCTT?
P(TTCCTC) = (1/2)3 ⋅ (1/2) ⋅ (1/2)2 = (1/2)6 = 1/64
P(CTTCTT) = 1/2 ⋅ 1/2 ⋅ 1/2 ⋅ 1/2 ⋅ 1/2 ⋅ 1/2 = (1/2)6 = 1/64
È più probabile la sequenza TTTTTT o TCTCTC?
Qualunque sequenza di esiti avrà la stessa probabilità di verificarsi
P(TTTTTT) = P(TCTCTC) = (1/2)6 = 1/64
Distribuzione normale
Per determinare le probabilità che si osservino i valori appartenenti a un determinato insieme
Problemi diretti
Si ha l'intervallo di x, si vuole sapere la probabilità
- % dei casi con valore inferiore o pari a X1
- X→Z = X-M/σ → arrotondato al 2° decimale
- P: F(z) cercare valore nella tabella:
- La parte intera e il primo decimale di z sulle righe.
- Il secondo decimale di z sulle colonne
- es.: F(1,28) = 0,9671 - non può essere più grande di 1!
- Trasferire in percentuale (es.: 96,71%)
Se z è negativo: F(z) = 1 - F(z) - Z diventa positivo
- % dei casi superiori a X1
- X→Z = X-M/σ → arrotondato al 2° decimale
- P: 1-F(z) es. 1-F(0,7734) = 1-0.7734: 0,2266 = 22,66%
- Se z è negativo: 1-F(-z) = 1-[1-F(z)]
- % dei casi compresi tra X1 e X2
- Ordinare le x in senso crescente
- X2→Z2 = X-M/σ
- P: F(z2) - F(z1) es.: z1 = 0,75 z2 = 1,84 F(1,84) - F(0,75) = 0,9671 - 0,2266 = 74,05%