Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Lezione 1
Statistica Descrittiva
Defin. ha lo scopo di sintetizzare i dati attraverso i suoi strumenti grafici e indici che descrivono gli aspetti salienti dei dati osservati.
Si basa su caratteri
-
Quantitativi
(sono quelli espressi in numeri)
-
Discreti
sono numeri interi
- es. n° figli
- n° goal
- voto laurea
-
Continui
sono intervalli
- es. peso
-
-
Qualitativi
(sono quelli non espressi in numeri)
-
Nominali
non si possono ordinare
- es. tipo lavoro
- religione
- nazionalità
-
Ordinali
possono essere ordinati
- es. grado militare
- grado istruzione
-
LA DISTRIBUZIONE DEI DATI
per ciascun ppg:
esempio compiti di laurea
UNITÀ
elencazione delle modalità di ciascun carattere
87, 92, 101, 103, 105, 97, 95, 90, 89, 103
FREQUENZE
Se esprime il numero di volte in cui la modalità di un carattere si presenta
MODALITÀ: 18, 21, 22, 23, 26, 28, 30
- MI: 26
Esempio compiti di laurea
- FREQ. ASSOLUTE: mostra il numero delle volte in cui la modalità si è verificata
- FREQ. RELATIVE: nascono da una divisione fra freq. assolute e totale dell'unità stat.
- FREQ. CUMULATE: nascono dall'addizione le frequenze relative
- CUMULATE RELATIVE: nascono da una divisione fra freq. cumulate e totale dell'unità stat.
CLASSI
È preferibile se la variabile statistica presenta molte modalità:
- 0-10: 7
- 10-15: 5
- 15-20: 8
- 20-22: 2
- MI: 20
BOX PLOT
Come si costruisce?
Q1 = 10
He = 15
Q3 = 19
lim inf = Q1 - 1.5 (Q3 - Q1) = 10 - 1.5 (9) = -3.5
Non c’è limite inf
lim sup = Q3 + 1.5 (Q3 - Q1) = 19 + 1.5 (9) = 32.5
Lim inf: 2 × Min
Lim sup: 2 × Max
Lim inf: L × Min
Lim sup: L × Max
VERIFICA L’ESISTENZA DI UNA RELAZIONE
DA SEGUIRE SEMPRE!!!
Contro H1: Pij ≠ Pi x Pj
α = 0,05
gradi di libertà (riga-1) x (colonne-1) = g.l. = 1
poi si vede sulla tabella che corrisponde 3,81
1,036 ≤ 3,81 QUINDI SI ACCETTA
ANALISI DELLA CORRELAZIONE
- L’indice della correlazione consiste nel valutare l’intensità della relazione che c’è tra le variabili: è quindi ritenuta una misura del grado di concordanza/discordanza.
- Una misura della concordanza/discordanza è la covarianza = (co (x, y))/n
- Se co (x/y) = 0 INSIP. CORRETTIVA
- Se co (x/y) > 0 CONCORDANZA
- Se co (x/y) < 0 DISCORDANZA
- INOLTRE: x e y sono statisticamente indipendenti se co (x/y) = 0, ma non x forza dei (indeterminato)
RICORDA TUTTI I TIPI D'INDIPENDENZA SONO:
- INSIP. STATISTICA
- INDIP. ASSOLUTA
- INDIPENDENZA CORRETTIVA
ESERCIZIO SULLA REGRESSIONE
m=10
∑xi=378
∑yi=187
∑xi2=17092
∑yi2=921.9
∑xiyi=928.8
x̄=∑xi/m=378/10=37.8
ȳ=∑yi/m=184/10=18.7
Dev(x) = ∑xi2-nx2 = ∑17092-10(37.8)2=2803.6
Dev(y) = ∑yi2-ny2 = ∑4215-10(18.7)2=833.1
Cov(xy) = ∑xiyi-nxy = ∑898.0-10(37.8)(18.7)=1524.8
B0 = ȳ-B1x̄ = 18.7-0.50342*37.8=-0.329
B1 = Cov(xy)/Dev(x) = 1524.8/2803.6=0.50342
SST = 883.4
SSE = SST-SSR = 1456.2
SSR = B12*Dev(x)=710.5211
VERIFICA RELAZIONE
H0: β1=0 contro H1≠β1≠0
MSE = SSE/(m-2) = 11.562/8 = 1.445
Test t = B1/√(MSE/Dev(x)) = 0.50342/√(1.445/2803.6) = 22.17
C(X) = m·p = 8,0,32
Var(X) = m·p·q = 8,0·4,0,6,54,9
Variabile Casuale Normale
La distribuzione normale si applica a quei fenomeni che possono essere gen. da un gran numero di cause che agiscano in modo addittivo o indipendente.
È possibile rappresentarla graficamente con un grafico a campana (Curva di Ga) ed è simmetrica rispetto alla media.
Ciò che bisogna calcolare è l'area tra a e b, dove è possibile usare gli integrali matematici trasformiamo tutte le variabili normali in variabili standardizzate (con l'uso della tabula).
- Formula di standardizzazione ⇒
- Formula inversa ⇒
-->
Metodo Diretto (esercizi) - Dato conosci Z, calcola la probabilità
Supponendo che i quozienti di indipendenza siano distribuiti normalmente con media H=100 e σ=15, calcolare la probabilità che sia minore di 90.
Standardizzare
Z a sinistra di 0.2546
Quindi se coincide è 0,950-0,2546=0,0254
Esercizio
Calcola l'intervallo di confidenza al 95% sapendo che x̄=22 σ=2,5 n=10
Siccome la σ è nota utilizzo
x̄ - zα/2 σ/√n ≤ μ ≤ x̄ + zα/2 σ/√n
22 - (1,9). 5/√10 ≤ μ ≤ 22 + 1,9 . 5/10
1 - α = 0,95
α = 0,05
α/2 = 0,025
Esercizio
Calcola l'intervallo di confidenza per studiare media delle vendite con 1-α=0,99
n = 105, σ = ? x̄ = ?
σ2 non nota (ma m ≠ 736), approssimiamo
x̄ = 25 . 35 + 85 . 70 / 105 = 65
Dev(x) = 252 . 35 + 852 . 70 - 105 (65)2 = 84
s2 = 84/105 = 0,8 correz. dev(x) = 81/104
s = 0,89 ≈ correz. √s2 = s2 - 0,89
1-α=0,99
α=0,01
α/2 = 0,005
Esercizio Proporzione
p = 80% n = 200
̂p = 160 200
α = 0,01
H0: P1 = P0 Contro H1: P1 ≠ P0
Test Z = ̂p - p0 √p0(1-p0) m
Z = 0,8 - 0,9 √0,9(1,09) 200
= -0,14
0,01 0,01
-2,4 -0,04 2,4
Si accetta