vuoi
o PayPal
tutte le volte che vuoi
Grafico della curva di Lorenz → ANALISI BIVARIATA
Tabella di frequenza assoluta a X\Y
Y FAMC xdoppia entrata X n ...RFAM ... NY X = x e Y=yFrequenza assoluta congiunta n i jPopolazione R C n∑ ∑N iji=1 j=1Frequenze assolute marginali CN = n∑FAM i⠂ ijX j=1RN =FAM n∑⠂jY iji=1Tabella con frequenze relative X\Y Y fC i⠂congiunte a doppia entrata X f fR R⠂f f 1⠂j ⠂CFrequenze relative marginali CF = f∑FRM i⠂ ijX j=1RF =FRM f∑⠂jY iji=1Indipendenza statistica f = f × fMetodo 1 X e Y sono SI se ⠂ji⠂f nMetodo 2 Frequenze condizionate f = =ij iji|jrelative di X dato Y f n·j ·jFrequenze condizionate f nf = =ij ijj|irelative di Y dato X f ni· i·f = FRM = fMetodo 3 X dato Y i|j x i⠂f = FRM = fY dato X ⠂jj|i YDipendenza statisticaMassima dipendenza Ad un valore di X è associato 2χ = 1un solo valore di Y o viceversa 1. Verificare la dipendenzaIndice Chi-quadro 2. Tabella delle frequenzeteoriche3. Tabella
delle contingenze2χ
4. Indice chi quadro
5. Estremi di chi quadro
6. Chi quadro normalizzato
︿ f × f
Tabella delle frequenze teoriche f ⠂ji⠂ij ni⠂× n⠂j︿nij Nf -
Tabella delle contingenze ︿f ijC n - ︿nij
Chi-quadro R C 2C ij∑ ∑ ︿f iji=1 j=1
χ R C 2C ij∑ ∑ ︿niji=1 j=1
Estremi di con R = n° di righe e C = n° di colonne
2 2χ 0 ≤ χ ≤ min {R 1; C 1}− −
Chi-quadro normalizzato 2 2χ χo20 ≤ χ ≤ 1 min{R 1; C 1} N ×min{R 1; C 1}− − − −
Covarianza COV N(X,Y) 1 (x M ) × (y M )∑ − −x yi iN i=1 N1M - (M × M ) M =→ (x × y )∑xy x y xy i iN i=1
Misura l’associazione lineare N1 (x M ) × (y M ) × n∑ − −x yi i ijN i=1N1 (x M ) × (y M ) × f∑ − −x yi i ijN i=1
Coe ciente di correlazione COV (x,y)1 ≤ ρ ≤ 1− xy δ ×δx y
Analisi di regressione lineare
(solo per x e y quantitativi)Variabile che si vuole spiegare Y attraverso X
Retta dei minimi quadrati COV︿ (x,y)β = 2δ︿ ︿ x︿Y = α + β x ︿︿α = M β · M−y xSSRCoe ciente di determinazione SSTSSE1−2R SST2[ρ ](x,y)Devianza totale N 2SST (y M )∑ − yii=1Devianza spiegata N 2︿SSR (y M )∑ − yii=1Devianza residua N 2︿SSE (y y )∑ −i ii=1
VARIABILI ALEATORIE DISCRETE
Probabilità Funzione di densità pn
Valore atteso
Varianza
Trasformazioni di variabili E(Y) = a + b * E(X)
Y = a+bX 2Var(Y) = b * var(X)
Variabile aleatoria standardizzata = unità di scarto quadratico medio utile a Z = a + bX
confrontare variabili casuali con distribuzioni differenti
VARIABILI ALEATORIE CONTINUE
Probabilità 1F(x) = Distribuzione uniforme o rettangolare
Denominazione a, b RX ~ U [a, b] ∈
Funzione di densità f(x)
Media E(x)
Varianza δ x
Funzione di ripartizione F(x) regre
Distribuzione
esponenziale negativa
Denominazione λ>0
X ~ esp(λ)
Funzione di densità f(x)
Media E(x)
Varianza δ x
Funzione di ripartizione F(x)
Distribuzione normale (o Gaussiana) 2 e2
Denominazione δ > 0
M (− ∞,+ ∞)
X ~ N (M , δ ) ∈
Funzione di densità f(x)
Media E(x) M22
Varianza δδ x
Distribuzione normale standardizzata 2e
Denominazione M = 0 δ = 1
Z ~ N (0, 1)
Legame
Funzione di densità f(z) usando le tavole
Funzione di ripartizione F(x)
Simmetria Due variabili aleatorie w = ax + by + c→
Media E(w)
Varianza 2δ w
STIMATORI
Stimatore della media campionaria
Formula generale Per qualsiasi popolazione
Teorema Centrale del Limite
Formula standard - Per n>30 se varianza nota- Per n>50 se varianza non nota
Il valore atteso dello stimatore
fornisce in media una stima uguale
Proprietà alla media della popolazione
Varianza dello stimatore
Errore standard dello stimatore
Stimatore della varianza campionaria
Per qualsiasi popolazione (tranne quella normale), la formula generale per la formula standard è:
Formula standard: Per popolazione normale, il valore atteso dello stimatore fornisce in media una stima uguale alla varianza della popolazione.
Stimatore della proporzione campionaria: Per qualsiasi popolazione, la formula generale bernoulliana (variabili qualitative) è utilizzata.
Teorema Centrale del Limite: Formula standard per n>50.
Il valore atteso dello stimatore fornisce in media una stima uguale alla proporzione della popolazione.
Proprietà: Varianza dello stimatore.
PROPRIETÀ DI UN BUON STIMATORE
Uno stimatore puntuale T si dice corretto per il parametro quando il suo valore medio coincide con il valore del parametro da stimare. ΘE(T) = Θ
Se tale uguaglianza non si verifica, si avrà distorsione o bias dello stimatore, definita come differenza tra la sua media e Θ. Correttezza / non distorsione BIAS(T,Θ) = E(T) - Θ
Uno stimatore puntuale è asintoticamente non
distorto se la differenza tra il valore atteso dello stimatore e il parametro oggetto di stima diminuisce al crescere dell'ampiezza del campione (varianza).
E(T) = per n +∞Θ →
Nel confronto non distorti per uno stesso parametro, si dice stimatore più efficiente in assoluto quello che ha la varianza più piccola.
Si misura con l'errore quadratico medio:
2EQM(T,Θ) = E[(T-Θ) ]
SE cienza relativa 2EQM(T,Θ) = [E(T) - + Var(T)Θ]
Var(T) decresce al crescere della numerosità del campione.
INTERVALLI DI CONFIDENZA
Livello di significatività α
Intervalli di confidenza per la media di una popolazione distribuita normalmente
Margine di errore
Varianza nota Lunghezza (L) o ampiezza (w) 2*ME n ricavata
Varianza NON nota Margine di errore
Lunghezza (L) o ampiezza (w) 2*ME
Grandi campioni n ricavata
Intervalli di confidenza per la differenza tra medie di una popolazione distribuita normalmente
Varianza nota
Varianze
uguali ma NON note 2S pooled 2Intervalli di confidenza per la varianza di una popolazione distribuita normalmente (χ )Distribuzione Chi-quadrato VERIFICA DI IPOTESIIpotesi nulla H Rispecchia la situazione prima dell'osservazione campionaria0Ipotesi alternativa H Nuova rilevazione1 Valori campionari che implicanoRegione di accettazione di H l'accettazione dell'ipotesi nulla0Test statistico Valori campionari che implicano ilRegione di rifiuto di H rifiuto dell'ipotesi nulla0H vera H vera0 1Accetto H Nessun errore Errore del 2° tipo (β)0Rifiuto H Errore del 1° tipo (α) Nessun errore0Verifica di ipotesi sulla media di una popolazione distribuita normalmente - varianza notaTest statistico da utilizzare(tavole distribuzione normale)Sistema di ipotesi Rifiuto H se0Unilaterale a destraH μ ≤ μ Z > z→0 0 1-αH μ > μ→1 0Unilaterale a sinistraH μ ≥ μ Z < -z→0 0 1-αH μ < μ→1
<h2>Bilaterale (o a due code)</h2> <p>Z > zH μ = μ 1-α/2→ Z < -z0 0H μ ≠ μ 1-α/2→1</p> <h2>Verifica di ipotesi sulla media di una popolazione distribuita normalmente - varianza NON nota</h2> <p>Test statistico da utilizzare(tavole distribuzione Student)</p> <h2>Sistema di ipotesi</h2> <p>Rifiuto H se</p> <ul> <li>Unilaterale a destra</li> <ul> <li>H μ ≤ μ→0</li> <li>H μ > μ→1</li> </ul> <li>Unilaterale a sinistra</li> <ul> <li>H μ ≥ μ→0</li> <li>H μ < μ→1</li> </ul> <li>Bilaterale (o a due code)</li> <ul> <li>H μ = μ→0</li> <li>H μ ≠ μ→1</li> </ul> </ul> <h2>Verifica di ipotesi sulla media di una popolazione generica</h2> <p>VARIANZA NOTA (n≥30) VARIANZA NON NOTA (n≥50)</p> <h2>Sistema di ipotesi</h2> <p>Rifiuto H se</p> <ul> <li>Unilaterale a destra</li> <ul> <li>H μ ≤ μ Z > z Z > z→0 0 1-α 1-α</li> </ul> <li>Unilaterale a sinistra</li> <ul> <li>H μ ≥ μ Z < -z Z < -z→0 0 1-α 1-α</li> </ul> <li>Bilaterale (o a due code)</li> <ul> <li>H μ = μ Z > z Z > z→0 0 1-α/2 1-α/2</li> <li>H μ ≠ μ Z > z Z > z→0 0 1-α/2 1-α/2</li> </ul> </ul>μ→1 0 Verifica di ipotesi su una proporzione
Test statistico da utilizzare (tavole distribuzione normale)
Sistema di ipotesi
- Rifiuto H se 0
- Unilaterale a destra
- H p ≤ p Z ≥ z→0 0 p 1-α
- H p > p→1 0
- Unilaterale a sinistra
- H p ≥ p Z ≤ -z→0 0 p 1-α
- H p < p→1 0
- Bilaterale (o a due code)
- Z ≥ zH p = p p 1-α/2→ Z ≤ -z0 0
- H p ≠ p p 1-α/2→1 0
Verifica di ipotesi sulla differenza tra medie di una popolazione distribuita normalmente - varianza nota
Test statistico da utilizzare (tavole distribuzione normale)
Sistema di ipotesi
- Rifiuto H se 0
- Unilaterale a destra
- H μ -μ ≤ μ Z > z→0 1 2 0 1-α
- H μ -μ > μ→1 1 2 0
- Unilaterale a sinistra
- H μ -μ ≥ μ Z < -z→0 1 2 0 1-α
- H μ -μ < μ→1 1 2 0
- Bilaterale (o a due code)
- Z > zH μ -μ =