vuoi
o PayPal
tutte le volte che vuoi
XY
Covarianza
c r
1 ∑ ∑
σ x x y y f
( ) ( )
= −́ − ́
XY i j ij
N i=1 j=1
σ x ∙ y
=μ −́ ́
XY XY
Serve a intuire come è inclinata la retta di regressione se >0 -++- se <0 +--+ se =0 allora i punti
sono disposti in modo che gli scarti positivi e negativi si compensino ovvero quando sono
sparpagliati sul diagramma senza alcuna indipendenza statistica.
Se è una tabella sconnessa usare questa formula:
1 ∑
σ x ∙ y x y
( )
= −́ ́
XY i j
N
Coefficiente di correlazione lineare
σ XY
ρ =
XY √ 2 2
σ σ
X Y
Assume valori fra -1 e +1 e dà indicazioni sia sul verso sia sull’intensità della correlazione tra X e
Y.
• ρXY = -1 quando X e Y sono perfettamente e negativamente correlati, cioè i punti sul diagramma
a dispersione sono perfettamente allineati lungo una retta con pendenza negativa (decrescente).
• ρXY = +1 quando X e Y sono perfettamente e positivamente correlati, cioè i punti sul diagramma
a dispersione sono perfettamente allineati lungo una retta con pendenza positiva (crescente).
• ρXY = 0 quando X e Y sono incorrelati
I valori ρXY intermedi sono interpretabili come percentuale di correlazione. In particolare i valori
compresi fra -1 e 0 indicano % di correlazione negativa mentre i valori compresi tra 0 e +1 indicano
% di correlazione positiva.
Indipendenze
Indipendenza statistica: assenza di qualunque relazione fra X e Y → χ²= 0
Indipendenza in media di Y da X: assenza di condizionamento di X su Y → η²Y = 0
Indipendenza in media di X da Y: assenza di condizionamento (rovesciato) → η²X = 0
Incorrelazione: assenza di relazione lineare fra X e Y → ρXY = 0
Se X e Y sono statisticamente indipendenti non c’è nessuna relazione statistica perciò sono anche
indipendenti in media l’uno dall’altro ed anche correlati. Le implicazioni matematiche sono allora:
i.s. → i.m di X da Y e di Y da X => incorrelazione
In formule
χ² = 0 → η²Y=η²X=0 → ρXY = 0
Situazione limite perfetta relazione
Massima connessione: quando esiste un legame perfetto fra X e Y avente qualunque natura
(lineare e non).
Retta di regressione dei minimi quadrati
Il modello di regressione adatto ad interpretare la correlazione, cioè la relazione lineare fra X e Y, è
la retta di regressione:
̂
Y =a+bX
Condizione dei minimi quadrati
r c
∑ ∑ y y ² f
( )
− ̂
j i ij
i=1 j=1
r c
∑ ∑ [ ]
y a+ bx ² f
( )
¿ −
j i ij
i=1 j=1
Soluzione dei minimi quadrati
σ XY
b= 2
σ X
a= y x
́ −b ́
Residuo/devianza residua
DR misura la variabilità residua cioè la parte di variabilità di Y che non è catturata dalla retta dei
m.q.
• DR=0 quando la retta si adatta perfettamente ai dati reali, quando X e Y sono perfettamente
,
correlati (positivamente o negativamente) e i punti di coordinate (x y ) sul diagramma a
i j
dispersione si presentano allineati lungo una retta crescente o decrescenti.
• DR>0 lascia qualche residuo.
k h
∑ ∑
DR= y y ² f
( )
− ̂
j i ij
i=1 j=1
= k h
∑ ∑ [ ]
y a+bx ² f
( )
−
j i ij
i=1 j=1
Formula alternativa
2
DR=DT (1−ρ )
XY
Devianza Totale
Si scompone nella somma di due parti ciascuna è a sua volta interpretabile come devianza, una è
la devianza residua l’altra è la devianza spiegata.
h
∑
2
DT y y f
=Nσ = ( − ́ )²
Y j . j
j=1
Devianza spiegata
k
∑
DS= y y f
( ̂ − ́ )²
i i.
i=1
È la parte di variabilità di Y spiegata dalla retta dei m.q.
Formula alternativa
2
DS=DT ∙ ρ XY
Bontà di adattamento della retta dei m.q.
Costruiamo un indice interpretabile come % che misura l’adattamento della retta dei m.q.,
normalizzando
2
DT ∙ ρ
DS XY 2 valori tra0 e 1
= =ρ XY
DT DT
Determinismo e casualità
• Esperimento casuale: è un esperimento condotto sotto l’effetto del caso, quando è nota solo
una parte delle circostanze che consentono di prevedere un risultato con certezza a priori. Di un
esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti.
• Evento elementare: ciascuno dei possibili esiti di un esperimento casuale
• Spazio campionario: è l’insieme di tutti i possibili esiti di un esperimento casuale, elencabili a
priori. Lo spazio campionario è l’insieme di tutti gli eventi elementari. Ω = spazio campionario.
• Evento casuale: è un sottoinsieme dello spazio campionario Ω. Notate che il concetto di evento
casuale è più generale del concetto di evento elementare. Un evento elementare è un singolo
elemento di Ω. un evento casuale è un sottoinsieme di Ω cioè un insieme di eventi elementari: ne
può contenere molti, alcuni, tutti, uno solo o anche nessuno. Anche per l’evento casuale ci serve
una notazione breve; di solito si usano le lettere latine maiuscole tipicamente E.
Variabile casuale: è una funzione con dominio nello spazio campionario Ω e codominio
nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di Ω. La v.c. con
cui si fa inferenza statistica, formalizza le situazioni casuali cioè gli eventi E e le loro probabilità
P(E) in analogia alla variabile statistica v.s. con cui si fa la statistica descrittiva.
• Statistica descrittiva → V.S. → Mod. Freq
• Inferenza statistica → V.C. → Valori V.C., Probabilità
Le probabilità associate ai valori di una v.c. discreta costituiscono la funzione di probabilità.
• V.c. discreta X: v.c. che assume un numero finito di valori x che di solito sono numeri interi
• Funzione di probabilità di X: è associata ad una v.c. discreta, ne descrive completamente le
probabilità ed ha sempre somma 1:
∑
P X=x con P X=x
( ) ( )=1
x
• Funzione di ripartizione: detta f. di distribuzione o f. di probabilità cumulativa. Si definisce in
analogia con le frequenze cumulate della statistica descrittiva.
• Media: quando è riverita ad una v.c. viene anche detta valore atteso o expectation.
Varianza e deviazione standard
• Funzione di ripartizione: è la probabilità che la v.c. X assuma valori minori o uguali ad un
generico valore X:
P X ≤ x x numero reale
( )
• Media o valore atteso: definita come per la v.s. ma usando probabilità al posto delle frequenze:
∑
E X x ∙ P
( )= (X=x )
x
• Varianza: definita e calcolata come per la v.s. ma usando la probabilità al posto delle frequenze:
2
∑ [ ]
V X x−E X ∙ P X=x
( )= ( ) ( )
x
• Deviazione standard: la varianza è elevata al quadrato; quando serve ripristinare ordine di
grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard.
Parlando di v.c. useremo il simbolo SD.
√
SD X V X
( )= ( )
Variabile casuale binomiale
È una v.c. discreta. Serve per modellare situazioni casuali che hanno 3 caratteristiche:
1. Esperimento casuale consiste nell’esecuzione di n prove indipendenti in cui l’esito di ciascuna
prova non influenza l’esito della prova successiva. Un esperimento di questo genere è ad
esempio un certo numero n di estrazioni a caso condotte tutte nelle stesse condizioni con
reinserimento dell’unità estratta
2. Ciascuna prova più avere come esito uno e soltanto uno di due eventi fra loro contrari ed
esaustivi. Per intenderci chiamiamo questi eventi successo e insuccesso. Si possono modellare
i fenomeni dicotomici cioè i fenomeni statistici che si manifestano con solo 2 modalità contrarie
ed esaustive: si/no, vero/falso.
3. È nota ed è costante in ciascuna prova la probabilità del successo, che denoteremo con p.
poiché p è una probabilità, è un numero compreso fra 0 e 1 e conseguentemente è nota anche
la probabilità dell’insuccesso:
insuccesso=1− p .
P successo p , 0< p<1 → P
( )= ¿
Variabili casuali continue
Per fare inferenza statistica su fenomeni statistici continui, quelli che non si possono contare ma
misurare servono le v.c. continue:
• Le v.c. continue assumono infiniti valori. Tali valori sono talmente tanti e densi da non poter
essere singolarmente indentificati né si è in grado di vederne la probabilità. Nel continuo occorre
fare riferimento a insiemi di valori cioè intervalli.
• Siccome nel continuo i singoli valori non sono visibili, le v.c. continue non hanno funzione di
probabilità P(X=x) hanno la funzione di densità che serve a calcolare la probabilità di intervalli
ϕ
di valori di una v.c. X continua.
• Nel continuo le probabilità sono aree. L’area sottesa al grafico della funzione di densità (x) in un
ϕ
intervallo è la probabilità che X assuma valori in quell’intervallo (x).
ϕ
Variabile casuale normale
Chiamata v.c. di Gauss o Gaussiana, si presta a interpretare un gran insieme di fenomeni statistici
continui, quelli interessanti nelle applicazioni di ricerca sociale. X~N (μ, σ²) si legge X è una v.c.
normale di parametri mu e sigma quadro. μ può essere un numero reale qualunque mentre σ² è un
numero reale positivo. ∞ ∞.
1. È v.c. continua e assume tutti i possibili valori reali: - <x<+
2. Essendo continua non ha la funzione di probabilità ma ha la funzione di densità (X). L’area
ϕ
sottesa al grafico della (X) in un certo intervallo rappresenta la probabilità che la v.c. X assuma
ϕ
valori in quel intervallo. Possiamo fare a meno di esplicitare la formula di (X) ma ci sarà utile la
ϕ
sua rappresentazione grafica che è la famosa curva a campana centrata sul valore μ.
3. L’area totale sottesa all’intera curva (X) corrisponde alla probabilità dell’intero intervallo (-
ϕ
∞ ∞
<x<+ ) dei valori di X ed è pari a 1.
4. Il parametro μ è la media di X~N (μ, σ²). In formule