Anteprima
Vedrai una selezione di 5 pagine su 17
Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 1 Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 2
Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 6
Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 11
Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 16
1 su 17
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

XY

Covarianza

c r

1 ∑ ∑

σ x x y y f

( ) ( )

= −́ − ́

XY i j ij

N i=1 j=1

σ x ∙ y

=μ −́ ́

XY XY

Serve a intuire come è inclinata la retta di regressione se >0 -++- se <0 +--+ se =0 allora i punti

sono disposti in modo che gli scarti positivi e negativi si compensino ovvero quando sono

sparpagliati sul diagramma senza alcuna indipendenza statistica.

Se è una tabella sconnessa usare questa formula:

1 ∑

σ x ∙ y x y

( )

= −́ ́

XY i j

N

Coefficiente di correlazione lineare

σ XY

ρ =

XY √ 2 2

σ σ

X Y

Assume valori fra -1 e +1 e dà indicazioni sia sul verso sia sull’intensità della correlazione tra X e

Y.

• ρXY = -1 quando X e Y sono perfettamente e negativamente correlati, cioè i punti sul diagramma

a dispersione sono perfettamente allineati lungo una retta con pendenza negativa (decrescente).

• ρXY = +1 quando X e Y sono perfettamente e positivamente correlati, cioè i punti sul diagramma

a dispersione sono perfettamente allineati lungo una retta con pendenza positiva (crescente).

• ρXY = 0 quando X e Y sono incorrelati

I valori ρXY intermedi sono interpretabili come percentuale di correlazione. In particolare i valori

compresi fra -1 e 0 indicano % di correlazione negativa mentre i valori compresi tra 0 e +1 indicano

% di correlazione positiva.

Indipendenze

Indipendenza statistica: assenza di qualunque relazione fra X e Y → χ²= 0

Indipendenza in media di Y da X: assenza di condizionamento di X su Y → η²Y = 0

Indipendenza in media di X da Y: assenza di condizionamento (rovesciato) → η²X = 0

Incorrelazione: assenza di relazione lineare fra X e Y → ρXY = 0

Se X e Y sono statisticamente indipendenti non c’è nessuna relazione statistica perciò sono anche

indipendenti in media l’uno dall’altro ed anche correlati. Le implicazioni matematiche sono allora:

i.s. → i.m di X da Y e di Y da X => incorrelazione

In formule

χ² = 0 → η²Y=η²X=0 → ρXY = 0

Situazione limite perfetta relazione

Massima connessione: quando esiste un legame perfetto fra X e Y avente qualunque natura

(lineare e non).

Retta di regressione dei minimi quadrati

Il modello di regressione adatto ad interpretare la correlazione, cioè la relazione lineare fra X e Y, è

la retta di regressione:

̂

Y =a+bX

Condizione dei minimi quadrati

r c

∑ ∑ y y ² f

( )

− ̂

j i ij

i=1 j=1

r c

∑ ∑ [ ]

y a+ bx ² f

( )

¿ −

j i ij

i=1 j=1

Soluzione dei minimi quadrati

σ XY

b= 2

σ X

a= y x

́ −b ́

Residuo/devianza residua

DR misura la variabilità residua cioè la parte di variabilità di Y che non è catturata dalla retta dei

m.q.

• DR=0 quando la retta si adatta perfettamente ai dati reali, quando X e Y sono perfettamente

,

correlati (positivamente o negativamente) e i punti di coordinate (x y ) sul diagramma a

i j

dispersione si presentano allineati lungo una retta crescente o decrescenti.

• DR>0 lascia qualche residuo.

k h

∑ ∑

DR= y y ² f

( )

− ̂

j i ij

i=1 j=1

= k h

∑ ∑ [ ]

y a+bx ² f

( )

j i ij

i=1 j=1

Formula alternativa

2

DR=DT (1−ρ )

XY

Devianza Totale

Si scompone nella somma di due parti ciascuna è a sua volta interpretabile come devianza, una è

la devianza residua l’altra è la devianza spiegata.

h

2

DT y y f

=Nσ = ( − ́ )²

Y j . j

j=1

Devianza spiegata

k

DS= y y f

( ̂ − ́ )²

i i.

i=1

È la parte di variabilità di Y spiegata dalla retta dei m.q.

Formula alternativa

2

DS=DT ∙ ρ XY

Bontà di adattamento della retta dei m.q.

Costruiamo un indice interpretabile come % che misura l’adattamento della retta dei m.q.,

normalizzando

2

DT ∙ ρ

DS XY 2 valori tra0 e 1

= =ρ XY

DT DT

Determinismo e casualità

• Esperimento casuale: è un esperimento condotto sotto l’effetto del caso, quando è nota solo

una parte delle circostanze che consentono di prevedere un risultato con certezza a priori. Di un

esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti.

• Evento elementare: ciascuno dei possibili esiti di un esperimento casuale

• Spazio campionario: è l’insieme di tutti i possibili esiti di un esperimento casuale, elencabili a

priori. Lo spazio campionario è l’insieme di tutti gli eventi elementari. Ω = spazio campionario.

• Evento casuale: è un sottoinsieme dello spazio campionario Ω. Notate che il concetto di evento

casuale è più generale del concetto di evento elementare. Un evento elementare è un singolo

elemento di Ω. un evento casuale è un sottoinsieme di Ω cioè un insieme di eventi elementari: ne

può contenere molti, alcuni, tutti, uno solo o anche nessuno. Anche per l’evento casuale ci serve

una notazione breve; di solito si usano le lettere latine maiuscole tipicamente E.

Variabile casuale: è una funzione con dominio nello spazio campionario Ω e codominio

nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di Ω. La v.c. con

cui si fa inferenza statistica, formalizza le situazioni casuali cioè gli eventi E e le loro probabilità

P(E) in analogia alla variabile statistica v.s. con cui si fa la statistica descrittiva.

• Statistica descrittiva → V.S. → Mod. Freq

• Inferenza statistica → V.C. → Valori V.C., Probabilità

Le probabilità associate ai valori di una v.c. discreta costituiscono la funzione di probabilità.

• V.c. discreta X: v.c. che assume un numero finito di valori x che di solito sono numeri interi

• Funzione di probabilità di X: è associata ad una v.c. discreta, ne descrive completamente le

probabilità ed ha sempre somma 1:

P X=x con P X=x

( ) ( )=1

x

• Funzione di ripartizione: detta f. di distribuzione o f. di probabilità cumulativa. Si definisce in

analogia con le frequenze cumulate della statistica descrittiva.

• Media: quando è riverita ad una v.c. viene anche detta valore atteso o expectation.

Varianza e deviazione standard

• Funzione di ripartizione: è la probabilità che la v.c. X assuma valori minori o uguali ad un

generico valore X:

P X ≤ x x numero reale

( )

• Media o valore atteso: definita come per la v.s. ma usando probabilità al posto delle frequenze:

E X x ∙ P

( )= (X=x )

x

• Varianza: definita e calcolata come per la v.s. ma usando la probabilità al posto delle frequenze:

2

∑ [ ]

V X x−E X ∙ P X=x

( )= ( ) ( )

x

• Deviazione standard: la varianza è elevata al quadrato; quando serve ripristinare ordine di

grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard.

Parlando di v.c. useremo il simbolo SD.

SD X V X

( )= ( )

Variabile casuale binomiale

È una v.c. discreta. Serve per modellare situazioni casuali che hanno 3 caratteristiche:

1. Esperimento casuale consiste nell’esecuzione di n prove indipendenti in cui l’esito di ciascuna

prova non influenza l’esito della prova successiva. Un esperimento di questo genere è ad

esempio un certo numero n di estrazioni a caso condotte tutte nelle stesse condizioni con

reinserimento dell’unità estratta

2. Ciascuna prova più avere come esito uno e soltanto uno di due eventi fra loro contrari ed

esaustivi. Per intenderci chiamiamo questi eventi successo e insuccesso. Si possono modellare

i fenomeni dicotomici cioè i fenomeni statistici che si manifestano con solo 2 modalità contrarie

ed esaustive: si/no, vero/falso.

3. È nota ed è costante in ciascuna prova la probabilità del successo, che denoteremo con p.

poiché p è una probabilità, è un numero compreso fra 0 e 1 e conseguentemente è nota anche

la probabilità dell’insuccesso:

insuccesso=1− p .

P successo p , 0< p<1 → P

( )= ¿

Variabili casuali continue

Per fare inferenza statistica su fenomeni statistici continui, quelli che non si possono contare ma

misurare servono le v.c. continue:

• Le v.c. continue assumono infiniti valori. Tali valori sono talmente tanti e densi da non poter

essere singolarmente indentificati né si è in grado di vederne la probabilità. Nel continuo occorre

fare riferimento a insiemi di valori cioè intervalli.

• Siccome nel continuo i singoli valori non sono visibili, le v.c. continue non hanno funzione di

probabilità P(X=x) hanno la funzione di densità che serve a calcolare la probabilità di intervalli

ϕ

di valori di una v.c. X continua.

• Nel continuo le probabilità sono aree. L’area sottesa al grafico della funzione di densità (x) in un

ϕ

intervallo è la probabilità che X assuma valori in quell’intervallo (x).

ϕ

Variabile casuale normale

Chiamata v.c. di Gauss o Gaussiana, si presta a interpretare un gran insieme di fenomeni statistici

continui, quelli interessanti nelle applicazioni di ricerca sociale. X~N (μ, σ²) si legge X è una v.c.

normale di parametri mu e sigma quadro. μ può essere un numero reale qualunque mentre σ² è un

numero reale positivo. ∞ ∞.

1. È v.c. continua e assume tutti i possibili valori reali: - <x<+

2. Essendo continua non ha la funzione di probabilità ma ha la funzione di densità (X). L’area

ϕ

sottesa al grafico della (X) in un certo intervallo rappresenta la probabilità che la v.c. X assuma

ϕ

valori in quel intervallo. Possiamo fare a meno di esplicitare la formula di (X) ma ci sarà utile la

ϕ

sua rappresentazione grafica che è la famosa curva a campana centrata sul valore μ.

3. L’area totale sottesa all’intera curva (X) corrisponde alla probabilità dell’intero intervallo (-

ϕ

∞ ∞

<x<+ ) dei valori di X ed è pari a 1.

4. Il parametro μ è la media di X~N (μ, σ²). In formule

Dettagli
Publisher
A.A. 2015-2016
17 pagine
2 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher stearbitrio di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Mecatti Fulvia.