Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti

Riassunto per l'esame di Statistica, basato su appunti personali e studio autonomo del testo consigliato dal docente Statistica di Base. Come, quando e perché, Mecatti. Università …

Esame Statistica

Facoltà Sociologia

Dal corso del Prof. Mecatti Fulvia

Università Università degli Studi di Milano - Bicocca

Publisher stearbitrio

A.A. 2015-2016

17 pagine

2 download

Appunto

Vota 5,0 / 5 (2)

Scarica

Estratto del documento

XY

Covarianza

c r

1 ∑ ∑

σ x x y y f

( ) ( )

= −́ − ́

XY i j ij

N i=1 j=1

σ x ∙ y

=μ −́ ́

XY XY

Serve a intuire come è inclinata la retta di regressione se >0 -++- se <0 +--+ se =0 allora i punti

sono disposti in modo che gli scarti positivi e negativi si compensino ovvero quando sono

sparpagliati sul diagramma senza alcuna indipendenza statistica.

Se è una tabella sconnessa usare questa formula:

1 ∑

σ x ∙ y x y

( )

= −́ ́

XY i j

N

Coefficiente di correlazione lineare

σ XY

ρ =

XY √ 2 2

σ σ

X Y

Assume valori fra -1 e +1 e dà indicazioni sia sul verso sia sull’intensità della correlazione tra X e

Y.

• ρXY = -1 quando X e Y sono perfettamente e negativamente correlati, cioè i punti sul diagramma

a dispersione sono perfettamente allineati lungo una retta con pendenza negativa (decrescente).

• ρXY = +1 quando X e Y sono perfettamente e positivamente correlati, cioè i punti sul diagramma

a dispersione sono perfettamente allineati lungo una retta con pendenza positiva (crescente).

• ρXY = 0 quando X e Y sono incorrelati

I valori ρXY intermedi sono interpretabili come percentuale di correlazione. In particolare i valori

compresi fra -1 e 0 indicano % di correlazione negativa mentre i valori compresi tra 0 e +1 indicano

% di correlazione positiva.

Indipendenze

Indipendenza statistica: assenza di qualunque relazione fra X e Y → χ²= 0

Indipendenza in media di Y da X: assenza di condizionamento di X su Y → η²Y = 0

Indipendenza in media di X da Y: assenza di condizionamento (rovesciato) → η²X = 0

Incorrelazione: assenza di relazione lineare fra X e Y → ρXY = 0

Se X e Y sono statisticamente indipendenti non c’è nessuna relazione statistica perciò sono anche

indipendenti in media l’uno dall’altro ed anche correlati. Le implicazioni matematiche sono allora:

i.s. → i.m di X da Y e di Y da X => incorrelazione

In formule

χ² = 0 → η²Y=η²X=0 → ρXY = 0

Situazione limite perfetta relazione

Massima connessione: quando esiste un legame perfetto fra X e Y avente qualunque natura

(lineare e non).

Retta di regressione dei minimi quadrati

Il modello di regressione adatto ad interpretare la correlazione, cioè la relazione lineare fra X e Y, è

la retta di regressione:

Y =a+bX

Condizione dei minimi quadrati

r c

∑ ∑ y y ² f

( )

− ̂

j i ij

i=1 j=1

r c

∑ ∑ [ ]

y a+ bx ² f

( )

¿ −

j i ij

i=1 j=1

Soluzione dei minimi quadrati

σ XY

b= 2

σ X

a= y x

́ −b ́

Residuo/devianza residua

DR misura la variabilità residua cioè la parte di variabilità di Y che non è catturata dalla retta dei

m.q.

• DR=0 quando la retta si adatta perfettamente ai dati reali, quando X e Y sono perfettamente

correlati (positivamente o negativamente) e i punti di coordinate (x y ) sul diagramma a

i j

dispersione si presentano allineati lungo una retta crescente o decrescenti.

• DR>0 lascia qualche residuo.

k h

∑ ∑

DR= y y ² f

( )

− ̂

j i ij

i=1 j=1

= k h

∑ ∑ [ ]

y a+bx ² f

( )

−

j i ij

i=1 j=1

Formula alternativa

DR=DT (1−ρ )

XY

Devianza Totale

Si scompone nella somma di due parti ciascuna è a sua volta interpretabile come devianza, una è

la devianza residua l’altra è la devianza spiegata.

∑

DT y y f

=Nσ = ( − ́ )²

Y j . j

j=1

Devianza spiegata

∑

DS= y y f

( ̂ − ́ )²

i i.

i=1

È la parte di variabilità di Y spiegata dalla retta dei m.q.

Formula alternativa

DS=DT ∙ ρ XY

Bontà di adattamento della retta dei m.q.

Costruiamo un indice interpretabile come % che misura l’adattamento della retta dei m.q.,

normalizzando

DT ∙ ρ

DS XY 2 valori tra0 e 1

= =ρ XY

DT DT

Determinismo e casualità

• Esperimento casuale: è un esperimento condotto sotto l’effetto del caso, quando è nota solo

una parte delle circostanze che consentono di prevedere un risultato con certezza a priori. Di un

esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti.

• Evento elementare: ciascuno dei possibili esiti di un esperimento casuale

• Spazio campionario: è l’insieme di tutti i possibili esiti di un esperimento casuale, elencabili a

priori. Lo spazio campionario è l’insieme di tutti gli eventi elementari. Ω = spazio campionario.

• Evento casuale: è un sottoinsieme dello spazio campionario Ω. Notate che il concetto di evento

casuale è più generale del concetto di evento elementare. Un evento elementare è un singolo

elemento di Ω. un evento casuale è un sottoinsieme di Ω cioè un insieme di eventi elementari: ne

può contenere molti, alcuni, tutti, uno solo o anche nessuno. Anche per l’evento casuale ci serve

una notazione breve; di solito si usano le lettere latine maiuscole tipicamente E.

Variabile casuale: è una funzione con dominio nello spazio campionario Ω e codominio

nell’insieme dei numeri reali, a cui rimangono associate le probabilità degli eventi di Ω. La v.c. con

cui si fa inferenza statistica, formalizza le situazioni casuali cioè gli eventi E e le loro probabilità

P(E) in analogia alla variabile statistica v.s. con cui si fa la statistica descrittiva.

• Statistica descrittiva → V.S. → Mod. Freq

• Inferenza statistica → V.C. → Valori V.C., Probabilità

Le probabilità associate ai valori di una v.c. discreta costituiscono la funzione di probabilità.

• V.c. discreta X: v.c. che assume un numero finito di valori x che di solito sono numeri interi

• Funzione di probabilità di X: è associata ad una v.c. discreta, ne descrive completamente le

probabilità ed ha sempre somma 1:

∑

P X=x con P X=x

( ) ( )=1

• Funzione di ripartizione: detta f. di distribuzione o f. di probabilità cumulativa. Si definisce in

analogia con le frequenze cumulate della statistica descrittiva.

• Media: quando è riverita ad una v.c. viene anche detta valore atteso o expectation.

Varianza e deviazione standard

• Funzione di ripartizione: è la probabilità che la v.c. X assuma valori minori o uguali ad un

generico valore X:

P X ≤ x x numero reale

( )

• Media o valore atteso: definita come per la v.s. ma usando probabilità al posto delle frequenze:

∑

E X x ∙ P

( )= (X=x )

• Varianza: definita e calcolata come per la v.s. ma usando la probabilità al posto delle frequenze:

∑ [ ]

V X x−E X ∙ P X=x

( )= ( ) ( )

• Deviazione standard: la varianza è elevata al quadrato; quando serve ripristinare ordine di

grandezza e unità di misura di X, si prende la radice quadrata e si ottiene la deviazione standard.

Parlando di v.c. useremo il simbolo SD.

√

SD X V X

( )= ( )

Variabile casuale binomiale

È una v.c. discreta. Serve per modellare situazioni casuali che hanno 3 caratteristiche:

1. Esperimento casuale consiste nell’esecuzione di n prove indipendenti in cui l’esito di ciascuna

prova non influenza l’esito della prova successiva. Un esperimento di questo genere è ad

esempio un certo numero n di estrazioni a caso condotte tutte nelle stesse condizioni con

reinserimento dell’unità estratta

2. Ciascuna prova più avere come esito uno e soltanto uno di due eventi fra loro contrari ed

esaustivi. Per intenderci chiamiamo questi eventi successo e insuccesso. Si possono modellare

i fenomeni dicotomici cioè i fenomeni statistici che si manifestano con solo 2 modalità contrarie

ed esaustive: si/no, vero/falso.

3. È nota ed è costante in ciascuna prova la probabilità del successo, che denoteremo con p.

poiché p è una probabilità, è un numero compreso fra 0 e 1 e conseguentemente è nota anche

la probabilità dell’insuccesso:

insuccesso=1− p .

P successo p , 0< p<1 → P

( )= ¿

Variabili casuali continue

Per fare inferenza statistica su fenomeni statistici continui, quelli che non si possono contare ma

misurare servono le v.c. continue:

• Le v.c. continue assumono infiniti valori. Tali valori sono talmente tanti e densi da non poter

essere singolarmente indentificati né si è in grado di vederne la probabilità. Nel continuo occorre

fare riferimento a insiemi di valori cioè intervalli.

• Siccome nel continuo i singoli valori non sono visibili, le v.c. continue non hanno funzione di

probabilità P(X=x) hanno la funzione di densità che serve a calcolare la probabilità di intervalli

di valori di una v.c. X continua.

• Nel continuo le probabilità sono aree. L’area sottesa al grafico della funzione di densità (x) in un

intervallo è la probabilità che X assuma valori in quell’intervallo (x).

Variabile casuale normale

Chiamata v.c. di Gauss o Gaussiana, si presta a interpretare un gran insieme di fenomeni statistici

continui, quelli interessanti nelle applicazioni di ricerca sociale. X~N (μ, σ²) si legge X è una v.c.

normale di parametri mu e sigma quadro. μ può essere un numero reale qualunque mentre σ² è un

numero reale positivo. ∞ ∞.

1. È v.c. continua e assume tutti i possibili valori reali: - <x<+

2. Essendo continua non ha la funzione di probabilità ma ha la funzione di densità (X). L’area

sottesa al grafico della (X) in un certo intervallo rappresenta la probabilità che la v.c. X assuma

valori in quel intervallo. Possiamo fare a meno di esplicitare la formula di (X) ma ci sarà utile la

sua rappresentazione grafica che è la famosa curva a campana centrata sul valore μ.

3. L’area totale sottesa all’intera curva (X) corrisponde alla probabilità dell’intero intervallo (-

∞ ∞

<x<+ ) dei valori di X ed è pari a 1.

4. Il parametro μ è la media di X~N (μ, σ²). In formule

Anteprima

Vedrai una selezione di 5 pagine su 17

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 1

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 2

Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.

Scarica

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 6

Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.

Scarica

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 11

Anteprima di 5 pagg. su 17.
Scarica il documento per vederlo tutto.

Scarica

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti Pag. 16

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher stearbitrio di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Mecatti Fulvia.

Appunti correlati

Invia appunti e guadagna

Recensioni

5/5

2 recensioni

5 stelle

4 stelle

3 stelle

2 stelle

1 stella

Ti è piaciuto questo appunto?

Rocco.hunted.12

11 Novembre 2016

Heatrfjoifj

27 Luglio 2016

Riassunto esame Statistica, Docente Mecatti, libro consigliato Statistica di Base. Come, quando e perché, Mecatti

XY

XY XY

N

X Y

Y.

XY

DT DT

SD X V X

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Salvatore F.

Matteo S.

Daniele P.