Estratto del documento

INDICE DI CORRELAZIONE

Se S(X) è lo scarto quadratico medio di X e S(Y) è quello di Y, si ha: - S(X)S(Y) < Cov(X,Y) < S(X)S(Y). Rapportando quindi la covarianza al suo massimo si ottiene un indice relativo detto COEFFICIENTE DI CORRELAZIONE LINEARE (di Bravais-Pearson): Non ha unità di misura.

Se il coefficiente è = 1 o = -1 MASSIMA CORRELAZIONE.

ESERCIZIO: Calcola COVARIANZA e COEFFICIENTE DI CORRELAZIONE LINEARE.

COVARIANZA:

  1. Calcolo la media X: x medio = (30+43+55+22+58+37)/6 = 40,83
  2. Calcolo media Y: x medio = (25+38+31+24+39+33)/6 = 31,67
  3. Scarti medi aritmetica X e Y: x – x medio; y – x medio:
    • X': 30 – 40,83 = -10,83
    • Y': 25 – 31,67 = -6,67
    • X': 43 – 40,83 = 2,17
    • Y': 38 – 31,67 = 6,33
    • X': 55 – 40,83 = 14,17
    • Y': 31 – 31,67 = -0,67
    • X': 22 - 40,83 = -18,83
    • Y': 24 – 31,67 = -7,67
    • X': 58 – 40,83 = 17,17
    • Y': 39 – 31,67 = 7,33
    • X': 37 – 40,83 = -3,83
    • Y': 33 – 31,67 = 1,33
  4. Moltiplico X' e Y':

X’*Y’-10,83*-6,67 =72,24

2,17*6,33 =13,74

14,17*-0,67 =-9,49

-18,83*-7,67 =144,43

17,17*7,33 =Prevalgono gi scarti concordi (+), quindi 125,86

COVARIANZA POSITIVA.-3,83*1,33 =-5,09

TOTALE 341,67

341,67 è CODEVIANZA tra X e Y. 341,67/6 = 56,95 è la COVARIANZA c’è una certa associazione perché è diversa da 0. Essendo positivo c’è una prevalenza discostamenti concordi.

5. Calcolo S(X) e S(Y):

(-10,83) alla (-6,67)allaseconda = seconda = 44,49

117,29(2,17)alla (6,33)allaseconda = 4,71 seconda = 40,07

(14,17)alla (-0,67)allaseconda = seconda = 0,45

200,79(-18,83)alla (-7,67)allaseconda = seconda = 58,83

354,57(17,17)alla (7,33)allaseconda = seconda = 53,73

294,81(-3,83)alla (1,33)allaseconda = 14,67 seconda = 1,77

TOTALE = TOTALE =986,83

986,83 è DEVIANZA(X) 986,83/6 = 164,47 VARIANZA(X) Radice dellaV(X) = 12,82 Scarto quadratico medio X

199,33 è DEVIANZA(y) 199,33/6 = 33,22 VARIANZA(y) Radice della V(Y)

=5,76 scarto quadratico medio Yr = 56,95/(12,82*5,76) = 0,77

COEFFICIENTE DI CORRELAZIONE: compreso tra 0 e 1 (0 assenza di correlazione, 1 perfetta correlazione. Se ha segno + il tipo di relazione è positiva, se ha segno – è negativa quindi all'aumentare di una l'altra diminuisce). Il segno dipende dalla COVARIANZA. L'ammontare della correlazione rispetto alla massima possibile. Tra i due caratteri si verifica il 77% della massima correlazione lineare possibile. Più ci si avvicina allo 0 la correlazione è debole, più aumenta, più aumenta l'intensità della correlazione. In questo caso ho una forte correlazione.

DIPENDENZA E REGRESSIONE: Con la CONCORDANZA si valuta la presenza di un legame reciproco tra due variabili. Con la CORRELAZIONE si misura l'interdipendenza lineare, cioè l'esistenza di un legame lineare tra due variabili e la sua direzione. Con la REGRESSIONE si valuta la presenza di una

dipendenza causale tra due variabili: una variabile indipendente (X) che influenza una variabile dipendente (Y). In generale, un modello statistico di dipendenza di Y da X si definisce:

Nel nostro caso, la regressione tra le variabili è una retta di regressione.

Esempio:

Retta di regressione: Y = 0,35X + 17,38

BETA 1: Variazione della Y per un incremento unitario della X. Il coefficiente è POSITIVO, quindi per un anno in più mi aspetto che il reddito aumenti in media di 0,35.

BETA 0: Valore di Y che mi aspetto quando X è = 0. Non ha senso interpretare questo valore perché non è un caso reale avendo età = 0. Si commenta solo quando il valore 0 della X ha senso (qui no perché età = 0 vuol dire che una persona non esiste).

Retta: Y* = 17,38 + 0,35X

Y* = ? X = 40. Il valore che mi aspetto per la Y con un soggetto di 40 anni è: 17,38 + 0,35(40) = 31,38 mln € (reddito)

Esempio 2 sulla REGRESSIONE:

Innanzitutto calcolo il totale delle X e delle Y. Devo

poi sempre partire dal coefficiente di variazione (B1), quindi devo calcolare media di X e Y. Successivamente calcolo X-Xmedio e Y-Ymedio. Calcolo poi un'altra colonna con X-Xmedio alla seconda. Una volta completata la tabella, calcolo B1, B2 e la retta Y*. Per una filiale in più in media mi aspetto un incremento di un numero di mutui pari a 0,15. INDICE DI DETERMINAZIONE LINEARE R alla seconda È un indicatore che si basa sulla decomposizione della devianza totale di Y nella somma della devianza di regressione e della devianza di dispersione. Questo indice spiega quanta parte di Y è spiegata dalla sua dipendenza lineare/relazione lineare con la X. R alla seconda è il nome dell'indice ed è uguale a r elevato alla seconda. SST è lo scarto tra yi e la media y. Scarto della devianza di regressione è SSR. SSE è lo scarto residuo, la devianza di dispersione di Y (variabilità residua). CASI LIMITE: R quadro = 1 numeratore e

denominatore sono uguali devianza totale => devianza di regressione. Tutta la variabilità della Y è spiegata dalla sua dipendenza lineare con la X. Devianza di dispersione è 0. Grafico sopra: retta discendente all'aumentare della X, la Y diminuisce. Se calcolo la covarianza, questa sarà negativa e i caratteri discordi. La correlazione sarà uguale a -1 (r). Nel grafico sotto la retta è ascendente all'aumentare della X, la Y aumenta. La covarianza sarà positiva e r=1 per la perfetta correlazione lineare. Devianza di regressione = 0 e devianza di dispersione = devianza totale. Non c'è relazione lineare tra X e Y (perché qualsiasi valore ho della X, quello della Y previsto NON cambia, ma è sempre Y medio) e retta parallela all'asse X. Avrò quindi r=0 e Rquadro=0. Non viene spiegata la variabilità della Y. CAMBIANO I VALORI DEL CARATTERE E I VALORI DELLE UNITÀ. Fi sarà 1/12,2/12,

3/12 … 2 PARTE

Test a scelta multipla, domande a risposta aperta per commentare e interpretare i risultati. Risposte sbagliate possono valere 0 o -0.

LA PROBABILITA’

Campione = osservazione parziale della popolazione.

Differenza tra il primo 22 mila e il secondo: del secondo campione ci fidiamo di più perché abbiamo raccolto più informazioni, quindi l’incertezza che ci lascia il secondo campione è molto più piccola di quella del primo. I 22 mila si chiamano STIME CAMPIONARIE, cioè il nostro tentativo di stimare la media della variabile “Reddito”.

L’incertezza è misurata con gli strumenti di calcolo della probabilità.

Per passare dal campione alla popolazione necessitiamo del calcolo della probabilità e tale processo è detto INFERENZA STATISTICA.

Proposizioni certe: di cui possiamo dire con certezza che siano vere o false.

Proposizioni incerte: di cui attualmente non sappiamo dire se saranno

vere o false e la cui verità dipende dall'accadimento di un fatto. Dopo l'accadimento, queste proposizioni diventeranno certamente vere o false (importante caratteristica delle proposizioni incerte). Un esempio classico di proposizione incerta è il lancio della monetina. Prima di lanciare la moneta possono accadere 2 cose, ma dopo averla lanciata me ne accade solo una. All'interno di questo ambito ci dobbiamo muovere per costruire il calcolo della probabilità. Le proposizioni incerte vengono definite EVENTI (una delle possibili cose che possono accadere quando concediamo una prova aleatoria, il cui esito è incerto prima che venga conclusa). La probabilità rappresenta una misura dell'incertezza associata ad eventi. PROVA o ESPERIMENTO ALEATORIO è un esperimento il cui risultato non può essere previsto con certezza, ad esempio il lancio della moneta. In questo caso abbiamo estrema rilevanza pratica (o applicata), cioè sonoA: può valere anche con ROSSO, BIANCO, NERO, BIANCO o in altri casi, perché non viene considerato l'ordine di estrazione. B: valgono tutti i 5 casi perché non viene estratta la pallina nera.

C: valgono tutti i 5 casi perché vengono estratte 2 o più palline bianche. La PROVA è l'estrazione di 4 palline. A è considerato un EVENTO ELEMENTARE, mentre B e C sono EVENTI NON ELEMENTARI.

Eventi elementari: cliente solvibile e cliente non solvibile. Prova = concessione del prestito. Spazio campionario: insieme dei due eventi elementari.

Prova: estrazione di 30 blocchetti dalla produzione di un certo giorno. Eventi: numero di blocchetti difettosi (da 30 a 0). L'evento A contiene un solo evento elementare, cioè "non difettoso". L'evento B contiene eventi elementari ognuno dei quali soddisfa la condizione di B (cioè meno di 3 elementi difettosi, quindi 0, 1 o 2). B è un evento non elementare.

Se si osservano 0 blocchetti difettosi, allora si sono verificati sia B che A, l'evento B contiene A. B e C sono due eventi DISGIUNTI o INCOMPATIBILI perché gli elementi di C non sono presenti in B e viceversa.

Se unisco gli eventi elementari di B e C, ottengo tutti gli eventi elementari, cioè lo spazio campionario (ω). Una volta effettuata la prova osserveremo B oppure C, infatti B e C contengono tutti gli eventi elementari (l'insieme di tutti gli eventi elementari è B ∪ C = Ω). Inoltre, A fa parte di B (⊆). Ogni evento non elementare costituisce un'aggregazione di eventi elementari o un insieme. Un evento non elementare si verifica se si verifica uno degli eventi elementari che lo compongono. Un evento è caratterizzato.
Anteprima
Vedrai una selezione di 10 pagine su 184
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 31
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 36
Anteprima di 10 pagg. su 184.
Scarica il documento per vederlo tutto.
Statistica Pag. 41
1 su 184
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher fiorifede di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Greco Fedele Pasquale.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community