Anteprima
Vedrai una selezione di 10 pagine su 45
Appunti corso di Statistica Pag. 1 Appunti corso di Statistica Pag. 2
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 6
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 11
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 16
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 21
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 26
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 31
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 36
Anteprima di 10 pagg. su 45.
Scarica il documento per vederlo tutto.
Appunti corso di Statistica Pag. 41
1 su 45
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

OPERATORI DI DISPERSIONE

variabili nominali ( es. titolo di studio )

mutabilità del Gini : misura l’eterogeneità e l’omogeneità ( E )

1

!

"

1 −

formula: 1 - sommatoria di tutte le frequenze f alla seconda

#$% misura assoluta ( E ) indice assoluto di mutabilità del Gini.

1

K = numero delle modalità delle variabili

Nell’esempio titolo di studio omogeneo K è 5.

Lucrezia Saia

Più il valore di questo indice è crescente, più l’eterogeneità è presente.

Per calcolare però questo indice si utilizza la formula della misura assoluta E .

1

!"#

= indica il valore massimo che questo indice può assumere

!

Questa formula serve per capire quanto eterogenea è la variabile.

formula: !"#

misura relativa e

( ) numeri che variano tra 0 e 1

#

1 !

0 = massima omogeneità

1 = massima eterogeneità

Esempio:

K = 5

E = 1 - ( 0,16 + 0,00 + 0,04 + 0,04 + 0,04 ) = 1 - 0,28 = 0,72

1

valore massimo 5 - 1 / 5 = 0,80

à (

e = 0,72 / 0,80 = 0,90 oppure eterogeneità

× 0,72 = 0,9 à

1 )

Entropia ( E )

2

sommatoria negativa della moltiplicazione tra frequenze relative e i logaritmi delle frequenze

relative. +

∑ entropia assoluta ( E )

formula: − log 2

% *

+&'

$

! entropia relativa ( e )

formula: 2

%&' !

"

0 = massimo omogeneità

1 = massimo eterogeneità

Misure speculari indicati con O che significa omogeneità.

indice di Herfindal ( O ) : se E è 0,60 ( eterogeneità ) O sarà omogeneo a 0,40

1 2 1

variabili cardinali ( variabilità metrica )

campo ( o range ) di variazione = differenza tra valore minimo e valore massimo della distribuzione

OPERATORI DI DISPERSIONE

Scostamento semplice medio = scarti positivi

Lucrezia Saia

Scarti = differenze tra i valori osservati ( x ) e il valore medio della variabile ( )

̅

i

$ !

(* )

∑ " *̅

#

#%&

2

Varianza ( s ):

• .

formula estesa

Tutte le x al quadrato e ne ricaviamo la media

Il quadrato della media aritmetica

! "

∑ i

MEDIA ARITMETICA = la significa che il valore va da 1 fino a N

#

#$!

"

Deviazione standard ( s )= √ operatore di dispersione

• à

Esercizio guidato: VARIABILE CARDINALE

Moda: 5 ( perché il punteggio 5 appare 3 volte )

Mediana: prima cosa distribuzione ordinata dei valori - punteggi -

2

3

5

5

5

6

6

7

9 →

N è dispari quindi unico caso mediano = N + 1 / 2 9 + 1 / 2 = 5 posizione rispetto all’ordine dei

numeri fatto prima. Alla quinta posizione troviamo il numero 5 quindi la mediana è 5.

Media: 5+3+5+6+9+6+2+7+5 / 9 = 48 / 2 = 5,33

Scarti della media: →

=

x 5 - 5,33 = - 0,33 serve il valore assoluto quindi diventerà 0,33 ( positivo )

1

x = 3 - 5,33 = - 2,33

2

x = 5 - 5,33 = - 0,33

3

x = 6 - 5,33 = 0,67

4 (

∑ |# |

$ #̅

'

')*

scostamento semplice medio

• ' 1,48

( 0,33 + 2,33 + 0,33 + 0,67 + 3,67 + 0,67 + 3,33 + 1,67 + 0,33 ) / 9 =

( +

∑ (# )

$ #̅

'

')*

varianza : 3,78

vedi slide

'

deviazione standard :

• = 1,94 indica la variabilità media della distribuzione

√3,78

Coefficiente di variazione

Lucrezia Saia MOMENTO OMOGENEO

= medie delle x elevate ad un certo esponente

• Centrale = si riferiscono agli scarti dalla media, vengono utilizzati per ottenere informazioni

rispetto alla distribuzione.

• Non centrale

ASIMMETRIA

Formula di Pearson = calcolo dell’asimmetria, rapporto tra momenti centrali omogenei elevati

%

alla 2° e alla 3°

momento omogeneo di 2° ordine

=

! = momento omogeneo di 3° ordine valutare la forma di una distribuzione ( = )

à

' (

Formula di Pearson sostituita con la formula di Fisher ( )

! %

CURTOSI

Abbiamo bisogno di un momento omogeneo di ordine 4° ( )

̅ (

Formula di Pearson sostituita con la Formula di Fisher ( )

!

Se si allontana positivamente dallo 0, ci sarà un forte picco.

Se è sotto lo zero, la curva sarà platicurtica.

! Prof. Rosato

Anche punteggi grezzi di una stessa scala non possono essere confrontabili, poiché non abbiamo

nemmeno il valore della media di un punteggio buono ad esempio, quindi non possiamo dire qual

è la prestazione migliore di uno studente in base alle valutazioni che ha preso per diverse materie (

slides ).

Quali sono le informazioni necessarie per poter valutare es. una prestazione migliore del soggetto,

che quindi influenzano la performance dello studente?

• Valore della media per capire quanto bravo ( o meno ) è rispetto all’andamento generale

della classe

• Deviazione standard quanto i valori dello studente sono distanti dalla media

Es. il punteggio medio del test di inglese è 85, mentre il punteggio del mio soggetto ( X ) è 80,

quindi è sotto la media ( ) nonostante sia il suo voto maggiore.

̅

La media del test di statistica è 55, mentre il soggetto ha preso 65, +10 punti rispetto alla media

quindi un ottimo punteggio.

Per psicologia ha ottenuto +15 punti rispetto al valore della media, un risultato ottimo.

In scala di performance dovrebbe essere quindi:

1. Psicologia generale ( 75 )

2. Statistica ( 65 )

3. Inglese ( 80 )

Ma è necessario capire quanto i punteggi sono distanti dalla media e quindi quanto quella media è

buona deviazione standard ( s )

à

Per quanto riguarda inglese, i punteggi si discostano, rispetto al valore medio di 85, di 10 punti e

così via.

Lucrezia Saia

55 ̅ 85 ̅

60 ̅

statistica Inglese

Psicologia

s = 5 àCurva S = 10 curva più ampia

S = 15 curva à

à

stretta di statistica, meno ampia

molto ampia di psicologia

( variabilità maggiore )

Standardizzazione di una variabile cardinale trasformazione lineare dei punteggi di una

à

variabile grezza in una nuova variabile con tutte le medie pari a 0 e tutte le deviazioni standard

pari a 1, grazie a:

• Centratura

• Uniformazione

Trasformazione : Punteggio Grezzo Punteggio Z

à (# )

$ #̅

-

=

Punteggio Z = ! (

( esempi di calcolo sulla slide )

-0,5 è sotto la media perché è negativo.

La standardizzazione è una trasformazione lineare applicabile ad una scala a intervalli.

Proprietà dei punti Z + , +̅

* * *

• !

∑ ∑ ∑ ( )

Somma dei punteggi z è uguale a 0 se non

= 0 − ̅ =

à à

) )

)$% )$% )$%

.

viene 0, la media non è corretta Dimostrazione

Lucrezia Saia * !

• ∑

La somma dei punteggi z al quadrato è uguale a N =

)$% Dimostrazione

/!

• è 1 = 1

perché la media deve essere sempre 0 quando di parla di standardizzazione

̅ = 0

Esercizio con i dati nelle slides:

Andrea:

0',01,0 matematica punteggio che si colloca 1,1 deviazione standard sotto la

= = −1,10 à

) (,%

media

34,33,0 abilità verbale si colloca sotto la media ma sotto 1 deviazione standard

= = −0,82 à

) 1,5

quindi

Essendo che il risultato di abilità verbale si avvicina di più allo 0, Andrea ha una performance

migliore in abilità verbale

Giulia:

03,01,0 matematica 0,36 deviazioni standard sotto la media

= = −0,36 à

) (,%

10,33,0 abilità mentale 1,07 deviazioni standard sopra la media

= = 1,07 à

) 1,5

Quindi è migliore in abilità mentale.

Luca è migliore in matematica perché si colloca ben 1,83 deviazioni standard sopra la media.

Statistica idonea

t = trasformazione

t(y) = dati di y trasformati

f(y) = dati originali

• Invarianza assoluta : il risultato della statistica calcolato sui dati originali è identico al

risultato della statistica calcolato sui dati trasformati. Es coefficiente di variazione ( CV ).

Lucrezia Saia

(

= è assolutamente invariante per le scale a rapporti ( es. euro dollari ).

à à

Trasformazione ammissibile: similarità

• Equivarianza o invarianza di riferimento : risultato della statistica calcolato sui dati

trasformati è uguale a quella su dati originali, ma solo se la trasformazione applicata per

trasformare i dati originali è la stessa trasformazione ammissibile calcolata sui dati.

scala a intervalli : trasformazione ammissibile lineare = a + bx

)

Esempio concreto sulle slides

• Ortovarianza o invarianza di confronto : il passaggio ( trasformazione ) dai dati originali a

quelli trasformati non è la trasformazione ammissibile calcolata sui dati, ma prende solo

alcuni punti di quest’ultima

Es di statistica ortovariante deviazione standard per scala a intervalli

à

Una statistica è idonea se è almeno ortovariante per quel livello di scala.

Lucrezia Saia Esercizio

Ragionamenti sulla tabella

• È una matrice CxV : sulle righe i casi e sulle colonne le variabili

• Posso sintetizzare ad esempio la variabile età con una distribuzione di frequenza

raggruppando tutti i soggetti con età uguale ( frequenze relative, assolute e percentuali e

per le scale a intervalli anche le frequenze cumulate )

• La scuola è una scala nominale

• La condizione economica ( SSE ) è ordinale perché posso dire che 1 è minore di 2 ma non

posso effettuare operazioni

• La variabile che misura il punteggio di empatia è una variabile a intervalli perché non c’è

uno 0 che identifica un’assenza di empatia, lo 0 non è assoluto quindi non è a rapporti

• La statistica che posso applicare alla variabile età ( scala a rapporti ) sono la media, la

mediana, la moda, la varianza, la deviazione standard

• Per la variabile scuola posso calcolare la moda, la mutabilità del Gini o l’entropia ( operatori

di dispersione applicabili a va

Dettagli
Publisher
A.A. 2021-2022
45 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher lucreziasaia di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Torino o del prof Settanni Michele.