Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
OPERATORI DI DISPERSIONE
variabili nominali ( es. titolo di studio )
•
mutabilità del Gini : misura l’eterogeneità e l’omogeneità ( E )
1
!
"
∑
1 −
formula: 1 - sommatoria di tutte le frequenze f alla seconda
#$% misura assoluta ( E ) indice assoluto di mutabilità del Gini.
1
K = numero delle modalità delle variabili
Nell’esempio titolo di studio omogeneo K è 5.
Lucrezia Saia
Più il valore di questo indice è crescente, più l’eterogeneità è presente.
Per calcolare però questo indice si utilizza la formula della misura assoluta E .
1
!"#
= indica il valore massimo che questo indice può assumere
!
↑
Questa formula serve per capire quanto eterogenea è la variabile.
formula: !"#
misura relativa e
( ) numeri che variano tra 0 e 1
#
1 !
0 = massima omogeneità
1 = massima eterogeneità
Esempio:
K = 5
E = 1 - ( 0,16 + 0,00 + 0,04 + 0,04 + 0,04 ) = 1 - 0,28 = 0,72
1
valore massimo 5 - 1 / 5 = 0,80
à (
e = 0,72 / 0,80 = 0,90 oppure eterogeneità
× 0,72 = 0,9 à
1 )
Entropia ( E )
2
sommatoria negativa della moltiplicazione tra frequenze relative e i logaritmi delle frequenze
relative. +
∑ entropia assoluta ( E )
formula: − log 2
% *
+&'
$
! entropia relativa ( e )
formula: 2
%&' !
"
0 = massimo omogeneità
1 = massimo eterogeneità
Misure speculari indicati con O che significa omogeneità.
indice di Herfindal ( O ) : se E è 0,60 ( eterogeneità ) O sarà omogeneo a 0,40
1 2 1
variabili cardinali ( variabilità metrica )
•
campo ( o range ) di variazione = differenza tra valore minimo e valore massimo della distribuzione
OPERATORI DI DISPERSIONE
Scostamento semplice medio = scarti positivi
Lucrezia Saia
Scarti = differenze tra i valori osservati ( x ) e il valore medio della variabile ( )
̅
i
$ !
(* )
∑ " *̅
#
#%&
2
Varianza ( s ):
• .
formula estesa
Tutte le x al quadrato e ne ricaviamo la media
Il quadrato della media aritmetica
! "
∑ i
MEDIA ARITMETICA = la significa che il valore va da 1 fino a N
#
#$!
"
Deviazione standard ( s )= √ operatore di dispersione
• à
Esercizio guidato: VARIABILE CARDINALE
Moda: 5 ( perché il punteggio 5 appare 3 volte )
Mediana: prima cosa distribuzione ordinata dei valori - punteggi -
2
3
5
5
5
6
6
7
9 →
N è dispari quindi unico caso mediano = N + 1 / 2 9 + 1 / 2 = 5 posizione rispetto all’ordine dei
numeri fatto prima. Alla quinta posizione troviamo il numero 5 quindi la mediana è 5.
Media: 5+3+5+6+9+6+2+7+5 / 9 = 48 / 2 = 5,33
Scarti della media: →
=
x 5 - 5,33 = - 0,33 serve il valore assoluto quindi diventerà 0,33 ( positivo )
1
x = 3 - 5,33 = - 2,33
2
x = 5 - 5,33 = - 0,33
3
x = 6 - 5,33 = 0,67
4 (
∑ |# |
$ #̅
'
')*
scostamento semplice medio
• ' 1,48
( 0,33 + 2,33 + 0,33 + 0,67 + 3,67 + 0,67 + 3,33 + 1,67 + 0,33 ) / 9 =
( +
∑ (# )
$ #̅
'
')*
varianza : 3,78
vedi slide
'
deviazione standard :
• = 1,94 indica la variabilità media della distribuzione
√3,78
Coefficiente di variazione
•
Lucrezia Saia MOMENTO OMOGENEO
= medie delle x elevate ad un certo esponente
• Centrale = si riferiscono agli scarti dalla media, vengono utilizzati per ottenere informazioni
rispetto alla distribuzione.
• Non centrale
ASIMMETRIA
Formula di Pearson = calcolo dell’asimmetria, rapporto tra momenti centrali omogenei elevati
%
alla 2° e alla 3°
momento omogeneo di 2° ordine
=
! = momento omogeneo di 3° ordine valutare la forma di una distribuzione ( = )
à
' (
Formula di Pearson sostituita con la formula di Fisher ( )
! %
CURTOSI
Abbiamo bisogno di un momento omogeneo di ordine 4° ( )
̅ (
Formula di Pearson sostituita con la Formula di Fisher ( )
!
Se si allontana positivamente dallo 0, ci sarà un forte picco.
Se è sotto lo zero, la curva sarà platicurtica.
! Prof. Rosato
Anche punteggi grezzi di una stessa scala non possono essere confrontabili, poiché non abbiamo
nemmeno il valore della media di un punteggio buono ad esempio, quindi non possiamo dire qual
è la prestazione migliore di uno studente in base alle valutazioni che ha preso per diverse materie (
slides ).
Quali sono le informazioni necessarie per poter valutare es. una prestazione migliore del soggetto,
che quindi influenzano la performance dello studente?
• Valore della media per capire quanto bravo ( o meno ) è rispetto all’andamento generale
della classe
• Deviazione standard quanto i valori dello studente sono distanti dalla media
Es. il punteggio medio del test di inglese è 85, mentre il punteggio del mio soggetto ( X ) è 80,
quindi è sotto la media ( ) nonostante sia il suo voto maggiore.
̅
La media del test di statistica è 55, mentre il soggetto ha preso 65, +10 punti rispetto alla media
quindi un ottimo punteggio.
Per psicologia ha ottenuto +15 punti rispetto al valore della media, un risultato ottimo.
In scala di performance dovrebbe essere quindi:
1. Psicologia generale ( 75 )
2. Statistica ( 65 )
3. Inglese ( 80 )
Ma è necessario capire quanto i punteggi sono distanti dalla media e quindi quanto quella media è
buona deviazione standard ( s )
à
Per quanto riguarda inglese, i punteggi si discostano, rispetto al valore medio di 85, di 10 punti e
così via.
Lucrezia Saia
55 ̅ 85 ̅
60 ̅
statistica Inglese
Psicologia
s = 5 àCurva S = 10 curva più ampia
S = 15 curva à
à
stretta di statistica, meno ampia
molto ampia di psicologia
( variabilità maggiore )
Standardizzazione di una variabile cardinale trasformazione lineare dei punteggi di una
à
variabile grezza in una nuova variabile con tutte le medie pari a 0 e tutte le deviazioni standard
pari a 1, grazie a:
• Centratura
• Uniformazione
Trasformazione : Punteggio Grezzo Punteggio Z
à (# )
$ #̅
-
=
Punteggio Z = ! (
( esempi di calcolo sulla slide )
-0,5 è sotto la media perché è negativo.
La standardizzazione è una trasformazione lineare applicabile ad una scala a intervalli.
Proprietà dei punti Z + , +̅
* * *
• !
∑ ∑ ∑ ( )
Somma dei punteggi z è uguale a 0 se non
= 0 − ̅ =
à à
) )
)$% )$% )$%
.
viene 0, la media non è corretta Dimostrazione
Lucrezia Saia * !
• ∑
La somma dei punteggi z al quadrato è uguale a N =
)$% Dimostrazione
/!
• è 1 = 1
perché la media deve essere sempre 0 quando di parla di standardizzazione
̅ = 0
Esercizio con i dati nelle slides:
Andrea:
0',01,0 matematica punteggio che si colloca 1,1 deviazione standard sotto la
= = −1,10 à
) (,%
media
34,33,0 abilità verbale si colloca sotto la media ma sotto 1 deviazione standard
= = −0,82 à
) 1,5
quindi
Essendo che il risultato di abilità verbale si avvicina di più allo 0, Andrea ha una performance
migliore in abilità verbale
Giulia:
03,01,0 matematica 0,36 deviazioni standard sotto la media
= = −0,36 à
) (,%
10,33,0 abilità mentale 1,07 deviazioni standard sopra la media
= = 1,07 à
) 1,5
Quindi è migliore in abilità mentale.
Luca è migliore in matematica perché si colloca ben 1,83 deviazioni standard sopra la media.
Statistica idonea
t = trasformazione
t(y) = dati di y trasformati
f(y) = dati originali
• Invarianza assoluta : il risultato della statistica calcolato sui dati originali è identico al
risultato della statistica calcolato sui dati trasformati. Es coefficiente di variazione ( CV ).
Lucrezia Saia
(
= è assolutamente invariante per le scale a rapporti ( es. euro dollari ).
à à
#̅
Trasformazione ammissibile: similarità
• Equivarianza o invarianza di riferimento : risultato della statistica calcolato sui dati
trasformati è uguale a quella su dati originali, ma solo se la trasformazione applicata per
trasformare i dati originali è la stessa trasformazione ammissibile calcolata sui dati.
scala a intervalli : trasformazione ammissibile lineare = a + bx
)
Esempio concreto sulle slides
• Ortovarianza o invarianza di confronto : il passaggio ( trasformazione ) dai dati originali a
quelli trasformati non è la trasformazione ammissibile calcolata sui dati, ma prende solo
alcuni punti di quest’ultima
Es di statistica ortovariante deviazione standard per scala a intervalli
à
Una statistica è idonea se è almeno ortovariante per quel livello di scala.
Lucrezia Saia Esercizio
Ragionamenti sulla tabella
• È una matrice CxV : sulle righe i casi e sulle colonne le variabili
• Posso sintetizzare ad esempio la variabile età con una distribuzione di frequenza
raggruppando tutti i soggetti con età uguale ( frequenze relative, assolute e percentuali e
per le scale a intervalli anche le frequenze cumulate )
• La scuola è una scala nominale
• La condizione economica ( SSE ) è ordinale perché posso dire che 1 è minore di 2 ma non
posso effettuare operazioni
• La variabile che misura il punteggio di empatia è una variabile a intervalli perché non c’è
uno 0 che identifica un’assenza di empatia, lo 0 non è assoluto quindi non è a rapporti
• La statistica che posso applicare alla variabile età ( scala a rapporti ) sono la media, la
mediana, la moda, la varianza, la deviazione standard
• Per la variabile scuola posso calcolare la moda, la mutabilità del Gini o l’entropia ( operatori
di dispersione applicabili a va