Massima dipendenza
La connessione tra due variabili è massima se:
- nKJ = 0 e fKJ = 0
- nKJ = min{nK·, n·J}
- fKJ = min{fK·, f·J}
Indice di contingenza quadratica media
Per misurare la dipendenza tra 2 caratteri, si usa l'indice di contingenza quadratica media, detto anche "CHI QUADRATO".
χ² = ΣK=1r ΣJ=1c (nKJ - nKJ)² / nKJ = → è al quadrato, lo scarto è sempre positivo.
= ΣK=1r ΣJ=1c (n2KJ - 2nKJnKJ + n2KJ) / nKJ
= ΣK=1r ΣJ=1c (n2KJ - 2nKJ + nKJ) / nKJ → ho semplificato gli nKJ
= ΣK=1r ΣJ=1c n2KJ / nKJ - 2N + n
= ΣK=1c ΣJ=1c n2KJ / nK·n·J - n → dove nKJ = nK·n·J / n
χ² = n [ ΣK=1c ΣJ=1c n2KJ / nK·n·J -1]
χ² dipende da n e dalla struttura di associazione
Nota
- nKJ ≤ nK· e 0 ≤ n2KJ / nK·n·J ≤ 1
- nKJ ≤ n·J (Purché nKJ / ni· ≤ 1 e nKJ / n·J ≤ 1)
- nKJ ≤ nK· ΣK=1c ΣJ=1c n2KJ / nK·n·J ≤ ΣK=1c ΣJ=11 n2K· / nK·n·J
χ² = n min [ (r-1), (c-1) ]
Massima dipendenza → è quando per ciascuna y c’è una sola modalità di x con frequenza non nulla.
-
Statistica - Fondamenti Statistica Descrittiva
-
Appunti statistica
-
Statistica - Covarianza
-
Statistica - Esercitazione