Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Capitolo 6: Analisi dell'Associazione tra 2 Caratteri
- Distribuzioni doppie di frequenza.
La determinazione di due caratteri su di un collettivo, quantitativi o qualitativi, possono essere organizzate sotto forma di distribuzione unitaria doppia. Per tale organizzazione è necessario sintetizzare la determinazione dei caratteri tramite una tabella di frequenza a doppia entrata detta anche distribuzione doppia di frequenze.
Dati due caratteri, definiamo tabella di frequenza a doppia entrata o distribuzione doppia di frequenze, l'insieme delle frequenze congiunte mij, ovvero le frequenze assolute delle unità che presentano congiuntamente la modalità i-ésima del primo carattere e la j-ésima del secondo carattere.
La colonna e la riga dei totali sono distribuzioni marginali e corrispondono alle distribuzioni di frequenze semplici, relative ai 2 caratteri:
- La colonna del totale è la distribuzione semplice del carattere Yj e il termine generico mij indica la frequenza assoluta delle unità che presentano nel carattere la modalità xi;
- La riga del totale indica la distribuzione semplice del carattere Xi e il termine mij è la frequenza assoluta delle unità che presentano la modalità ijj;
Le righe e le colonne interne identificano le distribuzioni confrontate.
La prima riga per esempio, ci dice come si distribuiscono secondo il carattere Y, le sole unità che presentano la modalità x1 del carattere X per questo viene detta distribuzione condizionata della Y rispetto alla modalità xi del carattere X.
Analogamente la prima colonna, ci dice come si distribuiscono secondo il carattere X, le sole unità che presentano la modalità y1 del carattere Y per questo viene detta distribuzione condizionata della X rispetto alla modalità yj del carattere Y.
Come per le distribuzioni di frequenze semplici, possiamo considerare distribuzioni doppie di frequenze relative e percentuali; dove il generico elemento interno alla tabella a doppia entrata è espresso da:
fij = mij/m
e pij = fij · 100
% RIGA: pij = fij · 100 = mij/mi· · 100
% COLONNA: pij = fij · 100 = mij/m·j · 100
% TOTALE: pij = fij · 100 = mij/m.. · 100
Le distribuzioni marginali relative si ottengono dividendo le frequenze assolute marginali per il totale (moltiplicando per 100, quelle percentuali).
Le distribuzioni relative condizionate della X e della Y si ottengono rispettivamente rapportando le distribuzioni condizionate per i corrispondenti totali di riga o per i corrispondenti totali di colonna.
Proprietà per la tabella di frequenza a doppia entrata:
m.. = hΣ j=1 mij per i = 1, 2, ..., h
Dipendenza Perfetta:
Un carattere Y1 dipende perfettamente da X1 quando ad ogni modalità di X1 è associata una sola modalità di Y1, cioè quando in una tabella doppia, per ogni i, c'è solo un j per il quale mij≠0
Esempio:
y2 y3 y4 TOT x1 43 0 0 43 x2 0 15 0 15 x3 0 0 20 20 x4 0 0 52 52 TOT 43 52 35 130
Non è vero il viceversa, infatti alla modalità y3 corrispondono le modalità x1 e x3.
This relazione di dipendenza perfetta di un carattere da un altro, è sempre di tipo unidirezionale, in quanto dalla conoscenza della modalità di un carattere, si può prevedere la modalità dell'altro ma non è vero il contrario.
Interdipendenza Perfetta:
È una relazione di tipo bidirezionale.
Tra due caratteri c'è interdipendenza perfetta se ad ogni modalità di uno dei due caratteri corrisponde una ed una sola modalità dell'altro carattere, e viceversa.
Assumiamo che le frequenze marginali siano ≠0, la condizione di interdipendenza puoi esistere solo se la tabella è quadrata (righe = colonne m).
In sostanza, in condizioni di interdipendenza perfetta, si deve avere per ogni riga e per ogni colonna della tabella, a cui non corrisponda una frequenza marginale nulla, una sola cella con frequenza non nulla.
Esempio:
MEZZO DI TRASPORTO BICI AUTOBUS AUTO TOT SERENO 84 26 11 121 VARIABILE 29 98 29 156 PIOGGIA 7 26 55 88 TOTALE 120 150 95 365χ2 = 169,18
→ Φ2 = 169,18 / 365 = 0,4635
V = √min [(c - 1), (r - 1)] = √min [(c - 1), (r - 1)]
QUESTO INDICE PUÒ VARIARE TRA 0 E 1, QUELLO OTTENUTO È CIRCA LA METÀ → SUSSISTE UN LIVELLO MEDIO DI ASSOCIAZIONE.
MISURA DELLA DIPENDENZA DI UN CARATTERE QUANTITATIVO DA UN CARATTERE QUALITATIVO O QUANTITATIVO DISCRETO.
PER ANALIZZARE LA DIPENDENZA DOBBIAMO CONFRONTARE LE DISTRIBUZIONI CONDIZIONATE DEL CARATTERE Y IN CORRISPONDENZA DELLE DIVERSE MODALITÀ DEL CARATTERE X.
OGNUNA DI QUESTE DISTRIBUZIONI PUÒ ESSERE SINTETIZZATA TRAMITE LA CORRISPONDENTE MEDIA E VARIANZA CONDIZIONATA:
Proprietà del coefficiente di correlazione lineare.
- -1 ≤ ρxy ≤ 1;
- ρxy = 1 se tra x e y sussiste un perfetto legame lineare e i due caratteri sono concordi;
- ρxy = -1 sono discordi;
- ρxy = 0 se i caratteri sono indipendenti, oppure se la loro relazione non è lineare.
Riguardare il grafico di dispersione come si fa.
Le diverse concezioni della probabilità:
- Concezione frequentista → si basa sulla ripetibilità della prova
- Soggettivista → la probabilità di un evento è la misura del grado di fiducia che un individuo coerente attribuisce al verificarsi dell'evento in base alle informazioni in suo possesso.
La funzione di ripartizione per una v.c. continua è simile a quella di una discreta. Data una v.c. continua X, la funzione che fa corrispondere ai valori xc le probabilità cumulate P(x < xc), viene detta funzione di ripartizione e indicata con:
F(x) = P(X < x) = ∫-∞x f(x) dx
gode delle stesse proprietà di quella di una v.c. discreta e inoltre:
- se X è una v.c. continua, F(x) è una funzione assolutamente crescente;
- le proprietà delle funzioni di densità sono:
- non può mai assumere valori negativi, ossia f(x)c > 0, o altrimenti che la probabilità che X assuma X in qualsiasi intervallo sia non-negativa;
- l’area totale sottesa alla funzione è equivalente a 1, ossia: ∫-∞∞ f(x) dx = 1.
Valore atteso e varianza di una variabile casuale
Il valore atteso è il valore medio che una v.c. può assumere in un gran numero di prove, è indicato con E(x), ed è definito come:
E(X) = ∑ xi p(xi) se v.c. è discreta
E(x) = ∫-∞∞ x g(x) dx se V.C. continua
Esempio (discreta)
Xi = 2 3 4 5 6 7 8 9 10 11 12
P(X) = 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
E(X) = 2/36 + 3x2/36 + 4x3/36 + 5x4/36 + 6x5/36 + 7x6/36 + 8x5/36 + 9x4/36 + 10x3/36 + 11x2/36 + 12x1/36 = 7
La varianza V(X) di una v.c. X è definita come:
V(X) = ∑ (xi - E(X))2 p(x) discreta
V(X) = ∫-∞∞ [x - E(X)]2 g(x) dx continua
La varianza misura la differenza quadratica tra i possibili valori della V.C. e il suo valore atteso, e in effetti il valore atteso della V.C. [x - E(X)]2 e si può scrivere: