Anteprima
Vedrai una selezione di 10 pagine su 71
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 1 Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 2
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 6
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 11
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 16
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 21
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 26
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 31
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 36
Anteprima di 10 pagg. su 71.
Scarica il documento per vederlo tutto.
Riassunto esame statistica, docente Oropallo, libro consigliato Statistica e metodologia per le scienze economiche e sociali, Borra/Di Ciaccio Pag. 41
1 su 71
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Capitolo 6: Analisi dell'Associazione tra 2 Caratteri

  • Distribuzioni doppie di frequenza.

La determinazione di due caratteri su di un collettivo, quantitativi o qualitativi, possono essere organizzate sotto forma di distribuzione unitaria doppia. Per tale organizzazione è necessario sintetizzare la determinazione dei caratteri tramite una tabella di frequenza a doppia entrata detta anche distribuzione doppia di frequenze.

Dati due caratteri, definiamo tabella di frequenza a doppia entrata o distribuzione doppia di frequenze, l'insieme delle frequenze congiunte mij, ovvero le frequenze assolute delle unità che presentano congiuntamente la modalità i-ésima del primo carattere e la j-ésima del secondo carattere.

La colonna e la riga dei totali sono distribuzioni marginali e corrispondono alle distribuzioni di frequenze semplici, relative ai 2 caratteri:

  • La colonna del totale è la distribuzione semplice del carattere Yj e il termine generico mij indica la frequenza assoluta delle unità che presentano nel carattere la modalità xi;
  • La riga del totale indica la distribuzione semplice del carattere Xi e il termine mij è la frequenza assoluta delle unità che presentano la modalità ijj;

Le righe e le colonne interne identificano le distribuzioni confrontate.

La prima riga per esempio, ci dice come si distribuiscono secondo il carattere Y, le sole unità che presentano la modalità x1 del carattere X per questo viene detta distribuzione condizionata della Y rispetto alla modalità xi del carattere X.

Analogamente la prima colonna, ci dice come si distribuiscono secondo il carattere X, le sole unità che presentano la modalità y1 del carattere Y per questo viene detta distribuzione condizionata della X rispetto alla modalità yj del carattere Y.

Come per le distribuzioni di frequenze semplici, possiamo considerare distribuzioni doppie di frequenze relative e percentuali; dove il generico elemento interno alla tabella a doppia entrata è espresso da:

fij = mij/m

e pij = fij · 100

% RIGA: pij = fij · 100 = mij/m · 100

% COLONNA: pij = fij · 100 = mij/m·j · 100

% TOTALE: pij = fij · 100 = mij/m.. · 100

Le distribuzioni marginali relative si ottengono dividendo le frequenze assolute marginali per il totale (moltiplicando per 100, quelle percentuali).

Le distribuzioni relative condizionate della X e della Y si ottengono rispettivamente rapportando le distribuzioni condizionate per i corrispondenti totali di riga o per i corrispondenti totali di colonna.

Proprietà per la tabella di frequenza a doppia entrata:

m.. = hΣ j=1 mij per i = 1, 2, ..., h

Dipendenza Perfetta:

Un carattere Y1 dipende perfettamente da X1 quando ad ogni modalità di X1 è associata una sola modalità di Y1, cioè quando in una tabella doppia, per ogni i, c'è solo un j per il quale mij≠0

Esempio:

y2 y3 y4 TOT x1 43 0 0 43 x2 0 15 0 15 x3 0 0 20 20 x4 0 0 52 52 TOT 43 52 35 130

Non è vero il viceversa, infatti alla modalità y3 corrispondono le modalità x1 e x3.

This relazione di dipendenza perfetta di un carattere da un altro, è sempre di tipo unidirezionale, in quanto dalla conoscenza della modalità di un carattere, si può prevedere la modalità dell'altro ma non è vero il contrario.

Interdipendenza Perfetta:

È una relazione di tipo bidirezionale.

Tra due caratteri c'è interdipendenza perfetta se ad ogni modalità di uno dei due caratteri corrisponde una ed una sola modalità dell'altro carattere, e viceversa.

Assumiamo che le frequenze marginali siano ≠0, la condizione di interdipendenza puoi esistere solo se la tabella è quadrata (righe = colonne m).

In sostanza, in condizioni di interdipendenza perfetta, si deve avere per ogni riga e per ogni colonna della tabella, a cui non corrisponda una frequenza marginale nulla, una sola cella con frequenza non nulla.

Esempio:

MEZZO DI TRASPORTO BICI AUTOBUS AUTO TOT SERENO 84 26 11 121 VARIABILE 29 98 29 156 PIOGGIA 7 26 55 88 TOTALE 120 150 95 365

χ2 = 169,18

→ Φ2 = 169,18 / 365 = 0,4635

V = √min [(c - 1), (r - 1)] = √min [(c - 1), (r - 1)]

QUESTO INDICE PUÒ VARIARE TRA 0 E 1, QUELLO OTTENUTO È CIRCA LA METÀ → SUSSISTE UN LIVELLO MEDIO DI ASSOCIAZIONE.

MISURA DELLA DIPENDENZA DI UN CARATTERE QUANTITATIVO DA UN CARATTERE QUALITATIVO O QUANTITATIVO DISCRETO.

PER ANALIZZARE LA DIPENDENZA DOBBIAMO CONFRONTARE LE DISTRIBUZIONI CONDIZIONATE DEL CARATTERE Y IN CORRISPONDENZA DELLE DIVERSE MODALITÀ DEL CARATTERE X.

OGNUNA DI QUESTE DISTRIBUZIONI PUÒ ESSERE SINTETIZZATA TRAMITE LA CORRISPONDENTE MEDIA E VARIANZA CONDIZIONATA:

Proprietà del coefficiente di correlazione lineare.

  1. -1 ≤ ρxy ≤ 1;
  2. ρxy = 1 se tra x e y sussiste un perfetto legame lineare e i due caratteri sono concordi;
  3. ρxy = -1 sono discordi;
  4. ρxy = 0 se i caratteri sono indipendenti, oppure se la loro relazione non è lineare.

Riguardare il grafico di dispersione come si fa.

Le diverse concezioni della probabilità:

  1. Concezione frequentista → si basa sulla ripetibilità della prova
  2. Soggettivista → la probabilità di un evento è la misura del grado di fiducia che un individuo coerente attribuisce al verificarsi dell'evento in base alle informazioni in suo possesso.

La funzione di ripartizione per una v.c. continua è simile a quella di una discreta. Data una v.c. continua X, la funzione che fa corrispondere ai valori xc le probabilità cumulate P(x < xc), viene detta funzione di ripartizione e indicata con:

F(x) = P(X < x) = ∫-∞x f(x) dx

gode delle stesse proprietà di quella di una v.c. discreta e inoltre:

  1. se X è una v.c. continua, F(x) è una funzione assolutamente crescente;
  2. le proprietà delle funzioni di densità sono:
    • non può mai assumere valori negativi, ossia f(x)c > 0, o altrimenti che la probabilità che X assuma X in qualsiasi intervallo sia non-negativa;
    • l’area totale sottesa alla funzione è equivalente a 1, ossia: ∫-∞ f(x) dx = 1.

Valore atteso e varianza di una variabile casuale

Il valore atteso è il valore medio che una v.c. può assumere in un gran numero di prove, è indicato con E(x), ed è definito come:

E(X) = ∑ xi p(xi) se v.c. è discreta

E(x) = ∫-∞ x g(x) dx se V.C. continua

Esempio (discreta)

Xi = 2 3 4 5 6 7 8 9 10 11 12

P(X) = 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

E(X) = 2/36 + 3x2/36 + 4x3/36 + 5x4/36 + 6x5/36 + 7x6/36 + 8x5/36 + 9x4/36 + 10x3/36 + 11x2/36 + 12x1/36 = 7

La varianza V(X) di una v.c. X è definita come:

V(X) = ∑ (xi - E(X))2 p(x) discreta

V(X) = ∫-∞ [x - E(X)]2 g(x) dx continua

La varianza misura la differenza quadratica tra i possibili valori della V.C. e il suo valore atteso, e in effetti il valore atteso della V.C. [x - E(X)]2 e si può scrivere:

Dettagli
Publisher
A.A. 2017-2018
71 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Shesha. di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi della Tuscia o del prof Oropallo Filippo.