Anteprima
Vedrai una selezione di 3 pagine su 7
statistica bivariata e indici di associazione Pag. 1 statistica bivariata e indici di associazione Pag. 2
Anteprima di 3 pagg. su 7.
Scarica il documento per vederlo tutto.
statistica bivariata e indici di associazione Pag. 6
1 su 7
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

FREQUENZE ASSOLUTE CONGIUNTE

Sto lavorando congiuntamente su due caratteri e mi dice a quale modalità di x e y mi sto riferendo in quel punto, quindi qualsiasi dato all'interno della tabella con le modalità di x e le modalità di y.

Le nij sono i dati all'interno della tabella che mi servono per calcolare il totale delle marginali di riga e di colonna. Per sommare tutti i dati all'interno della mia tabella doppia faccio la sommatoria delle nij, è una doppia sommatoria (la prima di i che va da 1 a k e la seconda di j che va da 1 a h). Le divido e calcolo la prima poi la seconda:

  1. Calcolo la somma di questi due fa N.
  2. Calcolo la frequenza relativa congiunta dividendo le frequenze assolute congiunte per N.

FREQUENZE RELATIVE CONGIUNTE

Relativizzo le frequenze assolute congiunte per arrivare a quelle relative, le posso calcolare per:

  • I dati all'interno della distribuzione.
  • Le marginali di riga.
  • Le marginali di colonna.

Indicano una porzione di unità statistiche che assumono una modalità di x e di y.

FREQUENZE RELATIVE CONDIZIONATE

Devo...

di colonna corrispondono ad 1 ognuna - All'interno della tabella per trovare la frequenza relativa condizionata uso il dato che avevo inizialmente come numeratore e come denominatore la marginale di quella colonna, così per tutte le colonne della mia tabella - N è 1, per trovarlo faccio la somma delle marginali di riga, NON DI COLONNA!!! Per formattare il testo utilizzando tag HTML, puoi utilizzare i seguenti tag: - `` per indicare gli indici superiori (ad esempio, "²" diventa "2") - `` per indicare gli indici inferiori (ad esempio, "₃" diventa "3") - `` per evidenziare il testo in grassetto - `
` per inserire un'interruzione di linea Ecco come potrebbe apparire il testo formattato con i tag HTML: ```

Decidere qual è il carattere che condiziona, posso sceglierlo a seconda di ciò che voglio osservare. Le frequenze relative condizionate si calcolano tenendo fisse le marginali delle frequenze assolute di quel carattere e invece che dividere per N di divide per le marginali di riga/colonna, possono essere di 2 tipi:

1) Condizionante x: tengo buoni come denominatori le marginali di riga

  • All'interno della tabella per trovare la frequenza relativa condizionata uso il dato che avevo inizialmente come numeratore e come denominatore la marginale di quella riga, così per tutte le righe della mia tabella
  • Le marginali di riga corrispondono ad 1 ognuna
  • Le marginali di colonna sono le fij
  • N è 1, per trovarlo faccio la somma delle marginali di colonna, NON DI RIGA!!!

2) Condizionante y: tengo come denominatori le marginali di colonna

  • Le marginali di riga sono le fij
  • Le marginali di colonna corrispondono ad 1 ognuna
  • All'interno della tabella per trovare la frequenza relativa condizionata uso il dato che avevo inizialmente come numeratore e come denominatore la marginale di quella colonna, così per tutte le colonne della mia tabella
  • N è 1, per trovarlo faccio la somma delle marginali di riga, NON DI COLONNA!!!
``` Ricorda di includere i tag di apertura ``, `` e `` nel tuo documento HTML completo.

di colonna corrispondono a 1 ognuna- N è 1, faccio la somma delle marginali di riga, NON DI COLONNA!!

Definisco quindi gruppi diversi di unità (ognuna per regione) mi permette di fare confronti adeguati tra regioni: mi servono per confrontare un dato a parità dell'altro.

Carattere condizionante x se voglio fare confronti a parità di numero di immobili in diverse regioni

Carattere condizionante y se voglio confrontare nella stessa regione il numero di immobili per famiglia, mantengo fisse le marginali di colonna e l'altra marginale è la mia fij, che ho già costruito

Gruppi definiti dalle modalità di x / y servono per fare confronti a parità di x / y

Frequenze condizionate sono sempre relative

In simboli + calcolo:

In generale:se ho un carattere rispetto all'altro che si verifica per primo, il primo è il condizionante

INDICI DI ASSOCIAZIONE

Cerco dei numeri che mi indicano quanto è forte una relazione,

posso vederlo dalle frequenze relative condizionate ma lo vedo meglio da indici.

INDICI DI CONNESSIONE

È costruibile indipendentemente dalla natura dei due caratteri (anche nel caso di due qualitativi). Si parte dalla distribuzione condizionata (nel nostro caso parto dalla condizionata di X delle imprese NB e B).

Se non avessi una relazione tra i due caratteri cosa osserverei? Nonostante ho ricevuto beneficio non c’è variazione di fatturato, se non c’è questa relazione come sarebbe stata fatta la condizionata? Saremmo in una situazione in cui i 3 confronti mi farebbero vedere valori identici alla marginale di colonna ovvero una situazione di INDIPENDENZA (assenza di associazione/relazione tra le due variabili) avrei osservato una tabella dove le mie condizionate sulle diverse righe sono le stesse e corrispondono alle marginali di colonna. Riga per riga le condizionate sono uguali alla corrispondente marginale di colonna. È l’INDIPENDENZA

STATISTICA/IN DISTRIBUZIONE/IN PROBABILITÀ, le indipendenze possono essere diverse.

INDIPENDENZA UNILATERALE

INDIPENDENZA BILATERALE

Siamo partiti da una condizionata (situazione dove carattere y condizionato a x) e se è vera l’indipendenza statistica di y da x a cui siamo arrivate, è vero anche il contrario? È una relazione che vale in entrambe le direzioni? Si, vale in entrambi i sensi. Se c’è di y da x c’è anche di x da y. Le due formule sono uguali indipendentemente che io parta dalla prima o dalla seconda condizionata.

Gli indici che misurano l’allontanamento dall’indipendenza statistica sono tanti.

INDICE DI CHI QUADRATO

Se fossimo in indipendenza 5 coinciderebbe con 3,8 ; 10 con 7,6 ; 4 con 7,6 e così via con gli altri, confronto cella per cella i miei valori facendone la differenza tra le osservate e le teoriche, > differenza più mi allontano dall’indipendenza, < è la differenza

più mi avvicino all’indipendenza. Devo mettere insieme le mie differenze (la somma delle differenze fa sempre zero) e per farlo le prendo elevate al quadrato e le relativizzo dividendole per nijteoriche in modo da abbassare il valore che ottengo. Le marginali non possono mai essere zero.

Minima dipendenza: 0

Massima dipendenza: mi basta sapere se un’impresa è B o NB per sapere già quale sarà la sua variazione di fatturato. Il carattere condizionante da solo mi dice esattamente quella che sarà la variazione di fatturato. Un carattere che dipende dall’altro non avrebbe bisogno di essere rilevato perché il carattere condizionante mi definirebbe già quella che sarà la modalità del carattere condizionato. Se so già che un’impresa è NB so anche la classe di fatturato, tutte le imprese sono in una modalità, le altre hanno zero.

Se parto da dato disaggregato devo per forza passare a distribuzione

di frequenza. Diversi tipi di indipendenza:
  • Indipendenza statistica: la più forte che io posso osservare
  • Indipendenza in media: confronta le medie condizionate
  • Indipendenza lineare: introdotta dagli indici di concordanza

INDICI DI CONCORDANZA

Misurano la tendenza sulle unità statistiche ad associarsi a modalità alte o basse di x e modalità alte o basse di y.

Massima concordanza: osserviamo una tabella doppia con caratteri almeno qualitativi e tendenzialmente avrò tutte le persone con modalità alte di x e modalità alte di y (sei basso, pesi poco; sei alto pesi tanto). Ho i miei valori nella parte di "battaglia navale" con le modalità alta-alta, media-media, bassa-bassa e nel resto ho zero.

Come capisco se un dato è alto o basso? Faccio la media dei miei dati e se il dato > media allora il dato è alto, se il dato < media allora il dato è basso.

Massima discordanza: ho i miei valori nella casella con le modalità alte o basse di x e modalità basse o alte di y.

modalità opposte, alto-basso, medio-medio, basso-alto e nel resto c'è zero. In entrambi i casi c'è molta associazione, quando non c'è né concordanza né discordanza i due caratteri non stanno in nessuna relazione.

Dettagli
A.A. 2021-2022
7 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher alessia.alberghini di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Roli Giulia.