Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Tavole di contingenza
In riga una variabile (variabile di riga), in colonna l'altra (variabile di colonna) e nelle celle definite dall'incrocio fra le righe e le colonne il numero di casi che presentano le corrispondenti modalità delle due variabili.
Talvolta alla tabella vengono anche aggiunti i totali di riga e di colonna delle frequenze, che chiamiamo "frequenze marginali", o più brevemente marginali, e che corrispondono alle frequenze delle variabili singolarmente prese, come nell'analisi monovariata.
Intendiamo per ordine di una tavola di contingenza l'indicatore r x c, dove r è il numero di righe e c il numero di colonne. Per dimensione di una tavola di contingenza intendiamo il numero di variabili in essa implicate.
La tabella che abbiamo presentato è quella dei valori assoluti; essa riporta cioè il numero di casi aventi un certo valore sulla variabile di colonna e un certo valore sulla variabile di riga, prima
diqualsiasi percentualizzazione. Su questa tavola base dei valori assoluti si possono effettuare tre diversi tipi di percentualizzazione, ottenendo tre diverse tabelle: 1. Percentuali di riga (si sceglie quando si vuole analizzare l'influenza che la variabile posta in riga ha sulla variabile posta in colonna) 2. Percentuali di colonna (si sceglie quando si vuole analizzare l'influenza che la variabile posta in colonna ha sulla variabile posta in riga) 3. Percentuali sul totale (quando si percentualizzano tutte le frequenze di cella sul totale generale). Se la tabella è stata costruita per analizzare la relazione fra due variabili, la tabella dei valori assoluti e quella delle percentuali sul totale non servono. La prima, infatti, non effettuando alcuna percentuale, non permette di fare dei confronti fra i valori. La seconda, facendo tutte le percentuali sullo stesso valore (il totale), è come se non le facesse, in quanto non relativizza dei gruppi al fine di operare dei confronti.confronti. La percentuale serve per "pareggiare" basi diverse. La scelta della percentuale sbagliata può portare il ricercatore completamente fuori strada. La percentuale sbagliata infatti, invece di "pareggiare" le basi di riferimento, riporta le differenze nella popolazione: non funziona quindi più come una percentuale e se viene utilizzata per analizzare la relazione fra le due variabili può condurre a gravi errori. Si definisce qual è la variabile indipendente e si percentualizza all'interno delle sue modalità. La lettura dei dati a questo punto avverrà attraverso le colonne (righe se abbiamo percentualizzato per riga) di percentuali. Il principio della percentualizzazione all'interno delle modalità della variabile indipendente rimane il criterio guida quando il nostro obiettivo è quello di studiare la relazione causale esistente fra variabile indipendente e variabile dipendente; ma in altre situazioni,quando non è questo l'obiettivo della tabulazione, può essere utile calcolare le percentuali nell'altra direzione. Questo confronto fra la distribuzione della variabile indipendente nell'intera popolazione e nelle modalità della variabile dipendente per stabilire la relazione fra le variabili della tabella è più laborioso e meno diretto della procedura precedente. Tuttavia, in certi casi esso rappresenta l'unica via a disposizione, e cioè quando l'indagine non è condotta su tutti i casi, ma solo su un sottoinsieme della popolazione. Altre volte può aver senso calcolare percentuali sia per riga sia per colonna: quando non è possibile individuare con chiarezza una variabile dipendente e una indipendente, in quanto la relazione causale può essere in una direzione come nell'altra. Quando sono chiaramente individuabili variabili indipendente e dipendente e l'obiettivo è quellodi mancanza di trasparenza e di manipolazione dei dati. Per presentare correttamente il testo utilizzando tag HTML, puoi seguire le seguenti indicazioni: 1. Utilizza il tagper ogni paragrafo del testo: ```html
dicontrollare empiricamente l’esistenza di un nesso causale fra le due variabili, il criterio daassumere è quello della percentuale entro le modalità della variabile indipendente.
Elementi caratterizzanti della forma più efficiente (cioè meno costosa), completa (cioè senzaperdita di informazione), adeguata (cioè conforme agli obiettivi della ricerca) di presentare unatabella: Parsimoniosità.
La tabella riporta solo le percentuali che servono all’analisiTotali. Ogni riga (o colonna) percentuale finisce con il totale 100.
Basi delle percentuali. Sotto al totale va riportata (in genere tra parentesi) la basepercentuale (N). Si tratta di un’informazione importantissima in quanto permetteimmediatamente di valutare la rilevanza scientifica della percentuale. In una pubblicazionescientifica, o che adotta canoni scientifici, tale informazione va sempre riportata. Il fatto dinon riportarla espone il ricercatore a possibili accuse
``` 2. Utilizza il tag per evidenziare le parole in grassetto: ```htmlElementi caratterizzanti della forma più efficiente (cioè meno costosa), completa (cioè senzaperdita di informazione), adeguata (cioè conforme agli obiettivi della ricerca) di presentare unatabella: Parsimoniosità.
``` 3. Utilizza il tag per evidenziare le parole in corsivo: ```htmlLa tabella riporta solo le percentuali che servono all’analisiTotali. Ogni riga (o colonna) percentuale finisce con il totale 100.
``` 4. Utilizza il tag per le note in apice: ```htmlBasi delle percentuali. Sotto al totale va riportata (in genere tra parentesi) la basepercentuale (N). Si tratta di un’informazione importantissima in quanto permetteimmediatamente di valutare la rilevanza scientifica della percentuale. In una pubblicazionescientifica, o che adotta canoni scientifici, tale informazione va sempre riportata. Il fatto dinon riportarla espone il ricercatore a possibili accuse
``` Ricorda di includere anche i tag di apertura , e per creare un documento HTML completo.di ignoranza (ignorare il fatto che una stessa percentuale ha significati completamente differenti a seconda della base su cui è stata calcolata, dato che l'errore di campionamento è inversamente proporzionale alladimensione del campione) o addirittura di malafede (voler nascondere le basi delle percentuali in quanto sono di entità modesta e quindi il risultato presentato è assai debole).
Non basta riportare la dimensione complessiva del campione studiato. A questo proposito si pone il problema della base numerica minima al di sotto della quale ha poco senso (o non ne ha del tutto) calcolare le percentuali. È assai imprudente calcolare e commentare percentuali su basi inferiori ai 50 casi. Questa limitazione può comportare interventi di aggregazione sulle modalità delle variabili indipendenti. Questa aggregazione, se può essere opportuna per la variabile dipendente, diventa necessaria per quella indipendente. Infatti, sono le
modalità della variabile indipendente a fungere da basi per le percentuali. Cifre decimali, decimale zero, arrotondamento, quadratura. Vale quanto detto sulla presentazione delle distribuzioni di frequenza. Intestazione. Le tabelle devono essere sempre intestate. È infatti importante che la tabella sia autoesplicativa, che essa cioè contenga tutte le informazioni necessarie per la sua comprensione, senza dover ricorrere al testo del rapporto nel quale essa si trova inserita. Nell'intestazione si cerchi di aiutare il lettore nell'interpretazione della tabella. È indispensabile che per tutte le variabili utilizzate il lettore sia messo al corrente dell'esatta formulazione della domanda (nel caso di questionari). Una procedura assai raccomandabile consiste nel riportare il testo della domanda nell'intestazione della tabella oppure in calce alla tabella. Altre forme di presentazione della tabella. Tabella con i valori assoluti, normalmente.è un'aggiunta inutile: i valori assoluti, infatti, non servono per interpretare i fatti. Possono servire al lettore per i suoi ulteriori calcoli sulla tabella, ma sono sostituibili dal totale N di colonna (o di riga). Infatti, noto il valore della percentuale e la base su cui è stata calcolata, è agevole risalire ai valori assoluti di cella. Ci possono tuttavia essere delle situazioni nelle quali si desidera esplicitamente riportare i valori assoluti, in quanto anche la grandezza del numero ha un suo significato. Tutto ciò, tuttavia, per scopi diversi rispetto all'analisi della relazione fra le variabili: per l'analisi della relazione bastano le percentuali.Tabella con distribuzione marginale della variabile dipendente. |
---|
soprattutto nel caso in cui le modalità della variabile indipendente siano numerose.
Somme di percentuali. La somma di percentuali è legittima se i valori sommati appartengono alla stessa distribuzione percentuale, ma è errata se le percentuali sommate appartengono a due diverse distribuzioni.
Interpretazione delle tavole
Selezione delle modalità significative della variabile dipendente. Nell'interpretazione e commento delle tabelle si suggerisce di selezionare le modalità più significative della variabile dipendente e centrare su di queste l'analisi.
Errori comuni nell'interpretazione della tabella. Un errore che comunemente viene fatto consiste nel commentare la tabella nel modo seguente:
Come si vede, nelle grandi città con oltre 250.000 abitanti prevalgono le persone poco soddisfatte del governo (32,5%); seguono quelle abbastanza soddisfatte (30,8%), poi quelle per nulla soddisfatte (18,8%); nelle città appena
più grandi, ancora prevalgono quelle poco soddisfatte, che sono il 35,3%, ecc. Un altro commento poco utile è il seguente: Dai dati risulta che nelle grandi città prevalgono le persone poco soddisfatte, mentre nei comuni più piccoli prevalgono quelle abbastanza soddisfatte, ecc. I due tipi di commenti non sono sbagliati in senso stretto, ma sono inutili e soprattutto non rispondono all’interrogativo: “c’è una relazione fra ampiezza del comune e grado di soddisfazione del governo?”. Il primo tipo di commento è semplicemente descrittivo, è una lettura per iscritto della tabella: viene presa una categoria di comuni, e si leggono le percentuali. Nella stessa logica è il secondo commento. Questi commenti non servono praticamente a niente, in quanto non fanno un confronto su come la fiducia è distribuita fra vari tipi di comuni. Il commento che va fatto per illustrare la relazione fra le due variabili deve inveceprendere una modalità significativa della variabile dipendente, e vedere come la sua percentuale varia tra i vari tipi di comuni. Si prende una modalità significativa della variabile dipendente e si vede come essa varia al variare della variabile indipendente. Quale sia la modalità da scegliere lo decide il ricercatore, e la scelta dipenderà dalla sua linea argomentativa. Se la variabile è ordinale, la modalità scelta sarà sempre in una categoria estrema della variabile dipendente.
Aggregazione delle modalità della variabile dipendente. Se la variabile dipendente è ordinale, è spesso di grande utilità aggregare le modalità estreme e contigue della variabile dipendente.
Indice di differenza percentuale. Un sistema utile per interpretare le tabelle consiste nel calcolare la differenza fra due modalità di risposta, oppure fra le risposte positive e quelle negative. Questa differenza viene chiamata
Indice di differenza percentuale (Percentagedifference index), e permette di leggere i dati tenendo conto simultaneamente dell'andamento di più modalità.