La rilevazione dei fenomeni statistici
La statistica è un insieme di strumenti per la rilevazione e l’acquisizione di dati, che ci permette di comprendere la realtà che ci circonda. Realtà che può essere oggetto di un’indagine totale, dove tutte le unità della popolazione vengono rilevate, fornendo una completa descrizione del fenomeno oggetto di studio, oppure di tecniche di campionamento, che si limitano a considerare un ristretto sottoinsieme della popolazione.
Unità statistiche e caratteri
La statistica descrittiva ci permette di analizzare e descrivere, in termini quantitativi, fenomeni collettivi, ovvero fenomeni il cui studio richiede l’osservazione di una serie di manifestazioni individuali. In altri termini ci consente di spiegare cosa è successo in ciò che abbiamo osservato. Gli individui oggetto dell’indagine prendono il nome di unità statistiche, dalle quali vengono osservate una serie di caratteristiche, denominate caratteri. L’insieme di unità statistiche omogenee rispetto a uno o più caratteri prende il nome di popolazione.
Ai caratteri delle unità statistiche vengono associate, per ogni singolo individuo, delle modalità che ne definiscono i valori che può assumere. Quando le modalità sono espresse numericamente, il carattere è detto quantitativo mentre, se riguarda qualità (aggettivi), è detto qualitativo.
Caratteri qualitativi
Un carattere qualitativo viene distinto in:
- Sconnesso, se la modalità che il carattere assume non può essere espressa in graduatoria (ne sono esempi il sesso, luogo di nascita, religione, colore degli occhi, …).
- Ordinale, se la modalità che il carattere assume può essere espressa in graduatoria. Generalmente permettono di esprimere un grado di soddisfazione (poco, abbastanza, molto), la posizione in una graduatoria, il titolo di studio, ecc. Tali caratteri possono essere anche quantificati associandoli a scale numeriche, tuttavia non possono essere oggetto di operazioni poiché la loro natura rimane invariata.
Caratteri quantitativi
Un carattere quantitativo viene distinto in:
- Discreto, se la modalità che il carattere assume è di conteggio ed è rappresentata da numeri interi (ne sono un esempio il numero di figli, il voto, il numero di pezzi prodotti, …).
- Continuo, se la modalità che il carattere assume esprime una scala numerica e fa riferimento a numeri reali (ne sono esempi il peso e l’altezza). Il carattere continuo può essere sempre discretizzato ma comporta una perdita di informazioni a causa dell’arrotondamento. In modo analogo può essere qualitatizzato, comportando però la perdita dell’informazione intera.
Un'operazione spesso effettuata, che ci permette di avere un’idea più chiara del collettivo pur perdendo qualche informazione, è quella di suddividere in classi i caratteri quantitativi continui.
Esempio: Il carattere Età può considerare le classi di età: da 0 a 5 anni, da 6 a 10 anni, ecc. Così facendo ad ogni unità statistica non corrisponde più una sola modalità ma bensì una particolare classe di valori.
È opportuno definire le classi in modo tale che esse presentino determinate caratteristiche:
- Il numero di classi sia adeguato al problema, ovvero sufficientemente piccole per fornire un’adeguata sintesi e sufficientemente grandi per mantenere un livello accettabile di informazione di dettaglio.
- Siano mutuamente esclusive, in modo tale che un’unità statistica appartenga ad una sola classe e non a due classi contemporaneamente. Ne conviene che è opportuno utilizzare una coerente assegnazione degli intervalli, aperti a destra o a sinistra, in modo tale da non creare classi sovrapposte tra loro (da 1 - 10, da 11 - 20, … e NON da 1 - 10, da 10 - 20, …).
- Siano esaustive, ovvero comprendano tutte le possibili modalità del carattere.
Tipi di rilevazione
Tra le situazioni di rilevazione, in cui lo statistico opera per l’acquisizione dei dati, si distinguono le rilevazioni sperimentali e gli studi di osservazione.
Rilevazioni sperimentali
Le rilevazioni sperimentali riguardano gli esperimenti effettuati, di norma, nel campo della fisica, chimica, in laboratori, ecc. Esse si caratterizzano per una possibilità di controllare sia le condizioni in cui si svolge il rilevamento sia le caratteristiche delle unità statistiche. Tali variabili, definite fattori, possono essere sperimentali e di stratificazione. I primi riguardano quelle variabili su cui l’esperimento è fondato, mentre i fattori di stratificazione riguardano altre unità sperimentali.
Esempio: Supponiamo di voler studiare la crescita dei cavalli in base a tre diversi tipi di dieta sapendo che essa è fortemente legata al sesso. In questo caso il fattore sperimentale è la dieta, mentre il fattore di stratificazione è il sesso.
Il controllo diretto dei fattori sperimentali e di stratificazione avviene attraverso un disegno sperimentale, mediante il quale si specifica la metodologia da impiegare per avere un controllo diretto su uno o più fattori che incidono sul fenomeno di interesse. Tuttavia è possibile che altri fattori, in primo luogo non considerati, possano influenzare i risultati dell’esperimento. Per tale motivo si opera un controllo indiretto attraverso una particolare procedura di selezione delle unità statistiche detta randomizzazione, che consiste nell’allocare le unità in modo casuale in modo da minimizzare l’influenza di fattori irrilevanti.
Studi di osservazione
Per quanto riguarda gli studi di osservazione assume particolare interesse l’indagine statica. La principale differenza con la rilevazione sperimentale è che non è possibile avere un controllo e l’osservatore è posto in un ruolo passivo. Per sopperire a tale problema, l’indagine statica, richiede la progettazione di un piano di studio in cui vengono definite diverse fasi.
In primis occorre definire gli obbiettivi primari e secondari dell’indagine poiché una cattiva definizione potrebbe comprometterne i risultati finali. Dunque occorre esplicitare le finalità conoscitive in modo da rendere individuabile la popolazione alla quale ci si riferisce, le unità statistiche che si devono prendere in considerazione e il periodo di riferimento dell’indagine che, in alcuni casi, può essere antecedente (rilevazioni retrospettive).
Occorre poi individuare la popolazione oggetto dell’indagine e le unità appartenenti a tale target tramite una lista, che rappresenta un elenco delle entità statistiche. Predisposta la lista e definito un piano di campionamento occorre raccogliere i dati inerenti all’indagine. Questa fase prevede diversi metodi, tra cui l’intervista, gli strumenti automatici di registrazione e l’analisi di dati consuntivi.
Strumenti di raccolta dati
Gli strumenti automatici di registrazione ricorrono a collezioni di dati, già pronti per essere analizzati, predisposti da fonti attendibili come ISTAT e SISTAN (coordina dati provenienti da diversi enti), fonti amministrative e banche di dati internazionali (ONU, OCSE, …).
Per quanto riguarda l’intervista consiste nel rivolgere alcune domande alle unità statistiche che compongono la popolazione e nel registrare le risposte a tali domande. Vi sono diverse tecniche di intervista che si differenziano in base al modo in cui viene somministrato il questionario:
- Diretta, dove l’osservatore interagisce direttamente con l’unità osservata consentendo, qualora sia ben addestrato, di ottenere informazioni più precise.
- Indiretta, in cui non vi è più un rapporto one to one fra osservatore e intervistato. Tale metodologia risulta essere più economica a scapito, però, di una qualità di informazioni minore rispetto a quella diretta. Le modalità in cui viene inviato il questionario possono essere diverse fra cui la posta elettronica e tramite Web, CAWI.
- Telefonica, che usufruisce dei telefoni fissi, e per tale motivo, poco utilizzata quest’oggi.
- CATI - CAPI, in cui un’operatore interagisce tramite un personal computer con l’unità al fine di accompagnarlo nella compilazione del questionario.
- Exit poll, molto popolare in questi ultimi anni, ha lo scopo di fornire stime dei risultati delle elezioni prima dello spoglio delle schede elettorali.
Una volta raccolti i dati si procederà alla registrazione e ad un controllo preliminare della loro qualità, per analizzare la compatibilità delle informazioni ottenute (un bambino di 5 anni non può essere coniugato, ecc). Dopo aver corretto i dati si passerà alla fase di elaborazione e analisi statica.
Rilevazione totale e campionaria
Le indagini statistiche possono essere totali (o censuarie) oppure campionarie. Nelle indagini censuarie vi è una rilevazione accurata ed esaustiva che permette di evitare l’errore di campionamento, dovuto al fatto che si osserva un campione della popolazione che potrebbe non essere rappresentativo del resto. Nonostante questi vantaggi, tale rilevazione, ha dei costi molto elevati in termini economici e temporali, sia per la raccolta che per l’elaborazione dei dati.
Per quanto concerne la rilevazione campionaria, anche se le informazioni sono state ottenute con attenzione, costituiscono un’approssimazione di tutta la popolazione e dunque, potrebbero essere oggetto di errori di campionamento. Il motivo per cui, nonostante questo aspetto critico, è sempre più impiegata dagli statistici è dovuta al fatto che, a differenza delle indagini totali, il numero limitato di unità da esaminare consente di ottenere informazioni in tempi rapidi e a costi molto più contenuti in quanto dipendono dal numero di unità da rilevare. Inoltre permette di effettuare un’indagine ricorrente, cioè ripetuta a intervalli regolari nel tempo, essenziale nello studio di molti fenomeni. Infine, un altro aspetto fondamentale, riguarda la qualità delle osservazioni ottenute dall’indagine. Infatti i risultati potrebbero essere affetti anche da errori non campionari, che non dipendono dal carattere aleatorio dell’operazione di campionamento (errori di trascrizione o di compilazione). Viene da se che minore è il numero di unità minore sarà la presenza di tali errori.
Per procedere alla rilevazione campionaria occorre però stabilire la modalità con cui viene estrapolato un campione e si usa, in generale, il campionamento casuale, che può essere:
- Semplice, qualora i campioni hanno tutti la stessa probabilità di essere estratti.
- Stratificato, quando la popolazione viene suddivisa in strati per ognuno dei quali vengono estratte, tramite un campionamento semplice, le unità statistiche.
Il questionario
Il questionario è lo strumento di rilevazione dei dati più utilizzato nelle indagini statistiche. È un modello costituito da un’insieme di domande sottoposte a un collettivo di unità statistiche. Per un’efficiente indagine occorre che esso venga progettato con attenzione in modo adeguato.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Formulario primo parziale Statistica
-
Statistica - Appunti
-
Statistica - Appunti Primo Parziale
-
Statistica - Primo parziale