Alcune definizioni generali: la statistica e i suoi obiettivi
Sin dalle origini della civiltà, l’uomo ha sentito il bisogno di annotare dati relativi a fenomeni che lo coinvolgono nella vita sociale. A partire dal XV secolo, cominciano ad apparire opere aventi come scopo la raccolta dei dati demografici ed economici dei vari Stati. Nacque così una scienza descrittiva degli Stati, indicata come statistica.
Nel XVII secolo comparve in Inghilterra una disciplina chiamata successivamente aritmetica politica, avente come oggetto di studio l’osservazione numerica delle nascite, delle morti e in generale dei fenomeni demografici. Nel XIX secolo venne introdotto nelle indagini statistiche il calcolo delle probabilità. Agli inizi del XX secolo, la statistica è ormai una scienza autonoma. La definizione di statistica come scienza prende spunto dal tipo di fenomeni studiati dalla statistica: i fenomeni statistici o collettivi, ovvero quei fenomeni il cui studio richiede una raccolta di numerose osservazioni (sono fenomeni collettivi ad esempio il numero di nascite in un anno, ecc.).
Quindi possiamo definire la statistica come quella scienza che ha come fine lo studio quantitativo o qualitativo dei fenomeni collettivi. Allora possiamo distinguere due grandi settori della statistica: la statistica descrittiva e quella inferenziale.
Statistica descrittiva
La statistica descrittiva è quella parte della statistica che si occupa di raccogliere, ordinare, riassumere, presentare ed analizzare i dati ottenuti dallo studio del fenomeno collettivo.
Statistica inferenziale
La statistica inferenziale, invece, si occupa dello studio statistico di campioni di unità statistiche anziché del totale delle unità.
Fasi della ricerca statistica
Ogni studio o indagine statistica comporta lo svolgimento di diverse operazioni, dal momento della definizione del problema da analizzare (fenomeno che vogliamo analizzare) alla raccolta dei dati, dalle elaborazioni ai risultati. Le principali fasi nelle quali si svolge un’indagine statistica sono:
Piano della rilevazione
Riguarda la definizione del problema da analizzare, cioè una volta stabilito il fenomeno oggetto di studio e lo scopo della ricerca, andranno definiti:
- La scelta e il campo di indagine, ossia la scelta sia delle unità che dei caratteri da rilevare;
- La scelta del metodo di rilevazione: direttamente, tramite questionario. La rilevazione potrà essere totale (ad es. il questionario impiegato dall’ISTAT in occasione del censimento della popolazione) oppure campionaria (parziale); indirettamente tramite la raccolta dei dati statistici prodotti da altri;
- La scelta dell’epoca di rilevazione, cioè quando effettuare la raccolta dei dati;
- Il personale e l’organizzazione necessaria alla raccolta dei dati (istruzioni nelle somministrazioni dei questionari, sondaggi postali, ecc.);
- Gli strumenti necessari alla rilevazione (stesura e stampa dei questionari) e all’elaborazione dei dati (elaboratore e programmi necessari);
- Le fonti statistiche (bibliografie, ricerche, ecc.);
- Tempi e costi.
Metodi di rilevazione
Tra i metodi di rilevazione dei dati, molto impiegato è quello dell’indagine mediante questionario da sottoporre a una collettività o a un campione di essa.
Il questionario è un modello di rilevazione costituito da un certo numero di domande che sono espresse in modo standardizzato (cioè sono uguali per tutti gli interpellati) e strutturato (cioè le domande sono legate all’oggetto della ricerca). Il questionario può essere compilato:
- Direttamente dalla persona da interpellare alla quale viene consegnato il questionario che sarà ritirato una volta compilato;
- Tramite la tecnica dell’intervista: in questo caso è l’intervistatore a porre le domande del questionario all’intervistato;
- Tramite una combinazione dei due modi precedenti: ad esempio la tecnica del giorno dopo mediante la quale l’intervistatore effettua una prima visita per intervistare l’interpellato al quale lascerà da compilare per un giorno successivo stabilito un altro questionario.
Vi possono però essere dei fattori di distorsione delle risposte, cioè: formulazione poco chiara delle domande, errori di segnatura di una casella diversa da quella corrispondente alla risposta voluta. Elenchiamo quindi alcuni dei principali criteri che bisogna seguire nella stesura di un questionario:
- Il linguaggio deve essere più possibile chiaro, preciso nei riferimenti a tempi, persone, luoghi, ecc.; semplice, cioè impiegare un solo concetto per domanda, ecc.;
- L’ordine in cui vengono poste le domande, cioè bisogna tener conto degli effetti che una domanda può avere su quella successiva. Pertanto le domande generali su un argomento dovrebbero precedere quelle più specifiche. Le domande più delicate o riservate vanno poste generalmente alla fine del questionario così come le notizie personali riguardanti l’interpellato;
- Il numero delle domande, cioè la lunghezza del questionario deve essere limitata (ad es. durare massimo mezz’ora);
- La presentazione tipografica delle domande e le relative risposte hanno un’importanza non trascurabile. Una buona presentazione delle domande è caratterizzata dal fatto che accanto alle modalità di risposta alle singole domande vengano collocati dei quadratini in bianco (in modo che sia chiaro all’interpellato dove segnare la risposta);
- Le domande possono essere di vario tipo, cioè domande chiuse, aperte e libere. Le domande aperte sono quelle in cui le possibili risposte sono in parte previste lasciandone ad esempio una libera del tipo “altro (specificare)”. Le domande libere sono le domande le cui risposte possono essere fornite dall’interpellato liberamente. Le domande chiuse sono quelle domande nelle quali sono previste tutte le possibili risposte.
Raccolta dei dati
La raccolta dei dati consiste nella costituzione della documentazione statistica di partenza, cioè nell’acquisizione dei dati. La documentazione statistica di partenza, in base al tipo di rilevazione scelta, assumerà forme diverse: sarà costituita da tutti i questionari compilati, da tabulati, da fogli amministrativi che costituiscono il materiale grezzo.
Classifica e spoglio dei dati
La classificazione dei dati riguarda la sistemazione dei dati grezzi in una forma che può essere trattata dal punto di vista statistico. In questa fase ciascuna delle unità statistiche viene classificata attraverso lo spoglio dei dati contenuti nella documentazione statistica di partenza (dati grezzi). Questa fase è molto importante perché rappresenta il primo passo per il trattamento statistico dei dati in quanto essa trasforma il materiale grezzo di partenza (questionari, modelli, ecc.) in dati statistici e in distribuzioni statistiche. Lo spoglio può essere di due tipi: spoglio manuale dei dati e spoglio con mezzi informatici.
Lo spoglio manuale dei dati consiste nel classificare ciascuna delle unità statistiche rilevate manualmente. Ad esempio, supponiamo di voler rilevare su un collettivo di 50 individui - unità statistiche - un solo carattere: la statura. Lo spoglio manuale consiste nel predisporre la tabella di spoglio e nel tracciare tante lineette quante sono le unità che possiedono una stessa modalità del carattere.
| Statura in cm | Unità statistiche |
|---|---|
| 1.40-1.49 | II |
| 1.50-1.59 | IIII II |
| 1.60-1.69 | IIII IIII I |
Dalla tabella di spoglio si ottiene la distribuzione semplice di frequenza.
Lo spoglio con mezzi informatici viene effettuato con procedure diverse rispetto a quelle materiali, esso richiede che i dati siano registrati su un supporto particolare magnetico: “dischetti”. Le informazioni sono riportate sul supporto tramite una tastiera collegata al PC, i dati devono essere immessi. L’operazione di immissione e archiviazione dei dati su supporto magnetico prende il nome di creazione e archiviazione della matrice dei dati iniziali.
Elaborazione dei dati
Tale fase riguarda tutte le possibili elaborazioni, dalle più elementari alle più complesse secondo gli scopi della ricerca (formazione di tabelle semplici o multiple, calcolo di indici, medie, correlazioni, rappresentazioni grafiche). Si tratta della fase in cui si applicano i procedimenti della statistica.
Interpretazione dei risultati
Riguarda l’analisi dei risultati ottenuti, rappresenta l’aspetto più complesso e delicato dell’indagine statistica. La statistica, intesa come metodologia di sintesi delle informazioni quantitative e qualitative rilevate su più unità statistiche, consente di cogliere legami tra fenomeni e tra unità.
La rilevazione dei dati e la matrice dei dati
Individuata la popolazione statistica, scelti uno o più caratteri da investigare, prima di procedere alla raccolta vera e propria dei dati occorre definire il piano della rilevazione dei dati. Esso consiste nello stabilire le risorse disponibili e il tipo di rilevazione che deve essere effettuato. Le risorse disponibili consistono negli strumenti, nel personale, nei fondi da destinare all’indagine. La rilevazione può essere di tipo totale o parziale. È totale quando viene effettuata su tutte le unità statistiche della popolazione, è parziale quando viene eseguita solamente su una parte delle unità statistiche. In questo caso si parla di rilevazione campionaria in quanto essa analizza solo un campione statistico.
Un campione statistico è un sottoinsieme opportunamente scelto dall’intera popolazione e quindi rappresentativo della stessa. Ad esempio, se si vuole compiere un’indagine sul reddito medio degli abitanti di una città, la popolazione statistica è costituita da tutti gli abitanti della città che presentano qualche forma di reddito; se si compie un’indagine totale, si devono classificare tutti gli abitanti. Se invece si compie un’indagine campionaria, si deve scegliere un campione, vale a dire un gruppo ristretto di individui da classificare.
Le rilevazioni totali offrono informazioni complete circa l’intera popolazione, ma quando la popolazione è numerosa comportano tempi di realizzazione e costi elevati. Le rilevazioni parziali invece comportano costi decisamente meno elevati, sono più rapide però presentano lo svantaggio di dare risultati approssimativi e portare a conclusioni errate. Infine si deve notare che le rilevazioni possono essere occasionali, periodiche o continue. Sono rilevazioni occasionali i sondaggi d’opinione su argomenti specifici; sono rilevazioni periodiche i censimenti; sono rilevazioni continue le registrazioni inerenti le nascite e le morti.
Una volta rilevati i dati si deve effettuare lo spoglio per poi procedere all’analisi e all’elaborazione. Prima di procedere all’elaborazione vera e propria i dati devono essere registrati su un supporto magnetico (floppy disk). Questa registrazione prende il nome di data entry e normalmente viene svolta da appositi uffici dotati di attrezzature atte a svolgere simili operazioni (centri di registrazione dati). Terminata la fase di data entry, i dati registrati su un nastro o disco vengono elaborati dal PC con appositi programmi.
Se consideriamo la compilazione di un questionario bisogna barrare le apposite caselle dove, ad ogni casella, corrisponde un codice. Tutti i questionari compilati dalle diverse unità statistiche costituiscono l’insieme dei dati grezzi. Il data entry consiste nel trasferimento dei dati grezzi raccolti in una matrice dei dati pronta per essere elaborata autonomamente dall’elaboratore. La matrice dei dati è l’insieme dei dati non ancora raggruppati per frequenza, quindi rappresenta la situazione precedente alla costruzione di una tabella.
Le fonti statistiche
Alla base di qualsiasi analisi statistica esiste il problema della raccolta di dati in base ai quali effettuare le elaborazioni statistiche. In altri termini è particolarmente importante individuare le fonti di provenienza dei dati intese come qualsiasi tipo di documentazione che raccoglie dati riferiti ai fenomeni oggetto di studio. Le fonti di provenienza dei dati possono essere diverse:
- Fonti orali: rappresentati da testimonianze, colloqui, ecc.;
- Fonti scritte: rappresentati da tutte quelle notizie che si possono ricavare da archivi storici, lettere personali, biografie, ecc.;
- Fonti statistiche: ossia fonti che forniscono informazioni già sotto forma di dati statistici.
Sono ovviamente le fonti statistiche quelle più attendibili e quindi più importanti. Le fonti orali invece sono, dal punto di vista statistico, le meno attendibili. A un livello intermedio di attendibilità ci sono le fonti scritte.
Le fonti statistiche ufficiali dell'ISTAT
La legge assegna all’ISTAT il compito di raccogliere ed elaborare dati statistici relativi a diversi assetti della vita del paese. Esistono molti altri enti, sia pubblici (es. banche) che privati (es. fondazioni, enti di ricerca, ecc.) che producono statistiche di rilevante interesse nazionale.
I censimenti
Tra le molte statistiche impiegate dall’ISTAT sono particolarmente importanti i censimenti. Essi rappresentano una delle fonti di dati statistici più antiche. Nell’epoca moderna i censimenti effettuati con cadenza periodica, hanno scopi scientifici e amministrativi, e si riferiscono alla totalità delle famiglie, delle persone, delle case, dell’attività economica di un paese. Scopo principale di un censimento è quello di accertare il numero e la distribuzione territoriale delle unità di rilevazione. Oltre al censimento demografico vengono effettuati il censimento delle abitazioni, il censimento delle attività economiche, il censimento dell’agricoltura. Il censimento comporta costi notevoli, in Italia infatti si tratta di raggiungere una per una tutte le famiglie, le aziende agricole, i negozi, bar, ecc. Le informazioni vengono chieste per mezzo di un questionario, rispetto al quale le rilevazioni censuarie comportano due problemi:
- La delimitazione del campo d’indagine, cioè l’individuazione dei quesiti da inserire nel questionario del censimento (si cerca di evitare un’eccessiva richiesta di informazioni);
- Il contenimento dei tempi necessari allo spoglio (è necessaria un’organizzazione efficiente utilizzando le metodologie statistiche più avanzate e i mezzi elettronici più moderni);
- L’elaborazione di moltissimi dati.
Censimento generale della popolazione e delle abitazioni
Il primo censimento demografico fu effettuato nel 1861. Successivamente ristabilì che il censimento demografico venisse fatto ogni 10 anni. Le unità di rilevazione sono rappresentate dalle famiglie e dalle convivenze.
I modelli di rilevazione sono due: il foglio di famiglia e il foglio di convivenza. In particolare si possono distinguere due gruppi di domande:
- Quesiti di carattere anagrafico (sesso, età, ecc.);
- Quesiti riguardanti alcuni aspetti della realtà (istruzione, professione, ecc.).
Per quanto riguarda il riferimento territoriale, la sezione o frazione di censimento è l’unità territoriale di base per la raccolta dei dati. L’organizzazione della rilevazione è complessa e si svolge sia a livello centrale che periferico. Organo centrale è l’ISTAT, organi periferici sono gli Uffici Comunali di Censimento (essi hanno il compito di raccogliere i dati) e gli Uffici Provinciali di Censimento (hanno il compito di controllare). I comuni, suddiviso il territorio comunale in sezioni di censimento, affidano ai rilevatori (una sezione per rilevatore) la materiale raccolta dei dati. Il rilevatore provvede all’individuazione dell’unità di censimento, curando la consegna e il ritiro dei questionari. Lo spoglio dei dati si articola in:
- Spoglio totale: riferito a tutti i fogli di famiglia e di convivenza per le notizie tradizionali e per tutte le notizie sulle abitazioni;
- Spoglio parziale: riferito a un campione dei fogli di famiglia e di convivenza per le altre notizie.
Successivamente si procede alla pubblicazione dei risultati censuari; i dati censuari sono disponibili anche su supporto magnetico.
Il censimento delle abitazioni
Sin dal primo censimento demografico del 1861 furono prese in considerazione alcuni caratteri riguardanti le abitazioni, ma fu solo nel 1951 che fu effettuato il primo vero e proprio censimento delle abitazioni, insieme al censimento demografico. L’unità di rilevazione è l’abitazione. L’organizzazione, così come lo spoglio e l’elaborazione dei dati, è uguale a quella del censimento demografico, in quanto i due censimenti sono abbinati e riavvalgono degli stessi rilevatori (infatti vengono realizzati contemporaneamente).
Censimento generale dell'industria, del commercio, dei servizi e dell’artigianato
Sono stati effettuati censimenti dell’industria e del commercio nel 1927 e successivamente ogni 10 anni. Il censimento dell’industria e del commercio estende il campo d’indagine anche ai trasporti, comunicazioni, assicurazioni, ecc. L’unità di rilevazione è costituita da: unità giuridico-economica (impresa o ditta); unità locale (stabilimento, negozio, ecc.). Per quanto riguarda il modello di rilevazione è stato adottato un unico questionario contenente una parte riservata alle notizie sull’impresa, e una parte riservata all’unità locale. Il riferimento territoriale, l’organizzazione della rilevazione, spoglio ed elaborazione dei dati, sono del tutto simili a quelli descritti per i censimenti demografici. Oltre alle pubblicazioni dei dati elaborati, sono disponibili anche su supporti magnetici per analisi dettagliate.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Elementi di statistica
-
Elementi di economia
-
Appunti Elementi di biostatistica
-
Questionario Elementi di biostatistica