Estratto del documento

Statistica 1. Capitolo 1

La statistica analizza in termini quantitativi i fenomeni collettivi, ossia i fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali. Per esempio, sono fenomeni collettivi il consumo di un determinato bene in un periodo fissato, il reddito di un insieme di individui, il peso di un gruppo di oggetti o di persone, ecc.

Caratteristiche e modalità

Le caratteristiche, o più brevemente caratteri, assumono in corrispondenza di ogni individuo una determinata modalità. Le modalità possono essere numeriche, come nel caso dei caratteri Età, Peso, Punteggio esercizi, oppure non-numeriche, come per i caratteri Sesso, Titolo di Studio, Attività. Nell’esempio precedente l’individuo è l’unità elementare su cui vengono osservati i caratteri selezionati.

Unità statistica e collettivo statistico

Si definisce unità statistica l’unità elementare su cui vengono osservati i caratteri oggetto di studio. Un insieme di unità statistiche, omogenee rispetto ad una o più caratteristiche, costituisce un collettivo statistico o una popolazione. La popolazione residente a Roma e gli esercizi commerciali di Milano costituiscono dei collettivi di stato, in quanto sono individuabili in maniera esatta solo se si fissa un preciso istante di tempo. Viceversa le automobili vendute in Italia in un dato periodo sono dei collettivi di movimento.

Se tutte le unità che costituiscono la popolazione sono effettivamente osservabili, il collettivo viene detto empirico, altrimenti viene detto teorico. Se l’insieme è costituito da un numero finito di unità statistiche viene detto finito, altrimenti viene detto infinito.

Modalità dei caratteri

Un carattere può assumere modalità differenti in corrispondenza delle diverse unità statistiche del collettivo. Le modalità del carattere devono essere esaustive e non sovrapposte (se a ogni unità si può associare una sola modalità). Quando le modalità sono espresse numericamente, il carattere è detto quantitativo (o variabile), altrimenti è detto qualitativo (o mutabile).

Caratteri quantitativi e qualitativi

  • Caratteri quantitativi con scala a intervalli: Non esiste uno zero assoluto, naturale e non arbitrario: temperatura misurata in gradi centigradi.
  • Caratteri quantitativi con scala di rapporti: Esiste uno zero assoluto, naturale e arbitrario: Peso, Reddito, Età, Lunghezza di un oggetto, ecc.
  • Caratteri quantitativi continui: L’insieme delle modalità assumibili può essere in corrispondenza biunivoca con un sottoinsieme dei numeri interi.
  • Caratteri quantitativi discreti: L’insieme delle modalità assumibili può essere in corrispondenza biunivoca con un sottoinsieme dei numeri reali.
  • Carattere quantitativo trasferibile: Se ha senso immaginare che un’unità statistica possa cedere tutto o parte del carattere a un’altra unità statistica: Reddito, terreno posseduto o Numero di operai dipendenti.
  • Carattere quantitativo non trasferibile: Se un’unità statistica non può cedere tutto o parte del carattere a un’altra unità statistica: Peso, Età, Titoli.

A volte si parla di livello di misura del carattere per distinguere tra i tipi di caratteri possibili. Avremo quindi un livello di misura nominale, ordinale, su scala a intervalli, su scala di rapporti. Il termine misura è impiegato in tal caso in un’accezione ampia e deve intendersi come quell’operazione consistente nell’assegnare numeri o attributi alle proprietà dell’unità statistica.

Un carattere qualitativo viene distinto in:

  • Carattere sconnesso (o con scala nominale): Se date due sue modalità è possibile affermare soltanto se queste sono uguali o diverse: Sesso, Attività, Luogo di nascita, Stato civile, Religione, Colore degli occhi, ecc.
  • Carattere ordinato (o con scala ordinale): Se date due sue modalità è possibile solo dare un ordine, specificando che una precede l’altra: esprimono un grado di soddisfazione (poco, abbastanza, molto), posizione in una graduatoria, titolo di studio (con modalità senza titolo, licenza, laurea).
    • Caratteri ordinati rettilinei: Possiedono cioè una modalità iniziale e una finale.
    • Caratteri ordinati ciclici: Hanno un ordine naturale di successione, ma non hanno però vere e proprie modalità iniziali e finali, le quali possono essere fissate solo in modo convenzionale. Direzione del vento o il mese di nascita.

Suddivisione in classi di un carattere quantitativo

Se il carattere che si vuole analizzare presenta molte modalità distinte, si possono avere notevoli difficoltà nella comprensione dei dati osservati. Per esempio, il settore di attività (centinaia di modalità diverse) o il carattere quantitativo discreto Numero di autovetture transitate a un determinato incrocio (come modalità tutti gli interi non negativi), o il carattere quantitativo continuo Altezza (tutti i valori compresi tra 40,0 cm e 250,0 cm).

Se il carattere è quantitativo, si definisce suddivisione in classi del carattere l’operazione consistente nel suddividere l’insieme dei possibili valori in intervalli tra loro disgiunti. Con tale operazione il carattere quantitativo passa da livello di misura su scala di intervalli/di rapporti a livello ordinale. Le classi possono avere uguale o diversa ampiezza, dove per ampiezza della classe si intende la differenza tra estremo superiore ed inferiore.

Per esempio, per il carattere Età in anni compiuti potremmo considerare le classi di età: da 0 a 5 anni, 6-10, 11-14, 15-18, ecc. In tal modo a ogni unità statistica non corrisponde più una modalità del carattere bensì una particolare classe di valori. È opportuno definire le classi in modo che:

  • Il loro numero sia abbastanza piccolo da fornire una sintesi adeguata ma sufficientemente grande da tenere l’informazione con giusto dettaglio.
  • Siano tra loro disgiunte.
  • Comprendano tutte le possibili modalità del carattere.
  • Abbiano, se possibile, la stessa ampiezza.

I diversi tipi di rilevazione

Tra le situazioni di rilevazione in cui lo statistico si trova a operare per l’acquisizione dei dati bisogna distinguere quelle di tipo sperimentale da quelle osservazionali. La situazione di rilevazione sperimentale (esperimenti fisici, chimici, biologici, ecc.) è caratterizzata da:

  • Le ipotesi di lavoro, costituite da enunciati formalizzabili spesso in termini matematici.
  • La possibilità di controllare sia le condizioni in cui l’esperimento si svolge, sia le caratteristiche delle unità statistiche da impiegare.

In una situazione di rilevazione osservazionale (indagini statistiche, indagini di mercato, sondaggi, rilevazioni economiche, ecc.) non si ha la possibilità di controllare le condizioni sotto le quali si svolge l’osservazione e solo in parte si possono controllare le caratteristiche delle unità statistiche. In altre parole, la situazione sperimentale richiede un controllo, con possibile modificazione, del corso naturale degli eventi mentre la situazione osservazionale pone l’osservatore in un ruolo passivo di minima interferenza con i fenomeni che vuole osservare.

Le variabili ritenute più importanti nella determinazione del fenomeno osservato vengono dette fattori. Possiamo distinguere i fattori in:

  • Fattori sperimentali: Variabili su cui l’esperimento è chiamato a fornire una verifica del loro diverso effetto e spesso sono l’oggetto principale della ricerca: trattamenti farmacologici, fertilizzanti, ecc.
  • Fattori di stratificazione: Composizione dell’insieme delle unità sperimentali: peso, età, sesso, ecc.

Per effettuare il controllo diretto dei fattori sperimentali e di stratificazione si utilizza un disegno sperimentale, il quale specifica la metodologia da impiegare per avere un controllo diretto su di uno o più fattori che incidono sul fenomeno di interesse. Ma non si può essere mai sicuri che altri fattori, trascurati dal piano sperimentale, non possano influenzare i risultati dell’esperimento. Per tale motivo si opera un controllo indiretto di tali fattori attraverso una particolare procedura di selezione delle unità statistiche detta randomizzazione.

L’obiettivo principale dell’indagine statistica è la conoscenza di una popolazione, intesa come un insieme di unità elementari su cui si manifesta il fenomeno oggetto di studio. Per la raccolta delle informazioni sui caratteri della popolazione possono essere utilizzati due diversi tipi di indagine:

  • Indagine totale o censuaria: Si rilevano i caratteri di interesse su tutte le unità costituenti la popolazione.
  • Indagine campionaria: Ci si limita a un sottoinsieme ridotto in unità, ossia a un campione.

Fasi dell'indagine

  • Definizione degli obiettivi
  • Definizione delle unità e delle variabili da rilevare
  • Scelta del periodo di riferimento
  • Individuazione della popolazione e della lista delle unità statistiche (una buona lista deve essere: completa, esatta, e aggiornata)
  • Definizione del piano di campionamento (ad es. campionamento areale: estrazione casuale di alcuni piccoli territori su cui sono intervistate “a tappeto” tutte le unità presenti; campionamento “a valanga” per popolazioni rare: si sceglie gruppo iniziale, da cui ottenere nomi/indirizzi di altre unità della stessa popolazione)
  • Raccolta dei dati (tramite ad esempio interviste con metodi diretti/indiretti, strutturate/semistrutturate o non, che sono raccolte in un modello, detto questionario)
  • Scelta della tecnica di rilevazione
  • Formulazione del questionario e pretest
  • Rilevazione sul campo
  • Registrazione dei dati
  • Registrazione su supporto magnetico
  • Controllo e correzione
  • Elaborazione e analisi dei dati

In Italia, l’Istituto Nazionale di Statistica (ISTAT), attivo dal 1926, è l’organo della statistica ufficiale ed è il maggiore produttore di dati. Con il decreto legislativo 322/89 è stato istituito il Sistema Statistico Nazionale (Sistan) che oltre all’ISTAT, a cui è stato affidato anche il ruolo di coordinatore delle varie fonti di rilevazione, include numerosi enti che rilevano e diffondono dati attraverso i loro Uffici statistici. Ogni anno l’ISTAT svolge circa 200 indagini. Di queste il 3% riguarda l’ambiente, il 5% è di tipo demografico, il 35% di tipo sociale e il 57% si occupa dell’area economica. Le indagini censuarie svolte periodicamente in Italia sono le seguenti:

  • Censimento generale della popolazione e delle abitazioni: informazioni circa le caratteristiche strutturali della popolazione e delle abitazioni.
  • Censimento generale dell’industria, del commercio, dei servizi e dell’artigianato: caratteristiche strutturali delle imprese e delle unità locali.
  • Censimento generale dell’agricoltura, dal quale si ricavano le caratteristiche strutturali delle aziende agricole.
  • Indagine sulle forze di lavoro: indagine continua trimestrale. Misura l’occupazione, disoccupazione e grado di partecipazione al mercato del lavoro.
  • Indagine sui consumi delle famiglie.
  • Indagine multiscopo: ciclica, notizie su qualche tematica di particolare interesse riguardante le famiglie (salute, tempo libero, anziani, ecc.).

Tra le fonti ufficiali, hanno particolare rilevanza le fonti amministrative. Altre fonti di dati sono costituite dalle banche dati.

Fenomeno collettivo

  • Rilevazione parziale: Su un sottoinsieme di unità del collettivo.
  • Rilevazione completa: Su tutte le unità del collettivo.

Può accadere che il collettivo che sta alla base del fenomeno oggetto di studio presenti una numerosità teoricamente “infinita”, come nel caso degli individui appartenenti a una certa specie animale. Talvolta, invece, sono i limiti di tempo e/o di disponibilità di risorse (tecniche, finanziarie, di personale) che impediscono la raccolta dei dati statistici per tutte le unità della collettività di interesse. In altre circostanze, poi, la rilevazione dei dati statistici si risolve nella “distruzione” delle unità sulle quali la rilevazione è compiuta, come accade nella misurazione della resistenza alla trazione di barre metalliche. Infine, anche quando una rilevazione completa sia realizzabile, può essere conveniente eseguire una rilevazione parziale per i vantaggi che quest’ultima comporta in termini di contenimento dei costi, rapidità di esecuzione, possibilità di raccogliere informazioni più estese e accurate.

In questi casi, nascono due problemi:

  • Come scegliere il sottoinsieme di unità (campione) su cui svolgere la rilevazione.
  • Valutare se e in qual modo i dati rilevati sul campione consentano di esprimere un giudizio quantitativo su certi aspetti del fenomeno considerato, riferiti all’intera collettività.

Il complesso delle tecniche che sono state proposte per risolvere questi problemi rientra, da un lato, nel campionamento statistico e, dall’altro, nell’inferenza statistica (con cui è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione. È possibile progettare le indagini campionarie definendo già a priori tale grado di attendibilità e questo rende più interessante l’utilizzo di indagini campionarie).

Un altro aspetto fondamentale riguarda la qualità delle osservazioni ottenute dall’indagine: i risultati di un’indagine possono essere affetti anche da errori che non dipendono direttamente dalla natura aleatoria dell’operazione di campionamento bensì da altri fattori → errori non campionari. Per poter comprendere l’inferenza statistica è necessario introdurre alcuni concetti di base di calcolo delle probabilità.

Statistica

  • Statistica descrittiva
  • Calcolo delle probabilità
  • Inferenza statistica

Una seconda articolazione conduce a distinguere la statistica metodologica dalla statistica applicata. La statistica metodologica si rivolge allo studio dei fenomeni collettivi astrattamente intesi. Si avvale dell’apporto di altre discipline (matematica, calcolo delle probabilità, ecc.) ed elabora metodi idonei a esprimere e analizzare i dati raccolti.

Anteprima
Vedrai una selezione di 4 pagine su 11
Appunti di statistica base Pag. 1 Appunti di statistica base Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti di statistica base Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti di statistica base Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher GiaBrin di informazioni apprese con la frequenza delle lezioni di Analisi e statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bergamo o del prof Caviezel Valeria.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community