Estratto del documento

Statistica: la rilevazione dei fenomeni statici

La statistica si occupa dei principi scientifici ai quali dovrebbero ispirarsi le tecniche di raccolta, elaborazione ed utilizzazione a scopi pratici di informazioni concernenti fenomeni collettivi. I fenomeni collettivi sono i fenomeni il cui studio richiede l'osservazione di un insieme di manifestazioni individuali. Esempio: il reddito di un insieme di individui.

Nome Età Sesso Titolo di studio Attività Peso (kg) Punteggio esercizi
Rossi M. 32 M Laurea Occupato 72 65
Bianchi G. 39 F Laurea Occupato 55 55
Nicoletti C. 46 M Diploma Disoccupato 79 53
Marcelli F. 28 M Diploma Studente 63 78
Petrone A. 51 F Diploma Casalinga 64 21

Ciascuna di queste caratteristiche o caratteri, assume in corrispondenza di ogni individuo una determinata modalità, ad esempio il carattere peso assume la modalità 72 in corrispondenza dell'individuo Rossi. Le modalità possono essere numeriche, come età, peso, punteggio esercizi, oppure non numeriche, come sesso, titolo di studio, attività. L'individuo è l'unità elementare su cui vengono osservati i caratteri selezionati. Le possibili unità elementari sono infinite e la loro definizione dipende dal fenomeno che si sta analizzando.

Unità statistiche e popolazioni

Si definisce unità statistica l'unità elementare su cui vengono osservati i caratteri oggetto di studio. Le informazioni di interesse di tale unità possono essere riferite in modo univoco. Un insieme di unità statistiche omogenee rispetto a una o più caratteristiche costituisce un collettivo statico o una popolazione. Esempi di collettivo statico includono la popolazione residente a Roma al censimento del 2011, le automobili vendute in Italia in un certo periodo. Se tutte le unità che costituiscono la popolazione sono effettivamente osservabili, il collettivo viene detto empirico, altrimenti viene detto teorico. Se l'insieme è costituito da un numero finito di unità statistiche viene detto finito, altrimenti è infinito.

Classificazione dei caratteri statistici

Affinché possa parlarsi di popolazione, occorre che da ciascuna unità si ottengano informazioni dello stesso genere: ciascun tipo di informazione si denomina carattere. L'insieme delle informazioni elementari fornite da un collettivo si possono schematizzare mediante una tabella in cui ciascuna unità è rappresentata da una riga e ciascun carattere da una colonna. Un carattere può assumere modalità differenti in corrispondenza delle diverse unità statistiche del collettivo. Le modalità del carattere devono essere esaustive e non sovrapposte, cioè se a ogni unità si può associare una sola modalità.

Caratteri qualitativi

Quando le modalità sono espresse numericamente, il carattere è detto quantitativo (o variabile), altrimenti è detto qualitativo (o mutabile).

  • Carattere sconnesso (o scala nominale): se date due modalità è possibile affermare solo se queste sono uguali o diverse. Esempi: genere, regione di nascita o di residenza, facoltà a cui si è iscritti, professione.
  • Carattere ordinato (o con scala ordinale): se date due modalità è possibile solo dare un ordine, specificando che una precede l'altra. Esempi: titolo di studio, livello di soddisfazione di un prodotto, valutazione scolastica.

Caratteri quantitativi

I caratteri quantitativi (o variabili) vengono distinti in:

  • Con scala a intervalli: in cui non esiste un vero e proprio zero assoluto, naturale e non arbitrario; es. temperatura, tempo.
  • Con scala di rapporti: in cui è intrinseca e univoca la definizione dello zero assoluto. Esempi: peso, statura, reddito, prezzo.
  • Discreto: l'insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri interi; esempio: voto ad un esame, numero di figli.
  • Continuo: l'insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme di numeri reali; esempio: statura, età, reddito, temperatura.
  • Trasferibile: se ha senso immaginare che un’unità statistica possa cedere tutto o parte del carattere posseduto a un’altra unità statistica; esempio reddito, fatturato.

Suddivisione in classi di un carattere quantitativo

Se il carattere che si vuole analizzare presenta moltissime modalità distinte, si possono avere delle difficoltà nella comprensione dei dati osservati. In questi casi può essere necessario o conveniente procedere ad un accorpamento delle modalità. Se il carattere è quantitativo, si definisce suddivisione in classi del carattere l'operazione consistente nel suddividere l'insieme dei possibili valori in intervalli tra loro disgiunti. Con tale operazione il carattere quantitativo passa da un livello di misura su scala di intervalli o scala di rapporti a un livello ordinale. Le classi possono avere uguale o diversa ampiezza, dove per ampiezza della classe si intende la differenza tra estremo superiore ed estremo inferiore.

Esempio di suddivisione in classi: carattere → età; classi di età → [0,5], [6,10], [11,14], [15,18]. In tal modo a ogni unità statica non corrisponde più una modalità del carattere bensì una particolare classe di valori. È opportuno definire le classi in modo tale che:

  • Il numero sia abbastanza piccolo da fornire una sintesi adeguata ma sufficientemente grande da mantenere l’informazione con un livello accettabile di dettaglio.
  • Siano tra loro disgiunte.
  • Comprendano tutte le possibili modalità del carattere.
  • Abbiano, se possibile, la stessa ampiezza.

Nel caso di caratteri quantitativi continui si rende necessario includere nella classe solo uno dei due estremi dell'intervallo. Esempio di intervalli aperti a destra: classi da 130 a 150 (escluso), da 150 a 170 (escluso), da 170 a 190 (escluso), sono classi che non comprendono l'estremo destro della classe, ossia sono intervalli aperti a destra e chiusi a sinistra. Quindi l'intervallo 149.9 è incluso nella prima classe mentre il valore 150.0 è incluso nella seconda classe.

I diversi tipi di rilevazione

Per rilevazione statica si intende quel complesso di operazioni concettuali e pratiche che hanno come scopo la produzione di dati statistici. Tra le situazioni di rilevazione in cui lo statistico si trova a operare per l’acquisizione dei dati bisogna distinguere quelle di tipo sperimentale da quelle osservazionali.

Una situazione di rilevazione sperimentale è caratterizzata da:

  • Ipotesi di lavoro, costituite da enunciati formalizzati spesso in termini matematici.
  • Possibilità di controllare sia le condizioni in cui l'esperimento si svolge, sia le caratteristiche delle unità statistiche da impiegare.

In una situazione di rilevazione osservazionale non si ha la possibilità di controllare le condizioni sotto le quali si svolge l’osservazione e solo in parte si possono controllare le caratteristiche delle unità statistiche. La situazione sperimentale richiede un controllo, con possibile modificazione, del corso naturale degli eventi mentre la situazione osservazionale pone l’osservatore in un ruolo passivo di minima interferenza con i fenomeni che vuole osservare.

È essenziale poter controllare sia le condizioni in cui si svolge il rilevamento sia le caratteristiche delle unità statistiche. Le variabili più importanti nella determinazione del fenomeno osservato vengono dette fattori. Si possono distinguere:

  • Fattori sperimentali: riguardano quelle variabili su cui l’esperimento è chiamato a fornire una verifica del loro diverso effetto e costituiscono spesso l'oggetto principale della ricerca.
  • Fattori di stratificazione: riguardano la composizione dell’insieme delle unità sperimentali.

Per effettuare il controllo diretto dei fattori sperimentali e di stratificazione si utilizza un disegno sperimentale, il quale specifica la metodologia da impiegare per avere un controllo diretto su uno o più fattori che incidono sul fenomeno di interesse. Il controllo indiretto avviene attraverso unità statistiche detta randomizzazione.

Tra le situazioni di rilevazione osservazionale più note troviamo l’indagine statistica che è la principale tecnica con cui si possono acquisire informazioni concernenti la manifestazione di un fenomeno su una data popolazione. L’obiettivo principale di un’indagine statistica è la conoscenza di una popolazione intesa come un insieme di unità elementari su cui si manifesta il fenomeno oggetto di studio.

Un’indagine statistica prevede la progettazione di un piano di lavoro in cui vengono definite le diverse fasi necessarie per lo svolgimento dell’indagine:

  • Definizione degli obiettivi: - Definizione delle unità e delle variabili da rilevare; - Scelta del periodo di riferimento;
  • Individuazione della popolazione e delle lista delle unità statistiche;
  • Definizione del piano di campionamento;
  • Raccolta dati: - Scelta della tecnica di rilevazione; - Formulazione del questionario e pretesto; - Rilevazione sul campo;
  • Registrazione dei dati: - Registrazione su supporto magnetico; - Controllo e correzione;
  • Elaborazione e analisi dei dati.

La definizione degli obiettivi è il punto di partenza per ogni tipo di indagine statistica. Una cattiva definizione degli obiettivi dell’indagine potrebbe seriamente compromettere i risultati finali della stessa. Si deve poi definire il periodo di riferimento, cioè il periodo di tempo al quale devono essere riferite le informazioni, poiché, in molti casi, le informazioni raccolte non sono contemporanee al periodo di svolgimento dell’indagine. È il caso delle indagini retrospettive in cui si chiedono informazioni su eventi avvenuti in periodi precedenti al momento dell’indagine. Per poter svolgere un’indagine abbiamo bisogno di individuare le unità appartenenti alla popolazione: il mezzo che permette ciò è la lista. Questa è un elenco degli elementi appartenenti alla popolazione di riferimento e rappresenta lo strumento principale per la scelta delle unità statistiche. Esistono delle tecniche di indagine che non prevedono l’utilizzazione della lista. Fra queste il campionamento areale che prevede l’estrazione casuale di alcune piccole aree territoriali sulle quali vengono poi intervistate a tappeto tutte le unità presenti nelle aree.

Nel caso di un’indagine campionaria, una volta individuata la lista si potranno estrarre le unità formanti il campione. Tra i metodi di acquisizione di dati da popolazioni umane particolare rilievo assume l’intervista. Un’intervista consiste nel rivolgere alcune domande alle unità che compongono la popolazione di interesse e nel registrare le risposte a tali domande. Per fare un’intervista le domande vengono raccolte in un apposito modello detto questionario.

Si sono sviluppate diverse tecniche di intervista, queste possono essere distinte in:

  • Metodi diretti: in cui l’osservatore interagisce direttamente con l’unità osservata (es. intervista faccia a faccia).
  • Metodi indiretti: si avvalgono di un mezzo di mediazione tra l’osservatore e l’unità (es. attraverso il telefono).

Alcuni tipi di intervista includono l’intervista diretta e l'autocompilazione (indagine postale, e-mail). Una volta raccolti i dati si procederà alla registrazione su supporto magnetico e quindi un’analisi preliminare della loro qualità, andando a controllare, con opportuni programmi, la compatibilità delle informazioni ottenute, le mancate risposte, i dati poco attendibili. Dopo aver corretto i dati si passerà alla fase di elaborazione e analisi statistica.

Rilevazione totale e rilevazione campionaria

Per la raccolta delle informazioni sui caratteri della popolazione possono essere utilizzati due diversi tipi di indagine: indagine totale o censuaria e l’indagine campionaria. Nell’indagine totale si rilevano i caratteri di interesse su tutte le unità costituenti la popolazione, mentre nel caso dell’indagine campionaria ci si limita ad un sottoinsieme ridotto di unità, ossia un campione.

Vantaggi dell’indagine campionaria includono:

  • La riduzione dei tempi e dei costi necessari nell’effettuazione dell’indagine.
  • L’attendibilità delle informazioni ottenibili da un campione può essere misurata e controllata.
  • La qualità e la mole delle informazioni può essere maggiore di quella ottenibile da un’indagine totale.

Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione. Un altro aspetto fondamentale riguarda la qualità delle osservazioni ottenute dall’indagine. In effetti i risultati di un’indagine possono essere affetti anche da errori che non dipendono direttamente dalla natura aleatoria dell’operazione campionaria bensì da altri fattori. Tali errori vengono detti errori non campionari.

Distribuzione di un carattere e sua rappresentazione

Dalle distribuzioni unitarie alle distribuzioni di frequenza

Le distribuzioni unitarie sono dati statistici nella forma più rudimentale cioè ottenuti senza neppure procedere alle fasi dello spoglio e tabulazione. Si tratta di un elenco ordinato in cui per ciascuna unità del collettivo vengono riportate, ordinatamente per riga, le modalità riscontrate di uno o più caratteri di interesse. Definiamo distribuzione unitaria semplice di un carattere l’elencazione delle modalità osservate, unità per unità, nel collettivo preso in esame. Si parla di distribuzione unitaria multipla quando tale elencazione si riferisce a più di un carattere.

Esempio: Per ciascuno dei 40 agenti di un'assicurazione viene rilevato il numero di polizze sottoscritte in un certo giorno. I dati osservati sono: 2, 1, 4, 0, 3, 1, 1, 0, 3, 2, 2, 3, 6, 5, 2, 2, 1, 0, 1, 3, 3, 6, 4, 5, 2, 3, 2, 1, 0, 3, 1, 4, 2, 2, 3, 4, 0, 1, 2, 0.

È opportuno organizzare le osservazioni enumerando e classificando modalità coincidenti in modo da fornire sintesi di migliore leggibilità per l'interpretazione dei risultati. Per ottenere una maggiore sintesi è possibile considerare per ogni carattere la frequenza con cui le diverse modalità sono state osservate.

Indichiamo col termine frequenza assoluta di una modalità di un carattere il numero di volte che questa viene osservata nel collettivo. Tramite le frequenze possiamo ottenere una rappresentazione molto più sintetica denominata distribuzione di frequenza. La distribuzione di frequenze semplici (frequenze assolute) associa alle modalità che può assumere un carattere X, qualitativo o quantitativo, le corrispondenti frequenze assolute. La distribuzione di frequenze si dice semplice se è riferita a un unico carattere, come il sesso; si dice doppia se è riferita a due caratteri congiuntamente, come sesso e età; infine si dice multipla se si riferisce a più di un carattere.

Consideriamo un carattere che in un collettivo di n unità assume k modalità distinte: {x1, x2, …, xi, …, xk}. Indichiamo con ni la frequenza assoluta della modalità xi (i=1,2, …, k), cioè il numero di volte in cui la modalità xi si presenta nelle n unità del collettivo in esame.

Esempio: caso precedente: 2, 1, 4, 0, 3, 1, 1, 0, 3, 2, 2, 3, 6, 5, 2, 2, 1, 0, 1, 3, 3, 6, 4, 5, 2, 3, 2, 1, 0, 3, 1, 4, 2, 2, 3, 4, 0, 1, 2, 0.

Distribuzione di frequenze assolute

Ogni frequenza assoluta ni è un numero intero compreso tra 0 e n e la somma delle frequenze assolute è n₁ + n₂ + … + nk = ∑ ni = n pari alla numerosità totale del collettivo.

Una volta definite le modalità del carattere con cui costruire la distribuzione di frequenze, potrà accadere che per alcune di queste la frequenza corrispondente sia nulla. In questo caso è comunque preferibile riportarle nella distribuzione per evidenziare che il carattere esaminato su quello specifico collettivo di unità non si manifesta con quelle modalità.

Frequenze relative e percentuali

Dalle distribuzioni di frequenze assolute si può passare alle distribuzioni di frequenze relative e percentuali. La frequenza relativa è il rapporto tra la frequenza assoluta e il numero totale di unità osservate mentre la frequenza percentuale è pari alla frequenza relativa moltiplicata per 100.

Date n unità statistiche di cui nj presentano la j-esima modalità, si definisce frequenza relativa j-esima il rapporto nj/n e frequenza percentuale il prodotto (nj/n) * 100. La somma di tutte le frequenze relative è uguale a 1, mentre la somma delle frequenze percentuali è uguale a 100.

Anteprima
Vedrai una selezione di 15 pagine su 67
Appunti di Statistica Pag. 1 Appunti di Statistica Pag. 2
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 6
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 11
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 16
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 21
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 26
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 31
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 36
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 41
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 46
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 51
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 56
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 61
Anteprima di 15 pagg. su 67.
Scarica il documento per vederlo tutto.
Appunti di Statistica Pag. 66
1 su 67
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher sabrina95. di informazioni apprese con la frequenza delle lezioni di Statistica base e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Polettini Silvia.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community