vuoi
o PayPal
tutte le volte che vuoi
TERMINOLOGIA
POPOLAZIONE DI RIFERIMENTO: un insieme di individui o animali o oggetti, costituisce la parte del mondo che interessa, quella su
cui dobbiamo produrre nuove conoscenze, quella che è coinvolta nelle decisioni da prendere.
La popolazione va identificata con esattezza, ovvero in quale momento temporale, in quale luogo, che tipo di unità statistiche, ecc.
La popolazione può essere:
Osservabile: La popolazione osservabile si riferisce all’insieme completo di elementi o unità di osservazione che possono
essere effettivamente misurati o considerati in uno studio o in un esperimento.
È la popolazione di interesse che è accessibile per l’osservazione e la raccolta di dati.
Ad esempio, se stai conducendo uno studio sulla statura di tutti gli studenti di una scuola specifica, la popolazione osservabile
sarà costituita da tutti gli studenti di quella scuola.
Teorica: La popolazione teorica, o la popolazione ideale, è un concetto più astratto e rappresenta l’insieme completo di tutti i
possibili casi che potrebbero essere inclusi nello studio, indipendentemente dalla loro osservabilità o misurabilità pratica.
Immaginiamo di condurre uno studio sulla longevità delle lampadine prodotte da un certo produttore.
La popolazione teorica in questo caso sarebbe l’insieme completo di tutte le lampadine che potrebbero essere prodotte da
quel produttore in tutte le condizioni possibili.
Questa popolazione teorica includerebbe tutte le lampadine che potrebbero essere prodotte in futuro, anche quelle che non
sono ancora state fabbricate.
Inoltre, potrebbe includere lampadine che potrebbero essere prodotte con diverse specifiche, dimensioni, materiali, ecc.
in altre parole, la popolazione teorica rappresenta un concetto più ampio e ideale che va oltre ciò che è attualmente
osservabile o misurabile nel contesto dello studio specifico.
Finita: Se è costituita da un numero finito di unità, oppure no, come, ad esempio, in Italia, ovviamente, la popolazione è
limitata
Infinita: Esempio di prima, le lampadine, sono infinite in quanto andiamo a tenere in considerazione anche quelle future.
.
N.B.: Solitamente una popolazione osservabile è finita, mentre, quella teorica è infinita.
UNITÁ STATISTICHE: Unità elementare su cui vengono osservati i caratteri oggetto di studio.
Le unità statistiche sono individuate in base agli obiettivi conosciuti dell’indagine.
Esse sono disomogenee rispetto alle caratteristiche rilevate, e quindi, i dati sono affetti da variabilità.
Un insieme di unità statistiche omogenee rispetto a una o più caratteristiche costituisce un collettivo statistico o una popolazione.
.
CARATTERI (O VARIABILI) O DATI
Alcune caratteristiche di tutte o di una parte delle unità statistiche vengono rilevate/misurate, ed il risultato di questa
rilevazione/misurazione costituisce quello che chiamiamo i dati.
Le caratteristiche rilevate sono scelte in base al fenomeno di interesse, e sono chiamate caratteri o variabili.
I diversi modi in cui un carattere si manifesta sulla popolazione si chiamano modalità di carattere.
Le unità statistiche sono disomogenee rispetto alle caratteristiche rilevate, e quindi, i dati sono affetti da variabilità.
L’obbiettivo è quello di trasformare i dati in nuove conoscenze o ipotesi di decisione ossia, di trasformare i dati in affermazioni sul
mondo (Sulla popolazione di riferimento).
CAMPIONE E DATI CAMPIONARI
Se le variabili di interesse non sono rilevate su tutte le unità statistiche, il sottoinsieme della popolazione oggetto della rilevazione,
è chiamato campione.
Per la maggior parte si ha a che fare con dati campionari, ossia i dati ottenuti dalla rilevazione sul solo campione.
Solo raramente si rilevano dati sull’intera popolazione.
Esempio: I dati del censimento ISTAT sono dati che si riferiscono all’intera popolazione.
Perché si svolgono indagini/rilevazioni campionarie?
Tanti motivi, ad esempio, i tempi ragionevolmente più corti, costi sostenibili, maggiore qualità dell’informazione,
un maggior numero di variabili osservabili, in alcuni casi, la popolazione è teorica o infinita, ecc.
CLASSIFICAZIONE DEI CARATTERI STATISTICI
Un carattere/variabile può essere:
Qualitativo (O categoriale): Modalità non numeriche;
Le modalità utilizzate per descrivere il carattere rilevato prendono la forma di aggettivi o di altre espressioni verbali o di
“etichette”.
Quantitativo: Modalità espresse da numeri.
Se stessi studiando una popolazione di persone, i caratteri potrebbero includere l’età (Carattere quantitativo)
e il genere (Carattere qualitativo)
CARATTERI QUALITATIVI
Un carattere qualitativo può essere:
Sconnesso o nominale: Se non esiste nessun ordinamento naturale tra le modalità.
Esempi: Il sesso, il tipo di servizio offerto da un albergo, religione, luogo di nascita.
Ordinato: Nel caso in cui esiste un’ordinamento naturale tra le modalità.
Esempi: Grado di soddisfazione, posizione in graduatoria, il titolo di studio, parere di un intervistato.
Rettilineo: Se ha una modalità iniziale e una finale
Ciclico: Se ha una modalità iniziale e quella finale è fissata convenzionalmente.
Esempi: Punti cardinali, mesi dell’anno.
N.B.: Se le modalità sono due si parla di variabile dicotomica o binaria.
CARATTERI QUANTITATIVI
Un carattere quantitativo può essere:
Continuo: Se le modalità sono numeri reali, come, ad esempio, il peso, l’altezza o il prodotto interno lordo.
Un carattere quantitativo continuo assume un numero infinito di valori all’interno di un certo intervallo.
Ad esempio, l’altezza di una persona è un carattere quantitativo continuo, quindi la misura può essere qualsiasi valore
all’interno di un intervallo, come, ad esempio, 165,72 cm o 166,01 cm.
Discreto: Se le modalità sono numeri interi, tipicamente conteggi, come, ad esempio, il numero di figli, il numero di clienti in
coda allo sportello di una banca o il numero di aziende con meno di 20 dipendenti.
Le misurazioni non possono assumere valori frazionari o decimali, ad esempio, il numero di libri in una biblioteca rappresenta
un carattere quantitativo discreto, non puoi avere un numero frazionario di libri, avrai, ad esempio, 10 libri, 11 libri, 12 libri,
ecc.
Per le variabili quantitative si dice che si utilizza:
Una scala a intervalli: Quando l’origine della scala stessa è arbitraria, ovvero, quando lo zero ha un’interpretazione
convenzionale, non hanno un punto zero significativo, come, ad esempio, la temperatura.
La temperatura Celsius è una scala a intervalli.
La differenza tra 20°C e 30°C è la stessa della differenza tra 30°C e 40°C, ma il valore zero su questa scala (0°C) non indica
l'assenza di temperatura.
Scala a rapporti: Quando l’origine è naturale e non è arbitraria, come, ad esempio, la lunghezza di un tavolo o il reddito,
hanno uno zero significativo, cioè lo zero indica l’assenza completa della caratteristica misurata.
Ad esempio, la lunghezza, il perso, e il tempo sono misurati su scale di rapporti, quindi, un pero di 0 kg indica l’assenza di
perso, e il rapporto tra 10 kg e 5kg è lo stesso di quello tra 20 kg e 10 kg.
Per comprendere questa classificazione, trasversale alla precedente:
Si pensi ai due esempi e si osservi che, mentre, possiamo dire che un tavolo di 200 cm è lungo il doppio di un tavolo di 100 cm,
viceversa, non possiamo dire che, quando ci sono 30° Celsius, la temperatura è doppia quando ce ne sono 15.
Ad esempio, proprio per la differente origine scelta, l’affermazione sarebbe falsa se usassimo una scala Fahrenheit,
infatti 30° e 15° sulla scala Celsius corrispondono a 86° e 59° sulla scala Fahrenheit.
IMPORTANZA DEI DATI RACCOLTI
MODALITÀ DEL CARATTERE: I diversi modi in cui un carattere si manifesta sulla popolazione.
Le modalità devono essere esaustive e non sovrapposte, con il termine esaustive si intende che le modalità elencate devono
rappresentare tutti i possibili modi di manifestarsi del carattere.
Le modalità si definiscono non sovrapposte se ad ogni unità si può associare una sola modalità, se, invece, le modalità sono due si
parla di variabile dicotomica o binaria, come, ad esempio, maschio o femmina, sano o malato.
Le modalità di un carattere rappresentano i valori che compaiono con maggiore frequenza in un insieme di dati.
In altre parole, una modalità è il valore che si verifica più frequentemente all’interno di un insieme di dati osservati.
CAMPIONE: Il campione è un sotto-insieme della popolazione oggetto della rilevazione, perché spesso accade che le variabili di
interesse non sono rilevate su tutte le unità statistiche.
Solo raramente si rilevano dati sull’intera popolazione.
DATI CAMPIONARI: I dati campionari sono i dati ottenuti dalla rilevazione sul solo campione.
.
Perché si svolgono indagini/rilevazioni campionarie?
Tanti motivi … tanti tempi ragionevolmente più corti, costi sostenibili, maggiore qualità dell’informazione, un maggiore numero di variabili
osservabili, ecc.
Si consideri una macchina che deve forare lastre di metallo. Il diametro nominale dei fori è di 1mm con una tolleranza di 0,06mm.
Un foro è ben fatto se il suo diametro è compreso tra 1 – 0,06 = 0,94mm e 1 + 0,06 = 1,06mm.
I dati sulla qualità di produzione della macchina, potrebbero essere disponibili in forme diverse:
Buono vs difettoso (Dati dicotomici)
Troppo piccolo, buono, troppo grande (Dati qualitativi ordinati)
Lunghezza del diametro (Dati quantitativi continui)
Le differenze possono essere dovute a come i dati vengono registrati, ma anche a come i diametri vengono effettivamente misurati.
Ad esempio, raccogliere dati sui diametri nella forma (B) è più rapido e richiede strumenti meno costosi di quanto richiesto dalla forma
(C)
(Basta osservare se il foro rispetta o meno i limiti di tolleranza, senza necessariamente misurare con esattezza il suo diametro).
.
ESEMPIO
Vogliamo avere un’idea sul numero di clienti e sul volume di vendite dei negozi di una città per tre categorie merceologiche ritenute
simili.
I dati rilevati sono stati riportati nella seguente tabella:
Quali sono le unità statistiche?
Le unita statistiche sono i negozi.
Qual è la popolazione di riferimento? Ed il campione?
La popolazione di riferimento è l’insieme di tutti i negozi delle tre categorie presenti nella città, mentre il campione è costituito dai 20
negozi riportati in tabella.
Di quale tipo