Anteprima
Vedrai una selezione di 3 pagine su 10
Appunti Statistica  Pag. 1 Appunti Statistica  Pag. 2
Anteprima di 3 pagg. su 10.
Scarica il documento per vederlo tutto.
Appunti Statistica  Pag. 6
1 su 10
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

TERMINOLOGIA

POPOLAZIONE DI RIFERIMENTO: un insieme di individui o animali o oggetti, costituisce la parte del mondo che interessa, quella su

cui dobbiamo produrre nuove conoscenze, quella che è coinvolta nelle decisioni da prendere.

La popolazione va identificata con esattezza, ovvero in quale momento temporale, in quale luogo, che tipo di unità statistiche, ecc.

La popolazione può essere:

 Osservabile: La popolazione osservabile si riferisce all’insieme completo di elementi o unità di osservazione che possono

essere effettivamente misurati o considerati in uno studio o in un esperimento.

È la popolazione di interesse che è accessibile per l’osservazione e la raccolta di dati.

Ad esempio, se stai conducendo uno studio sulla statura di tutti gli studenti di una scuola specifica, la popolazione osservabile

sarà costituita da tutti gli studenti di quella scuola.

 Teorica: La popolazione teorica, o la popolazione ideale, è un concetto più astratto e rappresenta l’insieme completo di tutti i

possibili casi che potrebbero essere inclusi nello studio, indipendentemente dalla loro osservabilità o misurabilità pratica.

Immaginiamo di condurre uno studio sulla longevità delle lampadine prodotte da un certo produttore.

La popolazione teorica in questo caso sarebbe l’insieme completo di tutte le lampadine che potrebbero essere prodotte da

quel produttore in tutte le condizioni possibili.

Questa popolazione teorica includerebbe tutte le lampadine che potrebbero essere prodotte in futuro, anche quelle che non

sono ancora state fabbricate.

Inoltre, potrebbe includere lampadine che potrebbero essere prodotte con diverse specifiche, dimensioni, materiali, ecc.

in altre parole, la popolazione teorica rappresenta un concetto più ampio e ideale che va oltre ciò che è attualmente

osservabile o misurabile nel contesto dello studio specifico.

 Finita: Se è costituita da un numero finito di unità, oppure no, come, ad esempio, in Italia, ovviamente, la popolazione è

limitata

 Infinita: Esempio di prima, le lampadine, sono infinite in quanto andiamo a tenere in considerazione anche quelle future.

.

N.B.: Solitamente una popolazione osservabile è finita, mentre, quella teorica è infinita.

UNITÁ STATISTICHE: Unità elementare su cui vengono osservati i caratteri oggetto di studio.

Le unità statistiche sono individuate in base agli obiettivi conosciuti dell’indagine.

Esse sono disomogenee rispetto alle caratteristiche rilevate, e quindi, i dati sono affetti da variabilità.

Un insieme di unità statistiche omogenee rispetto a una o più caratteristiche costituisce un collettivo statistico o una popolazione.

.

CARATTERI (O VARIABILI) O DATI

Alcune caratteristiche di tutte o di una parte delle unità statistiche vengono rilevate/misurate, ed il risultato di questa

rilevazione/misurazione costituisce quello che chiamiamo i dati.

Le caratteristiche rilevate sono scelte in base al fenomeno di interesse, e sono chiamate caratteri o variabili.

I diversi modi in cui un carattere si manifesta sulla popolazione si chiamano modalità di carattere.

Le unità statistiche sono disomogenee rispetto alle caratteristiche rilevate, e quindi, i dati sono affetti da variabilità.

L’obbiettivo è quello di trasformare i dati in nuove conoscenze o ipotesi di decisione ossia, di trasformare i dati in affermazioni sul

mondo (Sulla popolazione di riferimento).

CAMPIONE E DATI CAMPIONARI

Se le variabili di interesse non sono rilevate su tutte le unità statistiche, il sottoinsieme della popolazione oggetto della rilevazione,

è chiamato campione.

Per la maggior parte si ha a che fare con dati campionari, ossia i dati ottenuti dalla rilevazione sul solo campione.

Solo raramente si rilevano dati sull’intera popolazione.

Esempio: I dati del censimento ISTAT sono dati che si riferiscono all’intera popolazione.

Perché si svolgono indagini/rilevazioni campionarie?

Tanti motivi, ad esempio, i tempi ragionevolmente più corti, costi sostenibili, maggiore qualità dell’informazione,

un maggior numero di variabili osservabili, in alcuni casi, la popolazione è teorica o infinita, ecc.

CLASSIFICAZIONE DEI CARATTERI STATISTICI

Un carattere/variabile può essere:

 Qualitativo (O categoriale): Modalità non numeriche;

Le modalità utilizzate per descrivere il carattere rilevato prendono la forma di aggettivi o di altre espressioni verbali o di

“etichette”.

 Quantitativo: Modalità espresse da numeri.

Se stessi studiando una popolazione di persone, i caratteri potrebbero includere l’età (Carattere quantitativo)

e il genere (Carattere qualitativo)

CARATTERI QUALITATIVI

Un carattere qualitativo può essere:

 Sconnesso o nominale: Se non esiste nessun ordinamento naturale tra le modalità.

Esempi: Il sesso, il tipo di servizio offerto da un albergo, religione, luogo di nascita.

 Ordinato: Nel caso in cui esiste un’ordinamento naturale tra le modalità.

Esempi: Grado di soddisfazione, posizione in graduatoria, il titolo di studio, parere di un intervistato.

 Rettilineo: Se ha una modalità iniziale e una finale

 Ciclico: Se ha una modalità iniziale e quella finale è fissata convenzionalmente.

Esempi: Punti cardinali, mesi dell’anno.

N.B.: Se le modalità sono due si parla di variabile dicotomica o binaria.

CARATTERI QUANTITATIVI

Un carattere quantitativo può essere:

 Continuo: Se le modalità sono numeri reali, come, ad esempio, il peso, l’altezza o il prodotto interno lordo.

Un carattere quantitativo continuo assume un numero infinito di valori all’interno di un certo intervallo.

Ad esempio, l’altezza di una persona è un carattere quantitativo continuo, quindi la misura può essere qualsiasi valore

all’interno di un intervallo, come, ad esempio, 165,72 cm o 166,01 cm.

 Discreto: Se le modalità sono numeri interi, tipicamente conteggi, come, ad esempio, il numero di figli, il numero di clienti in

coda allo sportello di una banca o il numero di aziende con meno di 20 dipendenti.

Le misurazioni non possono assumere valori frazionari o decimali, ad esempio, il numero di libri in una biblioteca rappresenta

un carattere quantitativo discreto, non puoi avere un numero frazionario di libri, avrai, ad esempio, 10 libri, 11 libri, 12 libri,

ecc.

Per le variabili quantitative si dice che si utilizza:

 Una scala a intervalli: Quando l’origine della scala stessa è arbitraria, ovvero, quando lo zero ha un’interpretazione

convenzionale, non hanno un punto zero significativo, come, ad esempio, la temperatura.

La temperatura Celsius è una scala a intervalli.

La differenza tra 20°C e 30°C è la stessa della differenza tra 30°C e 40°C, ma il valore zero su questa scala (0°C) non indica

l'assenza di temperatura.

 Scala a rapporti: Quando l’origine è naturale e non è arbitraria, come, ad esempio, la lunghezza di un tavolo o il reddito,

hanno uno zero significativo, cioè lo zero indica l’assenza completa della caratteristica misurata.

Ad esempio, la lunghezza, il perso, e il tempo sono misurati su scale di rapporti, quindi, un pero di 0 kg indica l’assenza di

perso, e il rapporto tra 10 kg e 5kg è lo stesso di quello tra 20 kg e 10 kg.

Per comprendere questa classificazione, trasversale alla precedente:

Si pensi ai due esempi e si osservi che, mentre, possiamo dire che un tavolo di 200 cm è lungo il doppio di un tavolo di 100 cm,

viceversa, non possiamo dire che, quando ci sono 30° Celsius, la temperatura è doppia quando ce ne sono 15.

Ad esempio, proprio per la differente origine scelta, l’affermazione sarebbe falsa se usassimo una scala Fahrenheit,

infatti 30° e 15° sulla scala Celsius corrispondono a 86° e 59° sulla scala Fahrenheit.

IMPORTANZA DEI DATI RACCOLTI

MODALITÀ DEL CARATTERE: I diversi modi in cui un carattere si manifesta sulla popolazione.

Le modalità devono essere esaustive e non sovrapposte, con il termine esaustive si intende che le modalità elencate devono

rappresentare tutti i possibili modi di manifestarsi del carattere.

Le modalità si definiscono non sovrapposte se ad ogni unità si può associare una sola modalità, se, invece, le modalità sono due si

parla di variabile dicotomica o binaria, come, ad esempio, maschio o femmina, sano o malato.

Le modalità di un carattere rappresentano i valori che compaiono con maggiore frequenza in un insieme di dati.

In altre parole, una modalità è il valore che si verifica più frequentemente all’interno di un insieme di dati osservati.

CAMPIONE: Il campione è un sotto-insieme della popolazione oggetto della rilevazione, perché spesso accade che le variabili di

interesse non sono rilevate su tutte le unità statistiche.

Solo raramente si rilevano dati sull’intera popolazione.

DATI CAMPIONARI: I dati campionari sono i dati ottenuti dalla rilevazione sul solo campione.

.

Perché si svolgono indagini/rilevazioni campionarie?

Tanti motivi … tanti tempi ragionevolmente più corti, costi sostenibili, maggiore qualità dell’informazione, un maggiore numero di variabili

osservabili, ecc.

Si consideri una macchina che deve forare lastre di metallo. Il diametro nominale dei fori è di 1mm con una tolleranza di 0,06mm.

Un foro è ben fatto se il suo diametro è compreso tra 1 – 0,06 = 0,94mm e 1 + 0,06 = 1,06mm.

I dati sulla qualità di produzione della macchina, potrebbero essere disponibili in forme diverse:

 Buono vs difettoso (Dati dicotomici)

 Troppo piccolo, buono, troppo grande (Dati qualitativi ordinati)

 Lunghezza del diametro (Dati quantitativi continui)

Le differenze possono essere dovute a come i dati vengono registrati, ma anche a come i diametri vengono effettivamente misurati.

Ad esempio, raccogliere dati sui diametri nella forma (B) è più rapido e richiede strumenti meno costosi di quanto richiesto dalla forma

(C)

(Basta osservare se il foro rispetta o meno i limiti di tolleranza, senza necessariamente misurare con esattezza il suo diametro).

.

ESEMPIO

Vogliamo avere un’idea sul numero di clienti e sul volume di vendite dei negozi di una città per tre categorie merceologiche ritenute

simili.

I dati rilevati sono stati riportati nella seguente tabella:

Quali sono le unità statistiche?

Le unita statistiche sono i negozi.

Qual è la popolazione di riferimento? Ed il campione?

La popolazione di riferimento è l’insieme di tutti i negozi delle tre categorie presenti nella città, mentre il campione è costituito dai 20

negozi riportati in tabella.

Di quale tipo

Dettagli
Publisher
A.A. 2024-2025
10 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Anna.Boffo di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Padova o del prof Luconi Stefano.