Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
INTRODUZIONE ALLA STATISTICA
• Disciplina costituita da un insieme di metodi scientifici e strumenti volti a raccogliere,
rappresentare, sintetizzare e analizzare fenomeni collettivi o di massa, scoprire leggi e relazioni tra
gli stessi, con il fine ultimo di sodisfare l’esigenza sempre sentita dall’uomo di razionalizzare le
proprie conoscenze in ogni campo del sapere.
STATISTICA METODOLOGICA: costituisce la parte teorica, nasce dall’esigenza di utilizzare strumenti
comuni per analizzare fenomeni di diversa tipologia. Essa si fonda su metodi matematici e strumenti propri
per l’analisi dei dati relativi a fenomeni collettivi. Si avvale dell’apporto di altre discipline (matematica,
calcolo delle probabilità, ecc.) ed elabora metodi idonei ad esprimere un giudizio quantitativo su certi
aspetti di tali fenomeni
STATISTICA DESCRITTIVA: mira all'organizzazione, all'analisi tabellare e grafica per comprendere l’esito
della rivelazione. Insieme di metodi e tecniche per sintetizzare l’informazione contenuta nei dati. Gli
strumenti di sintesi sono essenzialmente di 3 tipi: tabelle, rappresentazioni grafiche, indici sintetici.
Attenzione
Quando sintetizziamo l'informazione contenuta nei dati, ne perdiamo una parte
Gli strumenti di sintesi devono essere scelti in modo tale da:
• preservare, per quanto possibile, l'informazione rilevante per il problema analizzato
• eliminare l'informazione non necessaria
LE FASI DI UNA RICERCA STATISTICA:
1. Definizione del fenomeno in base agli obiettivi della ricerca
2. Individuazione del collettivo in cui il fenomeno si verifica
3. Scelta delle caratteristiche del collettivo che interessano la ricerca
LE RILEVAZIONI
La rilevazione dei dati consiste nella annotazione sistematica, precisa e impersonale della modalità delle
variabili riscontrate sull'unità.
Le rilevazioni possono essere:
• TOTALI o CENSIMENTI: riguarda tutti gli elementi o unità di una popolazione rispetto alle variabili
di interesse (POPOLAZIONE)
• PARZIALI: la rilevazione è estesa solo ad una parte di popolazione scelta in base ad opportuni criteri
(CAMPIONE).
La riduzione delle unità, propria del METODO CAMPIONARIO, è valida solo se permette il raggiungimento di
risultati molto prossimi di quelli ottenibili con la TOTALE.
PERCHÈ IL CAMPIONE?
La rilevazione totale non è sempre praticabile perché:
• Ha un costo eccessivo o richiede grandi organizzazioni
• Richiede troppo tempo
• È superflua, rischiosa (Esempio: vaccino), distruttiva, lenta
LE FASI DI UN’INDAGINE STATISTICA
riguarda la definizione del problema da analizzare in tutti i suoi aspetti.
1. Piano di rilevazione:
Fase preparatoria e preliminare alle fasi successive.
Successivamente bisogna definire:
campo di indagine
a. metodo di rilevazione: diretta (totale o parziale) – indiretta – sperimentale
b. periodo di rilevazione (cioè quando effettuare la raccolta)
c. personale e organizzazione necessaria
d. tempi e costi di rilevazione e di elaborazione
e. diffusione dei risultati (pubblicazioni, convegni...)
f.
2. Raccolta dei dati: consiste nell'acquisizione della documentazione statistica di partenza, secondo le
modalità definite nella fase preparatoria, con tutte le informazioni relative a tutte le unità
statistiche considerate e quindi rappresenta la base di partenza per la formazione dei dati statistici
necessari alle successive analisi.
3. Classificazione: riguarda la trasformazione dei dati grezzi in forma statisticamente trattabile.
4. Spoglio dei dati: è l’insieme delle operazioni che hanno lo scopo di fare le prime aggregazioni delle
informazioni raccolte sulle singole unità.
Lo spoglio che può essere di due tipi:
a. Spoglio manuale che è la forma più elementare (si fa nelle sezioni elettorali per
determinare i voti ricevuti da ogni lista e/o candidato)
b. Spoglio con mezzi informatici (che consente una più alta velocità e una maggiore
precisione)
5. Elaborazione dei dati: riguarda tutte le possibili elaborazioni che possono essere effettuate a
partire dal file dei dati creato nella fase precedente. In questa fase si applicano i procedimenti
propri della metodologia statistica.
6. Interpretazione dei risultati: riguarda l’analisi dei risultati ottenuti e l’isolamento dei risultati
significativi emersi dalle analisi effettuate.
NOMENCLATURA STATISTICA
• UNITÀ STATISTICA: è il soggetto elementare su cui vengono osservati i caratteri oggetto di studio
(una persona fisica, un oggetto, un’azienda...)
• COLLETTIVO STATISTICO O POPOLAZIONE: è un insieme di unità statistiche omogenee rispetto ad
una o più caratteristiche. La popolazione non concerne necessariamente esseri viventi (umani o
animali) ma può concernere qualsiasi insieme di elementi, reale o teorico, che appartiene al
presente o al futuro.
• CARATTERE STATISTICO: è l'aspetto che si intende studiare nel dato. Può essere una distanza, una
numerosità, una forma, un grado, una composizione di caratteristiche da trattare in modo
aggregato.
Classificazione dei caratteri statistici
Le modalità di un carattere possono essere:
1. QUANTITATIVE ossia espresse da numeri, ad esempio, l'età in anni compiuti, il reddito in euro, la
temperatura in gradi centigradi ..., in tal caso il carattere si dice quantitativo o variabile.
Carattere Quantitativo = Variabile
I caratteri quantitativi vengono distinti in:
• DISCRETI se sono in numero finito o al più un'infinità numerabile
Esempio: il numero di figli, numero di pezzi prodotti, voto ad un esame.
• CONTINUI se l'insieme delle modalità può essere messo in corrispondenza biunivoca con un
sottoinsieme di numeri reali,
Esempio: il peso, l'altezza.
2. QUALITATIVE ossia espresse da termini nominali, categorie, attributi, numeri convenzionali ad
esempio il sesso, le professioni in libero professionista, dirigente, impiegato, artigiano, i colori, i
mesi ... in questo caso il carattere si dice qualitativo o mutabile.
Carattere Qualitativo = Mutabile
Classificazione delle mutabili
Un carattere qualitativo viene distinto in:
• CARATTERE SCONNESSO (o con scala nominale) se date due sue modalità è possibile affermare
solo se sono uguali o diverse;
Esempi di caratteri sconnessi sono: sesso, stato civile, religione, razza.
Tra le modalità di ciascuno di questi caratteri non è possibile stabilire un ordinamento e quindi le
modalità possono essere elencate in modo del tutto arbitrario.
• CARATTERE ORDINATO (o con scala ordinale) se date due modalità è possibile solo dare un ordine,
specificando che una precede l'altra;
esempio: grado di soddisfazione (poco, abbastanza, molto), titolo di studio (senza titolo, licenza
elementare, licenza media, diploma, laurea, dottorato).
I caratteri ordinati si dicono:
1. RETTILINEI: se possiedono una modalità iniziale ed una finale
Esempio: titolo di studio
2. CICLICI: se non hanno vere e proprie modalità iniziali e finali ma vengono spesso fissate in modo
convenzionale
Esempio: la direzione del vento o le stagioni (si nota che le modalità estreme sono in realtà molto
prossime tra loro).
Un carattere viene detto se ha senso immaginare che un’unità statistica possa cedere tutto o
TRASFERIBILE
parte del carattere posseduto ad un’altra unità statistica
Quantitativo Qualitativo
Discreto Sconnesso (scala nominale)
Continuo Ordinato (scala ordinale)
Trasferibile Rettilineo
Non Trasferibile Ciclico
Caratteri dicotomici
I caratteri dicotomici detti anche variabili logiche, dummy, variabili indicatrici binarie, hanno solo due
modalità: maschi e femmine, vivi o morti, ecc.
Le unità statistiche sono classificate in base alla classificazione per dicotomia: presenza /assenza di un dato
attributo. Alle modalità "presenza" si attribuisce, convenzionalmente, valore a e alle modalità "assenza"
valore b, con a e b simboli qualsiasi (ad Esempio: 0 e 1).
SUDDIVISIONE IN CLASSI DI UN CARATTERE QUANTITATIVO
Si definisce suddivisione del carattere in classi l’operazione consistente nel suddividere l’insieme di
possibili valori in intervalli tra loro disgiunti.
Questa operazione consente di ottenere un’immagine sintetica della distribuzione osservata, anche se a
prezzo di una certa perdita di informazione.
Le classi possono avere uguale o diversa ampiezza; per ampiezza si intende la differenza tra estremo
superiore ed estremo inferiore.
È opportuno definire le classi in modo tale che:
1. Il loro numero sia abbastanza piccolo da fornire una sintesi adeguata ma sufficientemente grande
da mantenere l’informazione con un livello accettabile di dettaglio;
2. Siano tra loro disgiunte;
3. Comprendano tutte le possibili modalità del carattere;
4. Abbiano, se possibile, la stessa ampiezza.
Nello stabilire gli estremi della classe occorre tener presente che ognuna delle determinazioni del
carattere deve essere compresa in una ed una sola classe.
Per considerare sia il limite inferiore che il limite superiore appartenenti alla stessa classe, è necessario
utilizzare un apposito simbolo di separazione, un trattino orizzontale chiuso ad entrambi i lati mediante due
rette verticali.
• 0|--|4 da zero a quattro incluso
• 4 --|6 da quattro (escluso) a sei (incluso)
• 7|-- 8 da sette (incluso) a 8 (escluso)
La chiusura soltanto a destra indica la presenza di un intervallo chiuso con un estremo superiore incluso
nella classe. La chiusura soltanto a sinistra, invece, indica un intervallo chiuso con l'estremo inferiore
incluso nella classe.
• un numero troppo basso di classi, raggruppando eccessivamente i dati, determina una perdita di
informazione sulle caratteristiche della distribuzione e la rende non significativa;
• un numero troppo elevato di classi disperde i valori e non rende manifesta la forma della
distribuzione.
Dalle Distribuzioni Unitarie Alle Distribuzioni Di Frequenza
• Si definisce DISTRIBUZIONE UNITARIA SEMPLICE quando l’elencazione delle modalità osservate,
unità per unità, nel collettivo preso in esame.
• Si parla di DISTRIBUZIONE UNITARIA MULTIPLA quando tale elencazione si riferisce a più di un
carattere.
La distribuzione unitaria pur riportando per ogni unità i valori dei caratteri presi in esame, non consente di
cogliere in maniera sintetica le caratteristiche del fenomeno. Ovviamente tale operazione diventa
impraticabile quando si considerano collettivi con numerosità elevata.
Per ottenere una maggiore sintesi è possibile con