Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
le persone che si occuperanno della rilevazione. b) personale addetto. A tal proposito
distinguiamo le rilevazioni automatiche, in cui sono le unità statistiche a “recarsi” dall’operatore
(è il caso delle nascite o delle morti) da quelle riflesse in cui i dati sono raccolti da personale
addetto e appositamente addestrato. c) gli strumenti necessari.
A questo punto della formulazione del piano occorrerà, prima di procedere, stabilire i limiti territoriali
-
della rilevazione e quelli temporali. Per quanto riguarda i limiti di tempo, questi possono far riferimento
ad un istante preciso (come avviene nei censimenti per i quali è necessario che tutte le informazioni
forniscano la situazione esistente ad una certa ora di un dato giorno), o a un dato periodo di tempo
(anno, stagione, mese, settimana o altro). La scelta deve essere fatta tenendo conto di numerosi fattori:
in estate sono notevoli gli spostamenti delle famiglie per le ferie e quindi, per certe rilevazioni di
carattere generale, si preferisce fissare l'epoca per la raccolta dei dati in un periodo compreso fra la fine
del mese di aprile e i primi di giugno. Riguardo ai limiti di spazio, la rilevazione può essere fatta su un
territorio più o meno vasto. Ci sono indagini condotte su numerose nazioni contemporaneamente, altre
eseguite a livello regionale, provinciale o comunale. La scelta dipende, come affermato più volte, dagli
obiettivi che si vogliono raggiungere. Limiti di spazio sono anche quelli riferiti a particolari categorie
dell'oggetto dell'indagine; per esempio, volendo esaminare le variazioni relative al numero degli iscritti
nelle scuole italiane nei vari anni, ci si può limitare agli istituti tecnici, oppure alle scuole pubbliche. Tali
statistiche saranno valide limitatamente al territorio per cui sono state fatte; un'indagine nelle scuole
pubbliche del Lazio non sarà valida per le altre regioni italiane a causa dei numerosi fattori, diversi in
ogni regione, che possono influire sull'andamento delle iscrizioni.
Nella predisposizione di un piano di rilevazione occorre porre sempre particolare attenzione alla scelta
-
della ampiezza della rilevazione, ovvero alla scelta della esecuzione di una rilevazione totale o parziale.
Una rilevazione si dice totale se è estesa a tutti gli elementi di una popolazione statistica, mentre
ridefinisce parziale o per campione se è fatta solo su alcuni elementi della popolazione, scelti con criteri
opportuni.
Campionamento
Indubbiamente una rilevazione totale ha il pregio di fornire risultati completi e precisi sul
fenomeno indagato; tuttavia se la popolazione è molto numerosa, comporta costi elevati e tempi
di realizzazione molto lunghi. Nella realtà si ricorre molto spesso a indagini parziali, dette
rilevazioni campionarie, quando occorre contenere i costi (il costo di un'indagine campionaria è
minore di quello di un'indagine totale), quando occorre ottenere più tempestivamente i risultati,
infine, quando non è possibile procedere diversamente (ad esempio gli studi sulla durata dei
prodotti industriali comportano inevitabilmente la distruzione delle unità esaminate).
Le rilevazioni campionarie devono soddisfare l’importante requisito di dare un’immagine
fedele, sebbene ridotta, del fenomeno preso in considerazione.
La statistica moderna fa ampissimo uso del campionamento per la circostanza che la rilevazione
campionaria consente riduzioni in termini di spesa e di tempo impiegato per lo svolgimento
delle analisi, così permettendo di aumentare il numero delle analisi stesse alimentando la
produzione statistica nazionale.
La scelta del campione deve essere fatta in modo che esso sia rappresentativo, ovvero che sia
estratto con un criterio oggettivo e possegga le stesse caratteristiche della popolazione da
esaminare. Quando invece la rilevazione tende ad escludere quelle unità che presentano il
carattere con intensità inferiore a determinati limiti o entro limiti determinati si parla di
campioni non rappresentativi. Ad esempio, se un lotto di 2000 pezzi fosse formato da 300 pezzi
difettosi e da 1700 pezzi non difettosi, un campione ideale di 100 pezzi dovrebbe contenere 15
pezzi difettosi e 85 pezzi non difettosi, ma difficilmente un campione estratto da quel lotto ha
questa composizione. Altro elemento fondamentale per una rilevazione campionaria è che il 3
campione sia sufficientemente ampio, infatti più il campione è numeroso, più i risultati che
fornisce sono significativi.
Le metodologie di campionamento sono raggruppabili in due grandi classi:
a) campionamento casuale, in cui ciascuna unità della popolazione ha la stessa probabilità di essere
estratta
b) campionamento mediante scelta ragionata. In questo caso le unità sono scelte con metodi non del
tutto casuali e pertanto non hanno la stessa probabilità di essere inserite nel campione
Rilevazione dei dati
La raccolta dei dati si può distinguere:
riguardo al modo, in automatica se sono gli stessi interessati che forniscono spontaneamente, spesso
- in virtù di precise disposizioni di legge, le informazioni sui fenomeni che li riguardano (è quanto accade
giornalmente negli uffici anagrafici dove sono denunciate le nascite, le morti, i trasferimenti), o riflessa
se è fatta direttamente da organi preposti a tale scopo, come avviene per esempio nei censimenti e
nelle ricerche di mercato.
Riguardo alla durata, in: continue, se sono fatte senza interruzione (ad esempio, rilevazione
- anagrafiche dei nati, dei morti, dei matrimoni), periodiche, se sono fatte ad intervalli regolari di tempo
(come i censimenti con periodicità decennale, le rilevazioni delle forze di lavoro con periodicità
trimestrale) o occasionali, se sono fatte una volta tanto per indagini su fenomeni particolari (ad
esempio, le rilevazioni dei danni di un terremoto, le indagini di mercato per il lancio di un prodotto).
Anche i fenomeni sono distinguibili in: fenomeni di stato se riferiti ad istanti di tempo ( ad
esempio la popolazione) e di flusso se occorre analizzarli per intervalli di tempo ( come le nascite,
le migrazioni o le morti ).
Spoglio dei dati
Una volta effettuata la rilevazione delle unità statistiche si può procedere alla formazione dei
dati statistici, attraverso l’operazione di spoglio delle unità stesse.
Lo spoglio è la prima fase del processo di elaborazione dei dati statistici e consiste nell’enumerazione.
- Attraverso l’enumerazione le schede, i moduli, i questionari sono contati e, nello stesso tempo,
controllati, al fine di fornire i primi dati sull’estensione della rilevazione.
Successivamente si procede alla classificazione, ovvero nel raggruppamento dei dati ottenuti in
- categorie, classi, a seconda delle intensità o delle qualità dei caratteri rilevati. Ad esempio, in
un'indagine relativa ad un certo istituto tecnico potranno in un primo momento formarsi classi diverse
comprendenti gli alunni del triennio e quelli del biennio; si potranno ancora distinguere altre due
categorie: maschi e femmine e così via.
Infine si effettua lo spoglio materiale, riportando i dati, già enumerati e classificati, in prospetti
- chiamati tabelle di spoglio.
Correzione degli errori
Prima di concludere la fase di spoglio e passare alla fase di vera e propria analisi occorre
depurare i dati da eventuali errori.
(tipi di errori…) Va precisato che per errori non si intendono soltanto eventuali errori materiali
che possono essere stati compiuti nella fase di rilevazione; affette da errori sono quelle
rilevazioni riferite a fenomeni perturbati da cause varie quali imperfezioni nei questionari o
degli strumenti, omissioni del soggetto che effettua la rilevazione o del soggetto cui la 4
rilevazione si riferisce, o ancora, in fase di spoglio dei dati, possono essere dovute ad una
erronea interpretazione di talune risposte o dati, ad errori di trascrizione o di arrotondamento
dei valori.
Gli errori possono poi essere accidentali, costanti, sistematici o di distribuzione a seconda che siano
legati a cause fortuite ed occasionali (come nel caso di errori di misura o di stima), che si
ripetano con la stessa intensità in tutte le osservazioni, che agiscano secondo particolari leggi o
che infine alterino la valutazione dell’esatta distribuzione di un fenomeno.
(…e loro correzione). La correzione a posteriori degli errori di rilevazione può essere effettuata
utilizzando diverse metodologie.
In linea generale si cerca di predisporre la rilevazione in maniera quanto più precisa possibile al
fine di evitare il presentarsi di errori di qualunque genere
Elaborazione
Questa fase comprende tutte le possibili analisi statistiche utili per lo studio del fenomeno
considerato, attraverso la applicazione di particolari procedimenti matematici che hanno la
funzione di trasformare i dati raccolti, considerati grezzi, in dati elaborati che mettono in evidenza
le caratteristiche del fenomeno collettivo da studiare.
Interpretazione
Interpretare i dati significa esaminarli al fine di verificare se l’obiettivo prefissato è stato
raggiunto, se esistono relazioni con altri fenomeni, se è possibile fare una previsione sulla
tendenza del fenomeno nel tempo.
2. SERIE STATISTICHE
Definizione
Una serie statistica è un insieme di dati posti consecutivamente l’uno all’altro rappresen tanti
ognuno un dato, cioè l’entità del carattere così come osservata sulla singola unità statistica.
Esempio Serie statistica del carattere “numero di componenti della famiglia”, riferito ai pazienti
afferenti ad un medico di medicina generale:
3 2 4 3 3 5 3 6 … 3 … 2
Rappresentazione di una serie statistica
una serie statistica si indica simbolicamente nel modo seguente
x i 1,2,...,N
i
dove l’indice i serve ad individuare, nella serie dei dati, quello specifico dato che occupa la
posizione i indicata.
… …
x 3 x 2 x 4 x 3 x 3 x 5 x 3 x 6 x 3 x 2
1 2 3 4 5 6 7 8 i N
Una serie può essere rappresentata orizzontalmente o verticalmente 5
spesso può aversi interesse ad ordinare i dati in ordine non decrescente. Si origina in tal modo
una Serie non decrescente che si rappresenta con l’indice racchiuso fra parentesi:
x x ... x ... x
(1) (2) (i) ( N )
Dove l’indice (i) sta ad indicare il dato che occupa la i-esima posizione di ordine e dove la
presenza del segno uguale sta ad indicare che tutti i dati con lo stesso valore vanno considerati e
non presi una sola volta. La serie non decrescente sarà allora indicata come segue:
,
x i 1,2,...,N
i
nel nostro esempio:
… …
x 2 x 2 x 3 x 3 x 3 x 4 x 4 x 5 x 7 x 8