Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
TTENERE UN CAMPIONE CASUALE SEMPLICE
Un campione di grandezza n è ottenuto attraverso il campionamento casuale semplice da una
popolazione di grandezza N se ogni possibile campione di grandezza n ha una medesima
probabilitù di essere selezionato. Tale campione è detto campione casuale semplice.
Essendo il campione un sottoinsieme della popolazione, il numero di individui inseriti nel campione
sarà sempre inferiore al numero di individui della popolazione.
Da una stessa popolazione posso estrarre, sempre guidato dal caso, diversi tipi di campione. I
modi di estrarre un campione sono diversi.
Le diverse combinazione di campione si possono trovare con tale formula:
N!
n! (N−n)
Tipicamente, si assegna a ogni individuo della popolazione un unico numero compreso tra 1 e N,
dove N è l’ampiezza della popolazione. Successivamente, n numeri casuali sono selezionati da
questo elenco, dove n rappresenta l’ampiezza del campione. Dovendo enumerare gli individui
nella popolazione, avremo necessitò di possedere un elenco di tutti gli individui appartenenti alla
popolazione medesima, che chiameremo lista di campionamento (frame). Una lista di
campionamento è un elenco di tutti gli individui della popolazione.
Quando campioniamo senza reinserimento l’individuo selezionato viene rimosso dalla popolazione
e non può essere più scelto. Contrariamente, nel campionamento con reinserimento gli individui
selezionati vengono reinseriti nella popolazione in modo da poter essere scelti una seconda volta.
Può essere usata una tabella di numeri casuali per selezionare gli individui da inserire nel
campione. Selezioneremo in modo casuale un punto di partenza nella tabella, che prende il nome
di seme (seed), e andremo a selezionare i numeri con una cifra, due cifre, tre cifre e così via a
seconda che i nostri dati abbiano rispettivamente una cifra, due cifre, tre cifre e così via.
Selezioneremo solo i numeri maggiori o uguali a 01 e minori o uguali a N. Ogni volta che
incontreremo 00, un numero maggiore di 30, o un numero già selezionato, lo si salta e si sceglie il
numero successivo.
Si può anche utilizzare un generatore di numeri casuali, un esempio è Excel. Il procedimento per
generare i numeri casuali con Excel è il seguente:
Step 1:Attivare il pacchetto degli Strumenti di analisi. Per farlo, aprite il menu Strumenti e scegliete
Componenti aggiuntivi. Selezionate la casella accanto a Strumenti di analisi e fate clic su
OK.
Step 2:Aprite il menu Strumenti e selezionate Analisi dati. Selezionate Generazione di un numero
casuale e fate clic su OK.
Step 3:Riempite i campi della finestra. Se doveste ottenere dei numeri doppioni, aumentate il
Numero di numeri casuali e scartate il numero doppione. Fate clic su OK; i numeri casuali
appariranno nella colonna 1 del foglio di Excel. Ignorate le cifre decimali.
1.3 A LTRI METODI DI CAMPIONAMENTO
1.3.1 O
TTENERE UN CAMPIONE STRATIFICATO
Un campione stratificato è ottenuto separando la popolazione in gruppi non sovrapposti chiamati
strati e ottenendo in seguito un campione casuale semplice da ogni strato. Gli individui all’interno
di ogni strato dovrebbero essere omogenei rispetto a certe caratteristiche.
Il principale criterio nell’effettuare un campione stratificato consiste nel garantire che ogni gruppo
(strato) abbia un attributo comune, di modo che individui all’interno di ogni strato presentino
caratteristiche simili.
Un vantaggio del campionamento stratificato rispetto a quelo casuale semplice consiste nella
possibilità di ottenere le stesse informazioni, o addirittura informazioni maggiori, facendo un
sondaggio su un numero inferiore di persone.
Inoltre, un campione stratificato garantisce che ogni strato sia rappresentato nel campione.
1.3.2 O
TTENERE UN CAMPIONE SISTEMATICO
Nel campionamento casuale semplice e in quello stratificato è necessario fare una lista degli
individui oggetto di studio nella popolazione. Una tecnica di campionamento che non richiede un
frame è il campionamento sistematico, che può essere considerato un metodo alternativo quando
non è possibile reperire un elenco degli individui appartenenti alla popolazione da studiare.
Si ottiene un campionamento sistematico selezionando ogni k-esimo individuo dalla popolazione. Il
primo individuo selezionato corrisponde a un numero casuale compreso tra 1 e k.
Le fasi del campionamento sistematico sono le seguenti:
1. Approssimare l’ampiezza della popolazione, se possibile.
2. Determinare l’ampiezza desiderata del campione, n.
3. Calcolare N/n e arrodondare all’interno più vicino. Questo è il valore di k, che prende il
nome di passo di campionamento o frazione di campionamento sistematico.
4. Selezionare a caso un numero compreso tra 1 e k. Chiamare questo numero p.
5. Il campione sara composto dai seguenti individui: p, p+k, p+2k, …, p+(n – 1)k
1.3.3 O
TTENERE UN CAMPIONE A GRAPPOLO
Un quarto metodo di campionamento è quello a grappolo (cluster sampling).
Un campione a grappolo è ottenuto selezionando tutti gli individui all’interno di un gruppo (cluster)
individuato casualmente.
Se i cluster sono composti da individui fra loro omogenei, è preferibile aumentare il numero di
cluster, scegliendoli con poche osservazioni. Ogniqualvolta i cluster sono eterogenei, possiamo
selezionarne un numero ridotto contenenti però molti individui.
C AMPIONAMENTO NON PROBABILISTICO
Un campione non probabilistico (o di convenienza) è un campione nel quale gli individui inclusi
nell’indagine sono selezionati in maniera non casuale.
Ci sono diversi tipi di campioni non probabilistici, ma i più popolari sono quelli in cui gli individui nel
campione si auto-selezionano (ovvero decidono autonomamente di partecipare all’indagine).
Questi campioni si chiamano a risposta volontaria.
Gli studi che utilizzano il campionamento non probabilistico generalmente forniscono risultati poco
affidabili che dovrebbero essere osservati con grande scetticismo.
C AMPIONAMENTO MULTISTADIO
Nella pratica, le indagini su ampia scala ottengono i campioni usando una combinazione delle
tecniche presentate sopra.
C ’
ONSIDERAZIONI SULL AMPIEZZA DEL CAMPIONE
In tutti i processi statistici la determinazione dell’ampiezza del campione assume un ruolo chiave.
I ricercatori dovrebbero trovare il corretto equilibrio tra l’affidabilità dei risultati e i costi per
l’ottenimento degli stessi. Più tempo e denaro hanno a disposizione, più accurati saranno i risultati
dell’inferenza statistica.
Esistono, a ogni modo, tecniche per determinare l’ampiezza campionaria richiesta per stimare le
carattristiche della popolazione all’interno di certi margini di errore.
C 2 – O
APITOLO RGANIZZARE E SINTETIZZARE I DATI
2.1 O RGANIZZARE I DATI QUALITATIVI
2.1.1 O
RGANIZZARE I DATI QUALITATIVI IN TABELLE
Una distribuzione di frequenze assolute (n ) elenca tutte le tipologie di modalità riportando, per
i
ciascuna di esse, il corrispondente numero di occorrenze osservate.
Si procede facendo lo spoglio, cioè associando a ciascuna modalità tante linee verticali. La
numerosità delle linee verticali sarà pari al numero delle ripetizioni per ciascuna modalità. L’ultima
operazione è il conteggio delle linee verticali e la loro sostituzione in numeri, che prenderanno il
nome di frequenze. Essi indicano quante volte la singola modalità si è presentata e denotano la
frequenza per ciascuna modalità.
Quando si ha una distribuzione di frequenze assolute, si consiglia di controllare che la somma dei
valori della colonna “Frequenze assolute” corrisponda al numero di osservazioni oggetto di studio.
La sommatoria è data dalla seguente formula:
k
∑ n =N
i
i=1
La frequenza relativa (f) corrisponde alla proporzione (o percentuale) di osservazioni appartenenti
a una determinata categoria rispetto al totale delle osservazioni e si ricava attraverso la seguente
formula: Frequenza assoluta
Frequenza relativa= Somma totale delle frequenze assolute
Se la voglio espressa in percentuale la moltiplico per 100, e prende il nome di frequenza
percentuale (p). Essa può variare da 0 a 100.
Una distribuzione di frequenze relative elenca ciascuna categoria o modalità assieme alla
corrispondente frequenza relativa.
È utile sommare tutte le frequenze relative per assicurarci che il totale sia pari a 1.
2.1.2 C
OSTRUIRE UN GRAFICO A BARRE
Dopo aver correttamente organizzato le informazioni grezze in tabella e aver ottenuto una
distribuzione di frequenze assolute, possiamo procedere con la rappresentazione grafica.
I grafici ci permettono di visualizzare i dati e di comprendere il contributo informativo apportato
dalle unità statistiche in esame.
Uno dei sistemi più comuni per rappresentare graficamente i dati qualitativi è il grafico a barre, con
cui possiamo facilmente presentare sia i dati nominali sia quelli ordinali.
Un grafico a barre verticali (o orizzondali) è costruito indicando ciascuna modalità sull’asse
orizzontale (o in quello verticale) e la corrispondente frequenza assoluta o relativa sull’altro asse.
Per ciascuna modalità disegnando un rettangolo con altezza pari alla frequenza assoluta o relativa
della categoria (modalità) stessa e con ampiezza costante per tutte le barre del grafico.
NB: intestare sempre gli assi; evitare che la scala dell’asse y inizi da un valore diverso da 0 oppure
che le barre abbiano ampiezza diversa, siano di colori differenti o tridimensionali, in quanto
potrebbero rappresentare in modo errato i dati.
Per realizzarlo con Excel è necessario seguire i seguenti passaggi:
Step 1:Inserite la categoria di dati nella colonna A e le corrispondenti frequenze assolute (o
frequenze relative) nella colonna B.
Step 2:Selezionate l’icona per la creazione guidata del grafico. Fate clic sul tipo di grafico
Istogramma; selezionate il tipo di grafico nell’angolo in alto a sinistra e fate clic su Avanti.
Step 3:Fate clic all’interno di Intervallo dati e, utilizzando il mouse, selezionate i dati che devono
essere rappresentati. Fate clic su Avanti.
Step 4:Attivate la scheda Titoli per inserire il titolo del grafico, la denominazione dell’asse delle
categorie (X) e la denominazione dell’asse dei valori (Y).
Step 5:Fate clic su Fine.
G RAFICO A BARRE AFFIANCATE
I grafici possono risultare molto utili per confrontare due insiemi di dati; ciò è possibile attraverso
l’utilizzo di un grafico a barre affiancate.
Per evitare che la comparazione sia influenzata dalla dimenzione della popolazione o dalla
numerosità campionaria, quando si confrontano differenti insiemi d