vuoi
o PayPal
tutte le volte che vuoi
Molto spesso capita di osservare studi nei quali la dimensione del campione non è stata tenuta in
• considerazione nella pianificazione dello studio. Assicurare che il numero delle osservazioni sia sufficiente
è essenziale per ottenere dati precisi e, come vedremo più avanti, per non incorrere, quando si effettuano
studi analitici, in risultati negativi che dipendono proprio dalla non appropriata numerosità del campione.
È intuitivo come la dimensione del campione aumenti man mano che si richieda una precisione maggiore
• della stima. Estremizzando, se il nostro campione fosse uguale a tutta la popolazione la stima sarebbe
perfetta.
Si può applicare un’equazione per calcolare la dimensione del campione data la numerosità della
• popolazione generale e la precisione richiesta. Da ricordare che l’equazione da applicare è diversa secondo
il tipo di campionamento che viene utilizzato. In particolare, con il campionamento tipo cluster sampling è
necessario raccogliere un numero maggiore di osservazioni per ottenere la stessa precisione.
Se l’analisi dei nostri dati verrà eseguita su sottogruppi del campione, sarà bene prendere in esame questa
• eventualità in anticipo. Infatti, per ognuno dei sottogruppi (strati) rimarrà disponibile solo una frazione del
campione con conseguente minor precisione.
È anche buona norma raccogliere informazioni su un numero leggermente superiore a quello pianificato
• per il campione. Può capitare, infatti, che per ragioni impreviste, ad esempio, alcune interviste non
possano essere completate.
Uno degli strumenti utilizzati più di frequente per la raccolta dei dati è il
• questionario. Come abbiamo accennato questo può essere rappresentato dal
classico modulo cartaceo nel quale vengono trascritte le informazioni raccolte.
Quando tali informazioni vengono raccolte attraverso interviste è necessario
• preoccuparsi di evitare ogni azione che possa modificare la comprensione delle
domande da parte dell’intervistato.
In altre parole, è necessario fare in modo che il questionario e chi lo somministra
• funzionino come strumenti standardizzati, in modo da evitare qualsiasi distorsione
dovuta, per esempio, a un tempo non adeguato per l’esecuzione, oppure al
mancato rispetto dell’ordine delle domande del questionario durante l’intervista.
In un questionario raccogliamo una serie di informazioni che vengono sintetizzate in una
• variabile che sarà continua o discreta. In quest’ultimo caso, possiamo prevedere che la persona
intervistata fornisca una risposta “aperta”, oppure scelga tra alcune categorie già previste nel
questionario (risposte “chiuse”).
L’uso di risposte “chiuse” presenta il vantaggio di prevedere in anticipo le categorie utili per
• l’analisi dei dati e di rendere l’analisi dei dati più semplice. In caso di risposte “aperte” sarà
necessario procedere a un raggruppamento delle risposte prima di passare all’analisi dei dati.
Nello spirito di rendere il più comprensibile possibile un questionario, in modo da evitare
• distorsioni nei risultati, è importante utilizzare domande positive ed espresse in un linguaggio
semplice.
È sempre buona norma, inoltre, eseguire un pre-test su persone che non parteciperanno allo
• studio, in modo da verificare l’efficienza di esso.
Va anche prestata attenzione alle risposte “non so”. Talvolta possono essere l’indizio di un
• tempo non adeguato lasciato all’intervistato per rispondere, oppure rappresentare una risposta
a una domanda imbarazzante.
Per descrivere i risultati di uno studio che comprende numerose osservazioni
• (decine, centinaia, migliaia) è impossibile prendere in esame la possibilità di
elencare ogni singola informazione contenuta nel vostro archivio.
Sebbene “prendere confidenza con i dati” e possibilmente avere la possibilità di
• leggerli uno a uno sia una robusta premessa alla corretta interpretazione di essi,
nella maggior parte dei casi si utilizzano delle misure sintetiche che permettono di
descrivere le osservazioni in breve, oppure si usano dei grafici.
L’obiettivo è quello di fornire informazioni rapidamente, e in modo che siano
• facilmente comprensibili.
Questo processo rappresenta, in genere, il primo approccio ai dati acquisiti, dopo
• averne accuratamente controllato la qualità.
Quando si affronta la descrizione di un database si considera un’informazione alla
• volta. Bisogna identificare che tipo di variabile si vuole descrivere, perché le
modalità di approccio analitico sono diverse.
Poi si decide che tipo di misure sintetiche utilizzare e, se necessario, come
• descriverne la distribuzione. Infine, se possibile, si costruiscono dei grafici che
hanno il vantaggio di offrire un’informazione “a colpo d’occhio”.
Il tipo di analisi che possiamo applicare dipende anche dalla variabile che
• consideriamo. Una classificazione dei tipi di variabili che possiamo incontrare è
riportata nella diapositiva.
Mentre le variabili continue prevedono una scala con qualsiasi grado di variazione,
• per le variabili discrete o categoriche siamo in presenza di categorie predefinite.
Per quelle ordinali esiste una gradazione che varia con l’aumentare del suo valore,
per quelle nominali abbiamo categorie che tra loro non hanno alcuna relazione di
dipendenza, mentre per quelle binomiali o dicotomiche possiamo avere solo due
valori: sì/no, presente/assente, ecc.
Per le variabili continue, è importante prima di tutto conoscere la loro distribuzione.
• Graficamente, in un sistema di assi cartesiani nei quali sulle ascisse sono rappresentati i
valori delle osservazioni e sulle ordinate il numero di osservazioni con quello specifico
valore, si possono ottenere forme simili a quelle riportate nella diapositiva.
L’esempio 1 rappresenta una distribuzione normale o gaussiana. I valori sono distribuiti in
• modo simmetrico.
L’esempio 2 rappresenta una distribuzione asimmetrica, nella quale esiste una lunga coda
• di osservazioni verso destra.
L’esempio 3 rappresenta una distribuzione nella quale esistono due picchi, che si può
• definire anche bimodale.
Secondo il tipo di distribuzione osservata, si applicano differenti modi di descrizione che
• utilizzano parametri diversi. L’esame della distribuzione dei valori è essenziale anche per
decidere quale test statistico di associazione è opportuno utilizzare nel confronto tra due
gruppi.