Statistica e analisi dei dati
La ricerca empirica è una successione di operazioni usate per trovare risposte a domande sulla realtà, svolgendo un ruolo importante nella ricerca empirica definita "quantitativa". Le operazioni sono articolate in 4 fasi:
- Progetto
- Raccolta dati
- Analisi
- Esposizione risultati
Costruzione della base empirica
La base empirica è l'insieme delle informazioni da utilizzare per produrre affermazioni o relazioni tra queste, il più delle volte su supporto cartaceo come questionari. Le informazioni utilizzate possono provenire da fonti di due tipi: campagne di rilevazione, e da enti o organismi che forniscono dati in loro possesso, primario o secondario.
Fonti primarie
Le informazioni possono essere raccolte sul campo con un approccio osservativo, dove si rilevano opinioni, atteggiamenti, comportamenti che non si possono manipolare. In un contesto sperimentale, le informazioni vengono prodotte in modo controllato e il ricercatore può manipolarle e controllarne i fattori. Questo è un tipo di ricerca non sperimentale che rileva ciò che pensano o fanno le persone.
Il sondaggio è uno strumento utilizzato: un questionario strutturato con domande chiuse o aperte per creare una base dati da trattare con strumenti statistici e matematici. Può essere postale, telefonica, faccia a faccia, o attraverso somministrazione via elaboratore. Nel questionario, una parte rileva le caratteristiche socio-anagrafiche e un'altra parte contiene le domande ("items") sui contenuti specifici di ricerca.
Esiste un problema di fedeltà del dato minato dalla desiderabilità sociale, soprattutto su argomenti delicati come politica, sesso o reddito. È possibile che l'intervistato si rifiuti di rispondere o non dia risposte veritiere. Un problema tecnico del sondaggio di opinione è la richiesta di esprimere un grado di accordo o disaccordo usando una scala Likert a 5 o 7 posti, o con scale da 0 a 100 (termometro dei sentimenti). Il problema consiste nella tendenza dei soggetti ad usare valori alti o bassi della scala piuttosto che tutto l'intervallo. Poi c'è il response set, dove una serie di risposte sono espresse senza attenzione.
Distinguiamo inoltre tra errore sistemico (la distorsione nella risposta agisce sempre nella stessa direzione in tutte le osservazioni) e errore accidentale (dovuta a cause accidentali). Solitamente il sondaggio non viene condotto sull'intera popolazione, ma su un sottoinsieme definito campione rappresentativo. Ci si deve affidare a criteri statistici per formare campioni rappresentativi da estendere all'intera popolazione.