Introduzione alla statistica
La statistica è la scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misura e di descrizione quantitativa. La statistica è un metodo di studio di caratteri variabili rilevabili su collettività, avente lo scopo di sintetizzare le informazioni disponibili ed estendere induttivamente i risultati a casi più generali.
Psicometria e ricerca empirica
La psicometria è l'insieme di strumenti e procedure finalizzati alle misurazioni di proprietà mentali e alla valutazione della bontà di tali misurazioni in modo da rilevare, descrivere e mettere in relazione fenomeni di interesse per la psicologia. La statistica, e, di conseguenza, la psicometria, si basano sulla ricerca empirica, la quale, per mezzo di procedure ben strutturate, produce affermazioni sulla realtà in termini di asserti o nessi fra asserti. Il linguaggio principale della ricerca empirica è quello matematico (lettere dell'alfabeto latino usate per indicare quantità osservate; lettere dell'alfabeto greco utilizzate per indicare incognite; tutti i simboli matematici).
Al fine di produrre una statistica ben elaborata e corretta sotto tutti i punti di vista, è necessaria una strutturazione dettagliata della ricerca empirica. Dopo aver eseguito un preciso disegno della ricerca, bisogna procedere con la costruzione della base empirica. Per elaborare una richiesta di indagine che sia strettamente finalizzata ad un'analisi dei risultati senza equivoci e margini di errore non calcolabili, è necessario costruire una corretta definizione operativa, ovvero l'insieme di regole che il ricercatore deve esplicitare al fine di assegnare dei codici che identifichino le proprietà da analizzare con un preciso e corretto linguaggio matematico, in modo da rendere direttamente osservabili anche degli oggetti astratti.
Definizione operativa e matrice C · V
La definizione operativa filtra le richieste della base empirica e produce un insieme di casi e variabili che, una volta disposti in una matrice nell'organizzazione dei dati, devono permettere la corretta partizione (regole per la partizione di un insieme) in diverse classi di equivalenza prevedibili e analizzabili. La matrice suddivide casi e variabili rispettivamente in righe e colonne, in ogni cella è presente un dato osservabile e classificabile; questo è chiamata matrice C · V. Può essere in forma compressa (nelle righe i casi, nelle colonne le variabili e nelle celle i dati); in forma estesa o dummy (nelle righe i casi, nelle colonne le classi di equivalenza e nelle celle i valori di verità) e in forma ridotta (variabili continue in forma compressa e variabili categoriali in forma estesa). Esistono diversi tipi di matrice a seconda del numero di vie e di modi presenti nell'organizzazione dei dati.
- Unconditional: consente confronti tra le celle sia per riga che per colonna.
- Column conditional: consente confronti tra le celle entro la colonna.
- Row conditional: consente confronti tra le celle entro la riga.
Scale di misura
In particolare, le scale Likert presentano in genere 5 o 7 modalità di risposta che esprimono gradi di accordo con una certa affermazione (importanza del "non so" per l'esaustività); le scale auto ancoranti presentano etichette verbali soltanto per le due modalità estreme; il differenziale semantico è un tipo di scala proposto da Osgood, che chiede all'intervistato di collocare un concetto su una scala a sette o undici posti cui estremi sono etichettati con due aggettivi opposti.
La definizione operativa, dunque, è l'operativizzazione di un concetto in una scala di misura che comporta una codifica al fine di stabilire relazioni concrete fra gli elementi di un sistema empirico e quelli di un sistema numerico. Le condizioni necessarie per rappresentare un SE attraverso un SN sono studiate nella teoria della misurazione. Una corretta codifica deve rispettare le condizioni di rappresentazione, unicità e significatività. Ogni trasformazione antecedente o consequenziale alla traduzione dei dati nel nuovo SN, deve rispettare rigorosamente le relazioni presenti fra i dati del SE, in modo da non alterare in nessuna occasione l'analisi della matrice e rendere l'esposizione dei risultati il più fedele possibile alla realtà presa in considerazione nel disegno empirico.
Di conseguenza, esistono vari livelli di scala: ognuno è organizzato con un tipo di ordine strutturale ben preciso e ognuno presenta dei tipi di possibili trasformazioni consentite. Le scala degli intervalli, quella dei rapporti e quella assoluta fanno parte di un unico tipo di scala chiamata scala cardinale. In alcuni casi, le variabili dicotomiche sono assimilabili a variabili cardinali, in quanto, riferendosi ad una logica fuzzy, i valori 0 e 1 possono anche essere intesi come estremi di un continuum.
Statistica
Se "y" è il vettore dei valori che gli elementi assumono rispetto ad una proporzione, "f(y)" è la statistica di tale proporzione e "t(y)" rappresenta una trasformazione ammissibile per i valori considerati. Di conseguenza, "f[t(y)]" rappresenta la statistica sulla variabile trasformata e "t[f(y)]" la trasformazione della statistica. Se la trasformazione della statistica equivale alla statistica, allora si ha invarianza assoluta; se la statistica sulla variabile trasformata coincide con la trasformazione della statistica, allora si ha equivarianza.
Tuttavia, una statistica si dice idonea se è almeno ortovariante (f[t(y)] = g[f(y),t]) rispetto alla classe delle trasformazioni ammissibili della variabile considerata, ovvero, se è possibile variare almeno in parte la composizione matematica della variabile senza subire alterazioni. Ci sono diversi tipi di statistica, a seconda della sua funzione e del numero di variabili in essa contenute. La statistica di descrizione è finalizzata alla sintesi delle informazioni, la statistica di spiegazione allo studio delle relazioni di dipendenza manifeste e la statistica di interpretazione allo studio delle relazioni latenti; la statistica monovariata analizza una sola variabile, quella bivariata due e quella multivariata tre o più.
Statistica descrittiva monovariata
Questo tipo di statistica si limita a sintetizzare le informazioni contenute in una sola variabile. Dalle matrici C · V, nella statistica possono essere attuate sintesi chiamate distribuzioni semplici di frequenza, che consistono nella costruzione di tabelle di contingenza contenenti le modalità di ogni variabile e le frequenze associate.
ₖL'analisi descrittiva delle modalità può avvenire mediante frequenze assolute (n è il numero di volte in cui compare la modalità della variabile nel collettivo), frequenzeₖ ₖ ₖrelative (f è n diviso per l'ampiezza del collettivo N) e frequenze percentuali (qₖ è f moltiplicato per 100). Nelle serie ordinate e seriazione, è possibile calcolare le frequenze cumulate e retrocumulate. Infatti, dato che in questo tipo di casi le variabili sono ordinali o cardinali, esiste sempre una frequenza che rappresenta quante volte una variabile si verifica al massimo o al minimo delle possibilità.
(Variabili categoriali: serie sconnessa – rappresentazioni grafiche possibili: diagramma a torta o a barre; variabili ordinali: serie ordinata – rappresentazioni grafiche possibili: istogramma e rappresentazione spezzata o a gradini per le frequenze cumulate; variabili cardinali: serie seriazione – rappresentazioni grafiche possibili: istogramma e rappresentazione spezzata o a gradini, con frequenza rappresentata dall'area del rettangolo analizzato).
Al fine di produrre un'analisi descrittiva quanto più dettagliata e precisa possibile, è necessario utilizzare gli operatori monovariati, ognuno dei quali:
- Si riferisce ad una sola variabile;
- È costituito da un unico scalare;
- È insensibile all'ordine di registrazione dei dati;
- È strettamente appropriato al livello di scala della variabile analizzata.
Gli operatori che meglio rappresentano la distribuzione nella sua interezza sono gli operatori di tendenza centrale:
- La moda indica la modalità della variabile che si presenta con la frequenza più elevata. Può essere calcolata in tutti i livelli di scala.
- La mediana indica la modalità a cui appartiene il caso mediano, ovvero il caso che divide esattamente in due la distribuzione. Può essere calcolata dalle scale ordinali.
N : 2⁻ Se N è un numero pari, allora C = ; C = (N : 2) + 1casi mdn1 mdn2⁻ Se N è un numero dispari, allora C = (N +1) : 2casi mdn.
- I quantili sono degli indici di posizione simili alla mediana, i quali indicano la modalità a cui appartiene il caso quartile, decile, centile… Possono essere calcolati a partire dalle scale ordinali.
- La media aritmetica indica il numero che rappresenta il centro aritmetico di una variabile. È calcolabile solo per i livelli di scala di tipo cardinale.
N∑x X́ = (1 : N) ∙ iX=1 x́∑ (X – ) = 0(con i che va da 1 a N) ik∑x x ∙ f́ = (media ponderata)k kk=1
Tuttavia, gli operatori di tendenza centrale forniscono delle informazioni poco efficaci nel descrivere le relazioni esistenti fra i casi di ogni variabile. La loro centr
-
Appunti di neuroscienze utilissimi per studiare e per superare l'esame!
-
Appunti di psicologia generale utilissimi per studiare e per superare l'esame!
-
Appunti di psicologia fisiologica utilissimi per studiare e superare l'esame
-
Appunti di psicologia sociale ottimi per studiare e per superare l'esame