Statistica
Introduzione alla statistica
Siamo nel decennio del big data e in Italia possiamo sfruttare l'Istat, l'istituto italiano di ricerca statistica che mette a disposizione numerose banche dati.
Parametro = sintesi numerica della popolazione vs statistica = sintesi numerica di un campione. Una percentuale è un parametro ed è il primo criterio statistico. Si parla di parametro quando si usa una misura nell'ambito della popolazione. Un'altra misura è il campione, porzione di popolazione selezionata in base a certi criteri, e una misura del campione è una statistica.
Definizione di statistica
La statistica è la scienza che permette di raccogliere, organizzare, sintetizzare e analizzare le informazioni al fine di pervenire a una o più conclusioni. In altri termini, la statistica fornisce risposte a specifiche domande di ricerca. La statistica fornisce, inoltre, una misura di probabilità associata a ogni conclusione raggiunta.
L'oggetto di riferimento della statistica è un collettivo, un insieme statistico di persone definito popolazione statistica. I fenomeni d'interesse della statistica sono quelli collettivi. Un campione è una riproduzione sottodimensionata delle stesse caratteristiche di una popolazione.
Variabili e misurazione
La statistica rileva informazioni sotto forma di aspetti o caratteri che vengono definiti variabili. Le variabili portano informazioni pertinenti rispetto a ciascun soggetto o unità statistica. Ogni variabile si presenta in diverso modo o modalità e questo dipende dal tipo di variabili. Per esempio, una suddivisione possibile è quella tra variabili quantitative (numeri) o qualitative (aggettivi). A volte con il termine "variabili" si indicano solo quelle quantitative e con il termine "mutabili" quelle qualitative.
Le variabili qualitative si suddividono in sconnesse (non ordinabili) o cicliche (ordinabili, come i giorni della settimana). Le variabili quantitative possono essere divise in discrete e continue. Le variabili quantitative discrete fanno riferimento alle modalità rilevate senza virgola (da numeri interi). Le variabili quantitative continue, invece, sono espresse da modalità con la virgola. Classi di aggettivi e numeri sono le modalità possibili.
Dai caratteri alle scale di misura
I caratteri si misurano con scale di misura. I diversi fenomeni hanno diverse scale di misurazione. Le scale di misura in statistica sono di quattro tipi in ordine di complessità. Il tipo di scala di misura influenza rappresentazione e calcolo dei dati.
- Scala nominale (per variabili qualitative): scala di misura a elenco o lista in cui non esiste una gerarchia o un ordine tra le modalità. Sono dette scale nominali dicotomiche quelle in cui le modalità accettate sono solo due (esempio: si-no, maschio o femmina).
- Scala ordinale (per variabili qualitative): scala di misura a elenco o lista in cui è identificabile una gerarchia o un ordine tra le diverse modalità.
- Scala a intervalli (per variabili quantitative): scala che misura modalità il cui intervallo non comincia con lo zero (esempio termometro). Questo è dato dal fatto che lo zero può non essere universalmente condiviso. Non avendo un punto zero condiviso, non è possibile calcolare il prodotto delle modalità ma solo la differenza tra diverse modalità osservando lo scarto tra esse. *Con "intervallo" qui non si intende l'intervallo numerico. Un’identità come 0-100 è una "classe".
- Scala di rapporti (per variabili quantitative): scala di misura che valuta modalità che hanno lo zero universalmente condiviso come punto di partenza. Lo zero qui indica assenza della modalità e non si può avere modalità negative.
Il numero di modalità presentate viene indicato dalla frequenza. Le frequenze possono subire rappresentazione tabellare o grafica. La statistica è caratterizzata dalla sintesi. Per creare rappresentazioni sintetiche ci si avvale di strumenti e il più semplice è proprio la frequenza. La distribuzione di frequenza è l'associazione tra l'insieme delle modalità e il numero di volte in cui esse si presentano (ovvero la loro frequenza).
Popolazione, campione e tecniche di campionamento
Popolazione: insieme di individui potenzialmente o effettivamente influenzati da un fenomeno. A causa della necessità di avere rapidamente e a costi contenuti dei dati statistici esaurienti, si attua una semplificazione a campione. Il campione non è necessario solamente nei casi in cui si analizzano fenomeni di nicchia. Il campione è la selezione di una popolazione con lo scopo di riprodurre in piccolo la stessa popolazione di riferimento. Il problema dei campioni, però, è che essi devono essere rappresentativi. Il campione è rappresentativo se sintetizza la popolazione di riferimento.
La selezione dei gruppi o degli individui che formano il campione deve essere attenta e accurata, altrimenti all'opinione pubblica vengono forniti dati errati. Per esempio, i sondaggi via web soffrono della presenza di campioni auto-selezionati che non hanno nulla a che vedere con i campioni probabilistici. I campioni non-probabilistici non rispettano il principio di rappresentatività rispetto alla popolazione.
Un campione di comodo è quello che viene costruito in modo non-casuale. A differenza del campione probabilistico, esso è costruito secondo criteri prestabiliti e dunque i risultati non sono estendibili alla popolazione, quindi non sono statisticamente rappresentativi. I risultati ottenuti con questo tipo di campionamento, perciò, non sono affidabili.
N.B. il termine "casuale" è sinonimo di probabilistico, non di esente da una regola/metodologia di selezione. I campioni possono essere articolati in modo complesso, anche sommando diversi metodi di campionamento probabilistico. La casualità nella formazione del campione dipende prima di tutto dalla numerosità della popolazione di riferimento (N). Solitamente la grandezza del campione (n) è intorno al 10/20% della popolazione. Questa indicazione è generale e subisce variazioni in base a diversi fattori. Fondamentale da tenere in considerazione è anche il grado di errore che si può avere: esso è tanto più grande quanto il campione è ristretto rispetto alla popolazione (diminuisce alla crescita del campione perché esso si avvicina alla numerosità della popolazione). Un campionamento non-casuale (quindi “a casaccio”) avviene quando non si prende in considerazione la totalità dell
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto esame Statistica, prof. Di Battista
-
Esame statistica riassunto
-
Statistica sociale - Riassunto esame
-
Riassunto esame Statistica, prof. Laureti