vuoi
o PayPal
tutte le volte che vuoi
Statistica
Cos'è la statistica sociale?
La scienza che studia i fenomeni collettivi (sociali) che manifestano variabilità (cambiano)
Collettivo/popolazione: insieme composto da diversi elementi che fanno da target di riferimento per uno studio
Campione: una parte della popolazione
Qual è l'intento?
Descrivere, comprendere la variabilità (perché e come cambiano) e prevedere i fenomeni sociali in una prospettiva censuaria o campionaria
Come si studia statisticamente un fenomeno sociale?
Le fasi da seguire sono:
- studio delle fonti di letteratura scientifica (definizione ipotesi)
- definizione obiettivi
- Definizione disegno di ricerca
- Acquisizione dati
- Elaborazione metodologica (la metodologia può essere campionaria, sperimentale…)
- Discussione, presentazione e utilizzazione risultati
Abbiamo due ambiti della statistica:
- Descrittiva: descrive il collettivo di riferimento (una parte della popolazione)
- Inferenziale: si usano le informazioni rilevate su un campione per riferirle alla popolazione (dal particolare al generale)
(Cross sectional study: gruppi di ragazzi esaminati per analizzare un fenomeno)
OPERAZIONI:
Somma: =2+3 Sottrazione: =3-2 Divisione: =2/3 Moltiplicazione: =2*3 Potenza: =2^2 Radice quadrata: = rad q (16)
Si misurano sia fenomeni quantitativi che qualitativi
Variabile: espressione di misura di un concetto Il concetto viene rappresentato attraverso la misurazione
Misura: corrispondente di un fenomeno
Applicare una misura significa generare una variabile
Modalità del carattere: come si presenta ciascuna variabile ( ciascuna etichetta)
Misurare: attribuire codici (qualità o quantità) ed etichette
Variabili: vengono indicate con le lettere maiuscole (X,Y,Z)
Modalità delle variabili: indicate con le lettere minuscole (x1,x2....xk)
Bisogna esprimere un concetto attraverso tutte le possibili articolazioni (esempio: un elenco di aggettivi da cui il soggetto non si sente rappresentato ma si sente forzato a fornire una risposta oppure non ne dà affatto)
Scale per variabili qualitative:
- Scala di misura nominale: categorie sconnesse e non ordinabili, si può dire se c’è uguaglianza o differenza. Per rappresentare queste variabili si ricorre al diagramma a torta
- Scala di misura ordinale: variabili ordinabili, si può dire se c’è uguaglianza, differenza e uno maggiore o uno minore. Per rappresentarla si ricorre al diagramma a barre
Scale per variabili quantitative:
- Per rapporto: ha uno 0 assoluto, zero significa 0
- Per intervalli: livello 0 convenzionale, non uno zero assoluto
0 assoluto: indica che una proprietà è mancante
0 convenzionale: punto di inizio convenzionale di una scala
Variabili quantitative discrete: assumono soltanto alcuni valori interi (0, 1, 2, 3, 4) e numero finito. Sottoinsieme di N. Si usa il diagramma ad aste
Variabile quantitativa continua: può assumere tutti i valori di un intervallo, definita in sottoinsiemi di R, possono essere espresse con numeri decimali. Si usa l’istogramma
Modalità ordinale: si mettono in ordine le categorie
Variabili sostitutive: proxy. Misurabili con delle qualità e usate nelle scienze sociali
Variabili metriche: numeriche
Matrice dei dati: formata da colonne e righe, le colonne corrispondono alle variabili, sia quantitative che qualitative e le righe indicano le unità (è ad esempio un foglio di Excel)
corrispondenza della maggiore densità di frequenza
Una distribuzione si dice bimodale: quando presenta due mode
Plurimodale: distribuzione che presenta un certo numero di mode
- Valore centrale:
- Mediana: valore centrale (modalità con posizione centrale) di una serie di dati ordinati (collettivo ordinato), divide la graduatoria in due parti uguali. Modalità preceduta e seguita dallo stesso numero di termini. Con una variabile quantitativa si individua attraverso la funzione =mediana. Con variabile qualitativa di fa riferimento alla funzione della frequenza cumulata percentuale, osservando dove cade o supera il 50%. Misura indice di posizione, non si può trovare in presenza di una variabile qualitativa nominale. Non risente di ciò che succede agli estremi della distribuzione. È un indice robusto ossia il suo valore non si muove facilmente. Fa parte dei quantili: due parti, 50%
Quantili: valori soglia della distribuzione, si individuano dividendo la distribuzione in parti uguali. Vi rientra la mediana. Attraverso le frequenze cumulate si determinano i quantili con variabili qualitative. Con variabili quantitative si usa la funzione. Anche i quantili sono espressi nella stessa unità di misura del fenomeno
Decili: 10 parti uguali (10,20,30..)
Quartili, centili, quintili: si trovano osservando le frequenze cumulate
Calcolo di un quartile: quantile+matrice+numero 4 (25,50,75)
25esimo percentile: 0,25, corrisponde al primo quartile (dividiamo diviso 100)
Grafico box plot, variabili quantitative: matrice+inserisci+istogramma+scatola e baffi. La x nel grafico corrisponde alla media aritmetica, la riga nel mezzo alla mediana. Il grafico è dato dal primo quartile (Q1)+x min+Me(diana)+terzo quartile(Q3)+x max.
La distribuzione si dice simmetrica quando i valori sono equidistanti dalla mediana e si presentano con la stessa frequenza, le basi hanno più o meno la stessa lunghezza, baffi uguali e mediana al centro della figura
Baffo maggiore: la frequenza diminuisce
La maggiore distribuzione si trova nella zona colorata
Attraverso questo grafico si può desumere la differenza interquartile (Q3-Q1)
Valori più piccoli e variabile con baffo più lungo: media maggiore della mediana
La mediana può non essere al centro del box, dipende dal valore che si trova
Numero puro: non dipende dall’unità di misura
Relazione perfetta:
tra due variabili o unità ad ogni valore della variabile ne corrisponde soltanto uno. Ad ogni modalità ne corrisponde una (meno è perfetta la relazione e più è difficile prevedere una reazione). Conoscendo la variabile A conosco anche B, darebbe origine al valore dell’indice pari a 1 (?).
Interdipendenza o dipendenza nella relazione:
Interdipendenza o associazione: le due variabili si influenzano reciprocamente
Dipendenza: abbiamo una variabile indipendente e una dipendente, una causa ed un effetto. Diciamo che y=f (x)
Avendo X e Y entrambe qualitative: interdipendenza X e Y entrambe quantitative: interdipendenza e dipendenza
Variabili qualitative: X^2 rappresenta l’indice di misura dell’esistenza di un legame. Covarianza (x e y), intensità indice V di Cramer. Individuabile con la tabella a doppia entrata
Variabili quantitative: indice di misura intensità di legame, indice di correlazione lineare r di Pearson, esistenza: covarianza e individuabile con lo scatterplot
Normalizzazione: si usa per costruire le misure di intensità (cogliere l’intensità della relazione e del legame tra le variabili). Bisogna confrontare il valore riportato con quello Massimo che la misura può assumere x/x max Misure di intensità nell’intervallo 0:1 (sempre compresa tra 0 e 1) ne è un esempio la frequenza relativa
Standardizzazione: altro modo per fare confronti è dato da Z= (x-M)/dev.st si ottiene il punteggio standardizzato. Standardizzare significa rendere uguali. Si trasforma la variabile in modo che non risenta della deviazione standard e l’ordine medio di grandezza. Serve per confrontare elementi che appartengono a distribuzioni diverse. Z ha sempre come media 0 e dev.st 1
No grafico di dispersione e no relazione tra variabili quantitative e inferenza nella prova in itinere
Diagramma di dispersione: analogo alla tabella a doppia entrata ma per variabili quantitative. Ciascun punto del grafico rappresenta un’unità statistica con delle coordinate x e y (modalità). Dà informazioni circa l’esistenza, l’intensità, la forma e