Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Misure di variabilità: curtosi e asimmetria
Curtosi: grado di piattezza della curva della densità delle frequenze rispetto alla curva normale (mediana=0). Più la ds è alta, più la curtosi è ampia (la curva è più piatta).
Asimmetria: grado di asimmetria della curva della densità delle frequenze rispetto alla curva normale. Mediana 0, deviazione standard (valore tra il punto di flesso della curva e la linea di simmetria centrale) 1: curva perfetta. I valori solitamente vanno da 0 a infinito, ma oltre il +4 o -4 sono poco frequenti (anomali).
Riepilogo vedi slides (impo!) in una distribuzione normale, media mediana e moda coincidono (0).
Come si riportano le informazioni statistiche descrittive?
Ci sono molti modi di riportare queste statistiche all'interno del contesto dell'articolo (o della tesi). La grafica dev'essere selezionata con cura per rappresentare accuratamente e fedelmente le informazioni che vogliamo riportare e comunicare.
In genere, quindi, nei report di ricerca (o nelle tesi) si possono trovare istogrammi a più entrate e box-plot; negli articoli, invece, vi sono rappresentazioni grafiche più complesse di quelle studiate finora. Le rappresentazioni grafiche più semplici e banali (torte, poligoni di frequenza e simili) non vengono usate. Di solito si riportano numerosità, media e deviazione standard (preferibilmente con due decimali, arrotondando se necessario): 1) In una tabella riassuntiva delle varie variabili; 2) In un testo per una o più variabili specifiche. Nell'American Psychological Association si usa "SD" (standard deviation). La tabella ovviamente deve adattarsi al contesto: per esempio, se N è uguale per tutte le variabili si può riportare una sola volta; il testo può essere sintetizzato in altro modo. CAPITOLO 3 PUNTI Z I punteggi grezzi (cioè che abbiamo misurato) sono semplici da interpretare se conosciamo la scala.l'unità di misura su cui sono misurati (i metri, i gradicentigradi e simili); non sono facili da interpretare se usano scale non conosciute (ad es. intervallo 6-36 oppure 30-180). Variabili diverse possono usare unità diverse (età, soddisfazione...) con metriche diverse (età -> 0-n; soddisfazione -> 0-10, ...) che possono cambiare da una cultura all'altra (kg o libbre, km o miglia, ...).
Fondandoci sui dati grezzi, dunque, non possiamo confrontare fra loro variabili diverse: un 25 in un test di abilità matematica (AM) è migliore o peggiore di un 55 in un test di abilità verbale (AV)? Dipende dalle relative scale: se AM ha un intervallo 1-30 e se AV un range 10-60, entrambi i punteggi sono abbastanza vicini al valore massimo (sono "massimo teorico").
Ma comunque, ciò significa che uno è "migliore" (maggiore) dell'altro? In termini assoluti, sì: 55 è
maggiore di 25; Ma in termini relativi?
M (media)
So di per certo che un punteggio è più basso dell'altro (25 < 55), ma non "quanto significa" che sia più basso rispetto all'altro, proprio perché non ho una gamma di oscillazione (max-min) che valga per entrambe le variabili (AM e AV).
Per capire la reale differenza tra due variabili, dunque, dovrei trovare una gamma di oscillazione che valga per entrambe, adoperando una specifica unità di misura per entrambe. Infatti, si possono confrontare tra loro due variabili diverse solo se queste hanno uguale unità di misura (la quale è un "metro" che permette di esprimere "lunghezze" diverse tramite qualcosa di comparabile e confrontabile).
Confrontare variabili diverse tra loro, dunque, non è possibile se non usando la stessa scala e lo stesso metro di misura; è come decidere se 3 banane sono più di 3 arance: si tratta di cose diverse, non
confrontabili a meno che siano trasformate in una stessa unità di misura. Ci si potrebbe chiedere, per ovviare il "3 banane pesano di più di 3 arance?" "3 banane problema, per esempio ohanno più vitamine di 3 arance?". In questo caso, i due oggetti sono confrontabili in quanto valutabili tramite uno stesso metro.
In statistica, si vorrebbe avere un' unica unità di misura che valga per qualsiasi tipo di variabile quantitativa (intervallo/rapporto), così da permetterne il confronto. Quale potrebbe essere questa unità di misura? (Sto cercando un' unità di misura che valga per entrambe le scale dell' esempio precedente (AM e AV), tale da permettere di esprimere nella stessa maniera i precedenti punteggi di 25 e 55 (così da confrontarli e capire quale è quello "migliore", "maggiore").
1. Sottraendo a tutti i punteggi della scala la media (Xi-M), ovvero utilizzando gli scarti dalla media,
Passiamo da una scala che va da 0 a 10 a una scala che va da -5 a +5. In questa nuova scala, la media è 0: abbiamo trasformato uno scarto assoluto in uno scarto relativo utilizzando come unità di misura la media. Utilizzando questa operazione con le due variabili dell'esempio (AM e AV), le medie delle due variabili considerate diventano entrambe 0, e così entrambe le variabili vengono espresse attorno al valore 0. Infatti:
Se faccio questa operazione mi baso su una trasformazione lineare che sfrutta una delle proprietà della media: se aggiungo o sottraggo una costante a una distribuzione, allora la media subisce la stessa trasformazione; per cui, se tolgo ad AM e AV la loro media, trasformo le due variabili in modo che abbiano entrambe M=0.
Adesso le due variabili hanno la stessa media (0), ma hanno ancora una varianza diversa: devo trovare un modo per "comprimere" le distribuzioni, così da ottenere che in entrambe il massimo e il minimo
teorico combacino. Devocampi di variazione.quindi trovare un metodo per ottenere uguali2.Una prima possibilità è quella di dividere tutto per lo stesso valore (es. lerispettive gamme) e poi moltiplicare tutto per lo stesso valore, così da otteneregamme di oscillazione uguali. Devo però trovare qualcosa di universalmentevalido da applicare a tutte le variabili (per questo le gamme non sonoefficienti): la deviazione standard. Posso quindi ipotizzare di utilizzare la“quante deviazionideviazione standard come unità di misura, chiedendomistandard ci sono fra un determinato valore X (punteggio di una variabile) e lamedia (di quella variabile)?”.Secondo questa tecnica, gli scarti dalla media vengono divisi per la ds; siottengono, in tal modo, i punti Z.Dalla trasformazione di ogni valore (punteggio) della variabile tramite l’utilizzodell’unità di misura della deviazione standard, dunque, ottengo i punteggi zeta.Il punteggio Zmi dice quante deviazioni standard ci sono tra il punteggio considerato (Xi) della variabile e la media della stessa variabile. Seppur cambida distribuzione a distribuzione, dunque, DS mi permette di confrontare le due distribuzioni, in quanto mi dice quante DS ci sono tra la media e il punteggio X per ogni distribuzione (posso confrontare i punteggi di due variabili diverse, perché so quante ds ci sono tra quel punteggio e la media della variabile).
Proprietà dei punti z:
- Il punto z è una misura standard (come il metro); la trasformazione dei punteggi in punti z si dice anche "standardizzazione";
- La distribuzione dei punti z si dice "distribuzione standardizzata" perché è una delle tante possibili curve di frequenza, ma con M e DS conosciute a priori.
- La media dei punti z è 0, in quanto qualunque punteggio corrispondente alla media originale sarebbe a 0 scarti dalla media;
- La somma dei punti z è 0, in quanto i punti z sono
scarti dalla media(somma scarti dalla media =0) trasformati in modo uniforme;
La deviazione standard dei punti z è 1, perché la deviazione standard è l'unità di misura;
Valori negativi indicano punteggi inferiori alla media;
Valori positivi indicano punteggi superiori alla media.
Vi è poi una formula "inversa", che conoscendo media, ds e punto z permette di calcolare X (il punteggio, o punto, grezzo):
Basandoci su ciò, osserviamo che ci sono scale standardizzate utilizzate comunemente in psicologia (specie per i test) che derivano dai punti z:
- Punteggi T: hanno M=50 e DS= 10; si ottengono con T = 10z+50;
- Punteggi SAT: hanno M = 500 e DS = 100; si ottengono con SAT = 100z +500
- QI o IQ: la maggior parte dei test di intelligenza (es. WAIS) ha M =100 e DS= 15; si ottengono con QI = 15z + 100;
il test di intelligenza Stanford-Binet utilizza M=100 e DS=16; si ottengono con QI = 16z + 100.
DISTRIBUZIONE NORMALE E STANDARDIZZATA
La formula
della curva normale è: I parametri della curva sono la media, la ds e la varianza. La versione standardizzata della curva normale ha M=0 e DS=1. La curva cambierà di forma in base alla media e alla DS. N.B. quellain mezzo è quella standardizzata. Analizziamo ora la relazione tra curva normale standardizzata e punti z. L'intera curva normale ha un'area, della quale parleremo in termini di proporzione (da 0 a 1) o di percentuale (da 0% a 100%). La curva normale standardizzata animata mostra la relazione tra l'area sottesa alla curva e i punti zeta, in base al tipo di riferimento (ovale arancione con la freccia, nell'immagine z=0). Per esempio, se utilizzo Z=1 (1 deviazione standard dalla media): Tra Z=0 (M) e Z = 1 c'è il 33,4%. Stessa cosa vale per Z =-1. Tra Z = -1 e Z = 1, dunque, ci sono il 68,26% dei dati. Tra la coda negativa e Z = 1 c'è l'84,13% e tra la coda positiva e Z = 1 c'è il 15,87%. Le ultime due.percentuali sono invertite per Z = -1
La probabilità di trovare punteggi superiori a Z=3 o Z= -3 è minima; infatti:
In una curva normale oltre le 3 ds c'è poca probabilità che si possano trovare valori, ma ciò non è impossibile.
Per risalire dai punti z all'area corrispondente (se non c'è la possibilità di utilizzare la curva animata) si utilizzano le tavole della distribuzione normale.
Esistono delle tabelle che riportano il valore dell'area corrispondente a vari valori di z.
- Tavola Welkowitz
- Tavola Aron
- Tavola Field
Ci sono alcuni punti z particolari:
N.B. nell'ultimo punto non 91 ma 99.