Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Domanda di un sondaggio a N = 78: "E' favorevole alla raccolta differenziata?"
SI NO NON SO
60 48 36 24 12 0
ISTOGRAMMA
È una rappresentazione grafica su due assi cartesiani nella quale si riportano le frequenze in colonne giustapposte.
Viene utilizzato per variabili continue misurate su scale a intervalli o a rapporti equivalenti.
Asse delle ascisse: vengono indicati i limiti veri.
Asse delle ordinate: vengono indicati i valori che si ottengono dividendo ciascuna frequenza per l'ampiezza dell'intervallo; occorre fare due distinzioni:
- Classi di uguale ampiezza: ordinata = frequenza
- Classi di diversa ampiezza: ordinata ≠ frequenza (per calcolare l'altezza del rettangolo: frequenza/ampiezza)
Con classi di ampiezza diversa avremo quindi che:
- La frequenza (f) = area del rettangolo
- La base (b) del rettangolo = si calcola come la differenza fra il limite reale superiore e inferiore dell'intervallo
Il limite reale inferiore della classe (ampiezza della classe) • L'altezza (h) del rettangolo = rapporto fra area (f) e base (b). Infatti, poiché l'area di un rettangolo A = b x h e quindi f = b x h, allora h = f/b
DIAGRAMMA A TORTA
Rappresentazione grafica a forma di torta per frequenze percentuali.
- celibe: 3 (10%)
- coniugato: 4 (20%)
- divorziato: 2 (20%)
- vedovo: 1 (40%)
POLIGONO DI FREQUENZA
Rappresentazione grafica su due assi cartesiani di una linea spezzata che rappresenta l'andamento delle frequenze. Utilizzato per rappresentare variabili misurate su scale a intervalli o a rapporti equivalenti.
- Asse delle ascisse: si riporta il punto medio (Xc) di ciascuna classe = Ls + Li / 2
- Asse delle ordinate: si riportano le frequenze se classi di uguale ampiezza; oppure si
calcola f/b se➡ classi di diversa ampiezza.
Maschi FemmineFrequenze Frequenze 7Classi a Xc M F 611.5-16.5 5 14 3 0 5416.5-21.5 5 19 4 6 321.5-26.5 5 24 3 3 2126.5-31.5 5 29 0 1 0 14 19 24 2924
OGIVA
Rappresentazione grafica delle frequenze cumulate➡ Asse delle ascisse : valori assunti da una variabile➡ Asse delle ordinate : frequenze cumulate➡Poniamo il caso di aver misurato i punteggi ottenuti su un test di abilità verbali di 26 bambini di un asilo nido, otteniamo la seguente ogiva :
Punteggio f Fcum
4 2 2 30
5 3 5 25
6 5 10 20
15 7 17 10
8 6 23 5
9 2 25 0
3 4 5 6 7 8 9 10
10 1 26
26
INDICATORI DI TENDENZA CENTRALE
Dopo aver tabulato e rappresentato i dati, occorre sintetizzare le molteplicità di informazioni raccolte. I due parametri che consentono di sintetizzare un insieme di dati grezzi sono:
• INDICATORE DI TENDENZA CENTRALE = valore che rappresenta l’insieme stesso
• INDICATORE DI DISPERSIONE = valore che ne specifica la variabilità indicando
Quanto i dati si discostano da un valore centrale?
Al variare del livello di misura utilizzato, varieranno gli indicatori adeguati.
Ad esempio potremmo essere interessati a confrontare la prestazione complessiva di due diversi gruppi ad una medesima prova. Sarebbe utile disporre di un valore o parametro capace di rappresentare la prestazione complessiva fornita da ciascun gruppo.
Gli indicatori di tendenza centrale sono:
- MODA
- MEDIANA
- MEDIA MODA
La moda corrisponde alla modalità di una variabile che si presenta con una frequenza maggiore all'interno della distribuzione oggetto di studio. Viene indicata con Mo. Detta anche valore modale; nel caso la distribuzione oggetto di studio è in classi si parla di classe modale.
Una distribuzione di frequenza può avere più di un valore o classe modale:
- Distribuzione unimodale = la moda è definita da un valore unico
- Distribuzione bimodale = la moda è definita da due valori
= 17.212 2 1014 117 118 319 122 2Nel caso di una serie di dati raggruppati in classi di ampiezza > 1, la media è calcolabile:➡ Dove :∑ = sommatoria 1. Trovare Xc per ogni classek Xc = punto medio 2. Trovare Xcf per ogni classe (f xfc = frequenza di ciascuna classe∑ 1 Xc fc Xc)K = numero dei diversi valoriM , X =
3. Totale Xcf / totale f = mediaN = totale dei casi osservatiN ESEMPIO :Proviamo a calcolare l’età media di N=10 partecipanti.La media ha due importanti proprietà :➡Età (ampiezza=4) f 3 (20+24/2) + 4 (25+29/2) + 3 (30+34/2)20-24 3 X =
= 2725-29 4 1030-34 31. La somma degli scarti dei singolivalori che
1. La media è sempre uguale a zero.
2. La somma dei quadrati degli scarti di ciascun valore dalla media è minore della somma degli scarti degli stessi valori da un qualsiasi altro numero (proprietà dei minimi quadrati).
ESEMPI:
Calcolo il punto 1: 28
Calcolo il punto 2:
Partecipanti Età
1 5
Media = 6
Somma degli scarti = (5-6) + (12-6) + (5-6) + (6-6) + (2-6) = 3 + 5 = -1 + 6 -1 + 0 - 4 = 0
4 6
5 2
La media può essere ottenuta con dati rilevati con scale di misura: a intervalli, a rapporti.
Partecipanti Età Media = 7
1 5
2 10
Calcolo somma = (5-7)2 + (10-7)2 + (5-7)2 + (8-7)2 = 4+9+0+4+1 = 18
3 7
4 5 *2 = alla seconda*5
8
INDICATORI DI TENDENZA CENTRALE E DI DISPERSIONE NEL CASO DI DATI SU SCALA NOMINALE
Sappiamo che la scala nominale non ha le caratteristiche vere e proprie di una scala di misura, poiché i dati sono di tipo qualitativo. L'unica osservazione sintetica che possiamo avere riguarda la frequenza di comparsa delle osservazioni.
La variabile che si presenta con maggiore frequenza nella distribuzione dei dati si chiama MODA (Mo). INDICATORI DI TENDENZA CENTRALE E DI DISPERSIONE NEL CASO DI DATI SU SCALA ORDINALE Indicatore di tendenza centrale: si utilizza la mediana. 29 Dispersione: si utilizza un indicatore descrittivo che consiste nell'individuare i quartili della distribuzione valutando la distanza tra il primo e il terzo quartile (distanza Interquartilica). ESEMPIO: È stata svolta un'indagine atta ad indagare la diffusione dell'uso di sostanze tra gli adolescenti. Ad un campione di 100 giovani è stata posta la domanda: "Quante volte hai fumato hashish?" Le modalità di risposta previste erano graduate lungo una scala a quattro punti. La distribuzione risultata è la seguente: Calcolare la mediana: 1. Ci si accerta che le categorie della distribuzione siano ordinate (in senso crescente o decrescente); 2. Si calcolano le frequenze cumulate; 3. Si individua laposizione mediana con la formula:
Frequenze F cumulate
Da 0-5 volte | 30 | 30 |
---|---|---|
Da 6-10 volte | 35 | 65 |
da 11-20 volte | 25 | 90 |
Più di 20 volte | 10 | 100 |
Pos Me = n+1 /24. Si individua nella distribuzione cumulata la posizione mediana e si legge il valore corrispondente.
Nel nostro caso la mediana corrisponde alla posizione:
- Pos Me = 50.5
- Tale posizione non esiste, quindi la mediana non è identificabile in modo preciso, ma si può dire che cade in un punto della scala ordinale tra le risposte “da 0 a 5 volte” e “da 6 a 10 volte”.
Accanto alla mediana esistono altri indicatori quali i quartili, i decili e i centili (o percentili), che vengono calcolati in maniera uguale alla mediana e che servono a “standardizzare” distribuzioni diverse per renderle confrontabili.
I quartili sono quei valori che dividono la distribuzione ordinata in 4 parti uguali. Essi sono 3:
- il primo quartile (Q1 ; quartile inferiore)
- il secondo quartile (Q2 ; quartile
Il secondo quartile (o mediana) è il valore che, nella distribuzione ordinata, divide la stessa in due parti uguali. Il primo e il terzo quartile sono i valori mediani delle due sottodistribuzioni che si ottengono dopo aver calcolato il secondo quartile. Quindi: 30
Al di sotto del primo quartile cade il 25% delle osservazioni; ➡ Al di sotto del terzo quartile cade il 75% delle osservazioni.