vuoi
o PayPal
tutte le volte che vuoi
PARAMETRICI).
- SCALA LIKERT: si richiede di esprimere una valutazione in base al grado di accordo,
soddisfazione, di importanza, di interesse ( totale disaccordo, abb. D’accordo, d’accordo
ecc.)
3) SCALA AD INTERVALLI: è di tipo quantitativo. Possiamo parlare di unità di MISURA E
VALORI poiché i numeri esprimono quantità e le distanze tra valori sono definite in
termini quantitativi. Es: punteggi a test d’ansia/aggressività, quoziente intellettivo,
questionari che consentono di rilevare atteggiamenti o conoscenze. Le differenze tra
i numeri corrispondono a uguali differenze nella QUANTITA’ della proprietà
definita dalla variabile. Tra due valori consecutivi c’è la stessa distanza che
esiste tra altri due valori consecutivi.
La relazione logica è quella di UGUAGLIANZA TRA INTERVALLI dove le relazioni di
uguaglianza o disuguaglianza tra intervalli sono definite, nei termini di MAGGIORE O
MINORE, in termini di QUANTITA’.
Il valore 0 è CONVENZIONALE E ARBITRARIO, non indica l’assenza di una
caratteristica quindi possono essere definiti valori negativi. (es. 0 gradi non indica
l’assenza di temperatura).
Da un punto di vista aritmetico possono essere fatte SOMMA E SOTTRAZIONE. (non
rapporti o moltiplicazioni)
4) SCALA A RAPPORTI: è di tipo quantitativo, mantiene le stesse caratteristiche della scala
ad intervalli con l’aggiunta dello 0 assoluto lo 0 significa assenza della caratteristica
che stiamo misurando.
Es. peso, altezza, tempo, numero di errori ad una prova.
Possiamo fare RAPPORTI TRA I VALORI. La relazione è quella di uguaglianza tra intervalli
e tra rapporti, ovvero si ha la costanza del rapporto non solo tra intervalli ma anche tra
rapporti. POSSONO ESSERE SVOLTE TUTTE LE OPERAZIONI ARITMETICHE. USO DEI TEST
PARAMETRICI. Capitolo secondo
Distribuzioni di frequenza con una variabile
1) Frequenze semplici: per frequenza si intende il numero di volte che un certo
valore o categoria compare in un determinato insieme di dati. Una distribuzione di
frequenza è data dal computo delle frequenze per ciascun valore o della categoria
della variabile. Può essere rappresentata in forma TABULARE O GRAFICA riportando
le due componenti : i valori/categorie della variabile e le frequenze con le quasi si
presentano i singoli valori.
2) Frequenze relative e percentuali: la frequenza relativa è una proporzione tra la
frequenza e il numero totale dei valori osservati. In questo modo otteniamo la
proporzione di soggetti, entro il campione, che appartiene a ciascuna categoria o
valore. Moltiplicando la frequenza relativa x 100 ottieniamo la percentuale.
3) Frequenze cumulate: la frequenza cumulata relativa ad un determinato valore
corrisponde al numero totale di soggetti che hanno quel valore o uno ad esso
inferiore. Si calcola aggiungendo al numero di soggetti che hanno ottenuto quel
valore, il numero di soggetti che hanno ottenuto un valore più basso. Si ottiene
sommando alla frequenza associata ad un valore tutte le frequenze dei
valori che lo precedono. Presuppone che i valori della variabile possano essere
ORDINATI, non possiamo calcolare una distribuzione di frequenza cumulata, se a
nostra variabile è su una scala nominale.
4) Frequenza cumulata relativa e percentuale: dividendo la frequenza cumulata
per il totale dei casi osservati otteniamo la distribuzione delle frequenze
cumulate relative. Moltiplicando la frequenza relativa x 100 otteniamo la
percentuale cumulata.
RAPPRESENTAZIONE GRAFICA DELLE DISTRIBUZIONI DI FREQUENZA:
Per rappresentare una distribuzione di frequenza in modo sintetico, possiamo
utilizzare la rappresentazione grafica. Il grafico evidenzia la forma della
distribuzione e le sue peculiarità.
GRAFICO A BARRE: Il grafico a barre è una rappresentazione grafica che si usa
quando abbiamo una variabile qualitativa. Riporteremo su X le categorie e su Y le
frequenze. Utilizzando barre la cui altezza indica la frequenza per ciascuna
categoria, siamo così in grado di rappresentare graficamente la distribuzione. La
barre SONO SEPARATE TRA DI LOROR, ad indicare che non esiste una CONTINUITA’
TRA I VALORI.
ISTOGRAMMA: Gli istogrammi sono una modalità di rappresentazione grafica
utilizzata per le variabili QUANTITATIVE. Le frequenze o le percentuali sono
rappresentate da barre verticali la cui altezza indica la frequenza e che, a differenze
del grafico a barre, non sono separate tra loro. L’ISTOGRAMMA PERMETTE DI
VISUALIZZARE LA FORMA DELLA DISTRIBUZIONE OSSERVATA.
POLIGONO DI FREQUENZA: il poligono di frequenza è un grafico definito da linee
ottenute unendo i punti che rappresentano le frequenze di ciascun valore della
variabile. Lo possiamo costruire anche unendo i punti centrali dei lati più corti delle
barre verticali che compongono l’istogramma. Lo possiamo costruire anche
utilizzando le frequenze cumulate, in questo caso osserviamo una linea spezzata
con un particolare andamento, detto ogiva.
GRAFICO A TORTA: con il grafico a torta si rappresentano le percentuali dei valori
di una variabile attraverso un cerchio diviso in settori. Questo tipo di
rappresentazione consente di visualizzare le proporzioni tra i valori entro l’insieme
dei dati. In generale la rappresentazione grafica più efficace per variabili
categoriali. CAPITOLO TERZO
Misure di tendenza centrale
le misure di tendenza centrale sono quei lavori che ci indicano il centro
della distribuzione e forniscono informazioni sulla centralità del nostro insieme di
dati.
Media, Mediana e Moda
E corrispondo al valore o categoria più tipico e più rappresentativo della
distribuzione.
MEDIA
Il termine media si riferisce al valore centrale di un insieme di dati. La media è data
dalla somma di tutti i valori della distribuzione divisa per il numero totale di casi che
la compongono. La media risulta essere il punto centrale della distribuzione rispetto
alla quale la somma degli scarti al di sotto di questo valore è uguale alla somma
degli scarti al di sopra di esso. È il baricentro della distribuzione.
MEDIANA (Me)
La mediana corrisponde a quel valore che divide la distribuzione in modo tale che il
50% dei casi cadono al di sotto e il 50% al di sopra di esso, è QUEL VALORE CHE
DIVIDE LA DISTRIBUZIONE DI FREQUENZA A META’. Rappresenta il centro della
distribuzione, questo valore ci dice dove la distribuzione di frequenza si divide in
due parti numericamente uguali.
Per calcolare la mediana bisogna ordinare i valori in modo crescente, considerando
anche i valori che hanno una frequenza diversa da uno calcolando le cumulate. Si
deve stabilire prima la posizione della mediana e dopo individuare il valore
corrispondente. MODA(Mo)
È quel valore che ha la frequenza più elevata, è il valore che compare con maggiore
frequenza nella distribuzione.
CONFRONTO TRA MEDIA/MEDIANA/MODA
• La MEDIA è il baricentro della distribuzione tale che le somme delle distanze
dei valori al sotto e al di sopra della media si equivalgono.
• La MEDIANA è il punto di mezzo della distribuzione con metà dei casi con un
valore più basso rispetto a quello mediano e l’altra metà più alto.
• La MODA è il valore che compare con maggiore frequenza nella distribuzione.
Quando nella distribuzione ci sono dei valori estremi (outliers) la media è un indice sensibile
alla presenza di tali valori, per questo in alcuni casi è preferibile utilizzare la mediana. La
media viene tirata verso il valore estremo, per cui si possono avere valori medi non realmente
rappresentativi della distribuzione.
Quando medina, mediana e moda coincidono si ha una distribuzione SIMMETRICA.
ASIMMETRIA POSITIVA: media>mediana>moda.
ASIMETRIA NEGATIVA: media<mediana<moda.
Per le variabili misurate su scale AD INTERVALLI E A RAPPORTI si può usare qualsiasi indice di
tendenza centrale. Nel caso di variabili misurate su SCALA ORDINALE non è
possibile calcolare la media non potendo utilizzare le operazioni aritmetiche.
Per le VARIABILI NOMINALI, dove i numeri sono usati come etichette non ha senso calcolare la
media. CAPITOLO QUARTO
Misure di variabilità
1) CAMPO DI VARIAZIONE: il modo più semplice per descrivere la variabilità entro la
distribuzione dei punteggi è calcolare il campo di variazione, ovvero si quantificano i
valori della variabile compresi tra il minimo e il massimo. Si ottiene facendo la
differenza tra il valore più elevato e quello più basso. Il limite di questo indice di
variabilità è che sono presi in considerazione solo i valori estremi senza tenere conto
dei valori intermedi e delle frequenze.
2) DIFFERENZA INTERQUARTILE: I quartili corrispondono a tre valori che dividono la
distribuzione in 4 parti. Al di sotto del primo quartile (Q₁) abbiamo il 25% dei casi, il
50% al di sotto del secondo quartile (Q₂), e il 75% al di sotto del terzo quartile (Q₃).
CALCOLO LA DIFF. INTERQUARTILE = calcolando la differenza tra il terzo e il primo
quartile ovvero DI= Q₃ - Q₁
3) MISURE DI DEVIAZIONE DALLA MEDIA: la maniera più semplice per calcolare la
variabilità della distribuzione è quella di calcolare la deviazione (o scarto) di ciascun
valore dalla media e poi trovare il valore medio di tali deviazioni, dividendo la somma di
tutti gli scarti per il numero delle nostre osservazioni. PROBLEMA: la somma degli scarti
della media è sempre = a 0 poiché la media è il centro della distribuzione.
4) SCOSTAMENTO SEMPLICE MEDIO: Una possibile soluzione è quella di prendere gli scarti
dalla media il valore assoluto, si elimina l’effetto del segno dal momento che si
consid4era soltanto quanto il valore si discosta dalla media.
SSM= ǀ sommatoria degli scarti dalla media / diviso il numero delle osservazioniǀ – tutto
sotto valore assoluto.
Lo SSM esprime in media quanto i dati si discostano dal valore medio della
distribuzione.
5) VARIANZA: la varianza si ottiene sommando gli scarti dalla media elevati al quadrato
dividendoli per il numero totale delle osservazioni. È un indice di variabilità SEMPRE
POSITIVO.
6) DEVIAZIONE STANDARD: si ricava dalla radice quadrata della varianza. È un valore
sempre positivo che esprime quanto mediamente i dati si discostano dalla media. (δ
sigma).
7) COEFFICIENTE DI VARIAZIONE: il coefficiente di variazione consente di confrontare
la variabilità di due o più distribuzioni. Si calcola dividendo la deviazione standard per
la media. Viene detto indice di variabilità relativa in quanto la variabilità della
distribuzione (detta assoluta) viene messa in relazione con la media.
V= s/M x 100 CAPITOLO QUINTO
Misure di posizione
In alcuni casi s