Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
X F
i i
Coniugato 4
Libero 3
Divorziato 2
Vedovo 1
10
Formalmente k=4 (modalità), n=10 (numero di soggetti: ampiezza campionaria) e il campione
si può scrivere (x1, x2, …, x4), dove x1 = coniugato, con frequenza 4, x2 = libero, con
frequenza 3, x3 = divorziato, con frequenza 2 e infine x4 = vedovo, con frequenza 1.
La somma delle frequenze deve dare sempre il totale dei soggetti, ovvero l’ampiezza
campionaria n.
Infatti, raggruppando i soggetti nelle k modalità non abbiamo che suddiviso in gruppi gli n
partecipanti alla ricerca costituenti il nostro campione.
Frequenze assolute e frequenze relative
La frequenza è il numero di volte in cui si presenta un determinato «evento» / «modalità» di
risposta.
Le frequenze viste, si chiamano frequenze assolute e vengono calcolate tramite un
semplice conteggio.
I software statistici contemporanei effettuano questo conteggio automaticamente, dunque il
ricercatore inserisce in modo sequenziale tutti i soggetti ed effettua il conteggio e dunque il
calcolo delle tabelle di frequenza tramite software.
Date le frequenze assolute fi calcolate come conteggio, il ricercatore computerà le frequenze
relative rispetto al valore convenzionale 100, dunque calcolerà le percentuali relative per
ciascuna modalità di frequenza assoluta, ottenendo le frequenze relative.
X F %=(f /n
i i i
Frequenze relative (percentuali): fi %=(fi / n) * 100 F * 100)
i
La somma delle percentuali di tutte le modalità è 100. X F1 F %
1 1
X F2 F %
In forma tabellare, le frequenze relative fi % vengono 2 2
X F3 F %
inserite come colonna accanto a quella precedentemente 3 3
calcolata delle frequenze assolute fi. … … …
… … …
Nella tabella, dunque: … … …
- Le righe sono le k modalità (xi), categorie di possibile X Fk F %
k k
risposta; N 100
- Le colonne esplicitano le frequenze assolute (fi) e le
frequenze relative (fi %) per ciascuna modalità.
In qualunque forma esse vengano espresse (tabellare, testuale o grafica), le frequenze
relative sono solo una diversa espressione delle frequenze assolute, quindi i valori espressi
dalle frequenze relative non aggiungono informazioni o sintesi a quelli espressi dalle
frequenze assolute.
Esprimendo il peso di ciascuna modalità di risposta in percentuale, la frequenza relativa è
spesso di più immediata comprensione e quindi di aiuto sia per la comunicazione dei propri
risultati a terzi, sia per la propria interpretazione dei dati raccolti.
Es. Dire che 215 soggetti su 645 ha risposto «a» è uguale a dire che il 33,33% dei soggetti ha
risposto «a», che è ancora uguale a dire che un terzo dei soggetti ha risposto «a».
Frequenze assolute in pratica
Torniamo alla nostra precedente indagine. Il nostro campione era costituito da 10 individui,
ciascuno dei quali avrà uno stato civile da scegliere tra coniugato, libero, divorziato e vedovo.
Tabella di frequenze
Adesso andiamo a contare il numero di soggetti che abbiamo per ciascuna modalità di
risposta (calcoliamo le frequenze) e otteniamo la tabella di frequenze.
X F F %
i i i
Coniugato 4 40 %
Libero 3 30 %
Divorziato 2 20 %
Vedovo 1 10 %
10 100
%
La somma delle frequenze deve dare sempre il totale dei soggetti, ovvero l’ampiezza
campionaria n.
Allo stesso modo la somma delle frequenze relative deve dare sempre il totale 100% che
rappresenta l’intero, il 100% del campione, ovvero tutto il campione considerato.
Al totale delle frequenze relative non viene data una lettera convenzionale proprio perché
questo sarà sempre relativo a un numero fisso (tipicamente 100 ma potrebbe essere diverso,
come 1000 se voglio esprimere in millesimi invece che percentuali).
Il calcolo dei singoli valori viene effettuato secondo la formula:
Fi %=(fi / n) * 100, (per i = 1, 2, …, k)
Dunque calcoleremo ciascun valore in tabella come segue:
F1 %=(f1 / n) * 100 = (4 / 10) * 100 = 40
F2 %=(f2 / n) * 100 = (3 / 10) * 100 = 30
F3 %=(f3 / n) * 100 = (2 / 10) * 100 = 20
F4 %=(f4 / n) * 100 = (1 / 10) * 100 = 10
A volte una tabella di frequenze può essere più complessa e la visualizzazioni delle
percentuali chiarisce maggiormente il contenuto.
Frequenze cumulate
Le frequenze assolute e relative rappresentano gli stessi pesi seppur visualizzati in modi
diversi.
I software statistici contemporanei effettuano il conteggio di frequenze assolute e relative
automaticamente, dunque il ricercatore inserisce in modo sequenziale tutti i soggetti ed
effettua il conteggio e dunque il calcolo delle tabelle di frequenza tramite software, che
contengo anche le percentuali e dunque le frequenze relative.
Inoltre, una volta ottenute le frequenze questi software permettono la visualizzazione tramite
grafici.
Le frequenze assolute cumulate sono la somma delle frequenze di quella categoria e delle
precedenti.
Le frequenze relative cumulate sono la somma della percentuale di risposte a quella
categoria e a quelle precedenti.
Per le variabili nominali non ha senso calcolare le frequenze assolute cumulate e le frequenze
relative cumulate, ma ha senso calcolare le frequenze assolute e relative.
Le frequenze cumulate hanno senso per le variabili che siano quanto meno ordinabili.
Si possono dunque calcolare per:
- Variabili ordinali
- Variabili a intervalli equivalenti
- Variabili a rapporti equivalenti
Per le variabili nominali calcoleremo solo le tabelle di frequenza assolute e relative.
Raggruppamento per classi
Quando ci sono tante modalità conviene fare delle classi (intervalli chiusi o aperti: da …
escluso, a…incluso).
Queste devono necessariamente essere:
- Disgiunte (non devono esserci sovrapposizioni tra classi)
- Esaustive (devono contenere il minimo e il massimo osservati)
- Chiuse a destra (limite inferiore escluso, limite superiore compreso)
Le classi sono spesso usate in psicologia, sono quindi importanti in psicometria.
Classi F F %=(f /n * 100)
i i i
H -|h F1 F %
0 1 1
H -|h F2 F %
1 2 2
H -|h F3 F %
2 3 3
… … …
… … …
… … …
Hk-1-| F %
k
hk Fk
N 100 Ipotizziamo di condurre una sperimentazione
chiedendo l’età (variabile a rapporti equivalenti).
X F F % Fi%
i i F
i i
2 3 30 3 30
0 % %
2 1 10 4 40
1 % %
2 1 10 5 50
3 % %
2 2 20 7 70
5 % %
2 1 10 8 80
9 % %
3 1 10 9 90
0 % %
3 1 10 1 100
1 % 0 %
1 100
0 %
Frequenze cumulate in classi
In tabella il raggruppamento per classi: da … (escluso), a… (incluso)
- Da 19 escluso a 23 incluso, include i valori 20 (3 soggetti), 21 (1 soggetto) e 23 (1
soggetto)
- Da 23 escluso a 29 incluso, include i valori 25 (2
soggetti) e 29 (1 soggetto) Class F F % Fi%
i i
- Da 29 escluso a 31 incluso, include i valori 30 (1 i F
i
soggetto) e 31 (1 soggetto) 19-| 5 50% 5 50%
23
Otteniamo dunque la tabella per classi e calcoliamo 23-| 3 30% 8 80%
frequenze relative e frequenze cumulate (relative e 29
assolute). 29-| 2 20% 1 100
31 0 %
1 100
0 %
Le rappresentazioni grafiche
I dati raccolti in tabelle si possono rappresentare graficamente.
Le rappresentazioni grafiche offrono numerosi vantaggi perché descrivono il fenomeno in
forma visiva e permettono di esaminare l‘andamento in modo globale e di confrontare
caratteri diversi dello stesso fenomeno e le sue variazioni nel tempo e nello spazio.
La rappresentazione grafica è molto più espressiva di una tabella di valori, anche se sono
necessarie delle approssimazioni.
Per una buona rappresentazione grafica è molto importante la scelta delle unità di misura,
che deve tenere conto sia dei minimi che dei massimi valori da rappresentare.
L grafici sono utilizzati non solo a scopo descrittivo, ma anche scientifico se si ricerca il
modello matematico del fenomeno (funzione che esprima l‘andamento del fenomeno).
Ln statistica si utilizzano diversi tipi di rappresentazioni grafiche secondo la natura dei dati da
rappresentare, anche se talvolta è possibile effettuare due o più rappresentazioni di una
stessa tabella.
Le componenti di un grafico
I dati: sono rappresentati in barre, linee, aree o punti.
I grafici possono includere due categorie distinte di elementi:
- Elementi strutturali che consentono la comprensione dei dati. Essi comprendono:
Il titolo del grafico: breve e coinciso ma esemplificativo del contenuto
I titoli degli assi: identificano le variabili rappresentate dagli assi
Le etichette degli assi: identificano le singole modalità o i singoli valori rappresentati
nel grafico
L’unità di misura dei dati: (p.e. “in migliaia” , “%” etc.)
La griglia: può essere aggiunta per agevolare la lettura e il confronto dei dati
La legenda: identifica simboli, tratteggi o colori usati per rappresentare i dati
Le etichette dei dati: visualizzate sopra o vicino alle barre, alle aree o alle linee
facilitano la lettura del grafico
Le note: possono essere aggiunte per fornire definizioni o informazioni sulla
metodologia
La fonte di provenienza dei dati:
- Elementi decorativi non sono legati ai dati
Creare un grafico
Ogni programma di analisi dei dati, excel compreso, permette la creazione di quasi tutti i tipi
di grafico di cui il ricercatore potrebbe avere bisogno.
A seconda della tipologia di dati e dello scopo della ricerca sarà più opportuno scegliere una o
l’altra tipologia di grafico.
Tipologie di grafici
Diagrammi cartesiani
Sono usati soprattutto per rappresentare serie storiche e seriazioni discrete.
Le unità di misura sui due assi cartesiani sono generalmente diverse. La scelta delle unità di
misura, è molto importante per una corretta rappresentazione grafica.
Per le serie storiche si riportano sull’asse delle ascisse gli anni (o i mesi, o i giorni, o le ore, …)
e sulle ordinate le intensità corrispondenti a quella specifica unità di misura.
Tabella di una serie storica grafico della serie storica grafico di
una seriazione
per rappresentare variabili nominali e ordinali, possono essere utili:
Grafico a rettangoli separati (mutabili): in corrispondenza ad ogni modalità si
disegna un rettangolo con altezza proporzionale alla frequenza (assoluta o
relativa).
grafico a barre: sull’asse orizzontale sono rappresentate le modalità della
variabile e su quello verticale le frequenza.
Per le variabili quantitative si preferiscono:
Istogram