vuoi
o PayPal
tutte le volte che vuoi
TABELLE
Le sintesi che si ottengono dalle matrici dati sono le tabelle, che servono per iniziare a scrivere in modo chiaro il risultato della nostra ricerca. A partire dalla matrice si costruisce una tabella.
Esistono 2 tipi di tabelle:
- Tabelle semplici: descrivono la frequenza di una sola variabile, servono sia a sintetizzare, ma anche a ricordarci, se non ci sono dati mancanti, il totale delle unità statistiche.
- Tabelle doppie: descrivono la frequenza di più variabili.
TABELLE SEMPLICI
Tabelle semplici per variabili qualitative.
Nel caso in cui venga richiesta la variabile genere, basterà conteggiare la variabile di cui si richiede la risposta, la descrizione.
Per costruire una tabella, si deve partire da 2 elementi: la prima colonna ha come intestazione "variabile", che sto analizzando; contare variabile nella matrice (sarà la frequenza assoluta della variabile che stiamo considerando).
Inserire sempre nell'ultima riga il totale.
frequenza assoluta | freq. relativa | freq. percentuale | |
---|---|---|---|
M | 5 | 0,3846 | 38,46% |
F | 8 | 0,6154 | 61,54% |
totale | 13 | 1 | 100% |
APPUNTI A CURA DI MARIONCINI GAIA
La frequenza relativa: si calcola rapportando ciascuna modalità con la relativa dimensione campionaria. Quindi rapportando la frequenza assoluta di ciascuna modalità con il totale del campione.
FREQ. REL. = freq. ass./totale campione
La tabella dovrà riportare solamente informazioni con soggetti non mancanti.
Come costruire una tabella di frequenza quando ho una variabile quantitativa.
A partire dalla matrice, si devono raggruppare in una tabella delle frequenze le modalità e conteggiarle.
Tabella semplice per variabili quantitative discrete:
Nell'intestazione della prima colonna si inserisce la variabile, e lungo di essa si inseriranno i vari valori osservati nella tabella, in ordine crescente.
Nella colonna successiva calcolare la distribuzione della frequenza assoluta, conteggiando quante volte ogni valore si presenta nella tabella.
volte appaiono nella matrice i rispettivi valori; e nell'ultima casella di questa colonna inserire la frequenza assoluta totale. Calcolare poi la frequenza relativa e percentuale, come abbiamo già detto in precedenza, inserendo sempre, nell'ultima riga il totale. Quando si ha a che fare con dei conteggi, a volte, la variabile indicatore di nessun evento (indicata quindi con 0), va esclusa nel calcolo; ad esempio, considerando la variabile quantitativa discreta "n° di eventi avversi", viene chiesto qual è la frequenza percentuale di avere avuto al più 1 evento avverso. In questo caso dobbiamo considerare solamente la % di soggetti che hanno avuto 1 evento avverso, sottraendo a questa la % dei soggetti che non hanno presentato eventi avversi (associati al valore 0 della variabile). Tabella semplice per variabili quantitative continue. Sempre partendo dalla matrice dati, raccolgo le varie modalità relative alla variabile che mi interessa.Per poter costruire una tabella. In caso di variabili quantitative continue, si avranno numerose modalità; si potrà costruire una tabella molto lunga, oppure sintetizzare la variabile in certe classi, per ottenere un risultato comparabile con quello di una variabile qualitativa.
REGOLE PER LA COSTRUZIONE DELLE CLASSI MODALI:
- Devono avere la stessa ampiezza, ovvero contenere lo stesso numero di valori. Il valore inferiore di ognuna delle classi dovrà essere incluso, e quello superiore escluso. Es. per la variabile età costruisco le seguenti classi: [15-18); [18-21); ecc. Con la parentesi quadra, indichiamo un valore compreso nella classe, e con la tonda un valore escluso.
APPUNTI A CURA DI MARIONCINI GAIA
TABELLE DOPPIE. Ci permettono di sintetizzare più informazioni, con un unico strumento.
Tabella doppia per variabili qualitative.
Genere | Diabete (si) | Diabete (no) | Totale |
---|---|---|---|
M | 4/6 | 2/6 | 6 |
F | 4/5 |
1/5 5Totale 8 3 11
Le celle evidenziate all'interno della tabella, indicano le frequenze congiunte, ovvero il numero di soggetti che presentano quelle due caratteristiche (es. maschio con diabete e maschio senza diabete); e i totali sono detti marginali.
In queste tabelle si hanno 2 andamenti:
- orizzontale. riferendosi all'esempio sopra riportato, quindi una richiesta di frequenza entro il genere della distribuzione del diabete
- verticale, una richiesta di frequenza entro la variabile diabete, della distribuzione del genere.
Quando si vuole indagare una distribuzione, occorre capire qual è il gruppo di riferimento, che in questo caso ne abbiamo 3 possibili (campione totale, entro variabile di riga, entro variabile di colonna); da cui si possono costruire 3 frequenze.
1- frequenza percentuale dei soggetti femmine affette da diabete, senza concentrarmi sui sottogruppi genere e diabete/non diabete, quindi considerando l'intero campione.
possiamocosì calcolare la frequenza % delle femmine con diabete: 4/11 100= 36% Sul campione totale, il 36% di femmine è affetta da diabete. 2- confrontare le distribuzioni della variabile diabete all'interno del genere: Nel campione maschile: 4/6 100= 67% è affetto da diabete, mentre 2/6 100= 33% no. Nelle campione femminile: 4/5 100= 80% è affetta, mentre 1/5 100= 20% no. 3- Confrontare la diversa distribuzione di genere fra i malati e i non malati. Fra gli affetti di diabete: 4/8 100= 50% maschi; 4/8 100= 50% femmine Per i non affetti da diabete: 2/3 100= 67% maschi; 1/3 100= 33% femmine. I GRAFICI. Sono un importante strumento per riportare tutto ciò che abbiamo calcolato nelle tabelle (sia a singola che doppia entrata), in modo che sia chiaro il risultato e di impatto diretto per chi lo sta osservando. APPUNTI A CURA DI MARIONCINI GAIA Ogni tipo di variabile deve esseresintetizzata con il grafico opportuno...Per le variabili qualitative , possiamo utilizzare:
- DIAGRAMMA A BARRE O COLONNE. è formato da barre distanziate, di altezza differente in base alla frequenza assoluta della modali
- DIAGRAMMA CIRCOLARE O AREOGRAMMA Per le variabili quantitative , possiamo utilizzare gli ISTOGRAMMI , composti da barre unite , a differenza del diagramma.
analisi dei dati: indici di posizione e di distribuzioneMISURE DI POSIZIONE . Permettono di sintetizzare con un unico valore numerico le caratteristiche che si sono raccolte dalla variabile. Le più utilizzate sono:
- moda , è il valore della variabile che si presenta con la maggior frequenza; in alcuni casi può non esistere, nel caso in cui le frequenze assolute siano uguali per tutte le variabili; in altri ne può esistere più di una (distribuzione bimodale), ad esempio quando individuiamo più modalità di una variabile con
La frequenza più alta, e generalmente le due modalità con alta frequenza assoluta sono separate da un valore inferiore, da uno stacco, che crea un secondo picco. In alcuni casi, può coincidere con la media e la mediana, e quindi la variabile avrà una distribuzione simmetrica. Nel momento in cui osserviamo una modalità quantitativa non nel suo valore originale, ma sintetizzato in classi, la classe con la frequenza più alta, sarà definita classe modale. Quando i valori vengono raggruppati in classi, non si ha la certezza che, nella classe modale, sia contenuto il valore modale della variabile in continuo. La moda, è utilizzabile per qualunque tipo di variabile.
Utilizzando il tag strong:La frequenza più alta, e generalmente le due modalità con alta frequenza assoluta sono separate da un valore inferiore, da uno stacco, che crea un secondo picco. In alcuni casi, può coincidere con la media e la mediana, e quindi la variabile avrà una distribuzione simmetrica. Nel momento in cui osserviamo una modalità quantitativa non nel suo valore originale, ma sintetizzato in classi, la classe con la frequenza più alta, sarà definita classe modale. Quando i valori vengono raggruppati in classi, non si ha la certezza che, nella classe modale, sia contenuto il valore modale della variabile in continuo. La moda, è utilizzabile per qualunque tipo di variabile.
erapportandola alla dimensione campionaria.∑∑ xx ii ==x n ∑ f i
Quando si ha a che fare con molte variabili, in particolari quantitative in modalità continua, la somma delle frequenze che nel caso precedente erano uguali a 1, in questo caso sono il conteggio di tutti i soggetti che ricadono in quella classe o hanno quella modalità. Perciò dobbiamo utilizzare la media pesata. Ogni modalità dev'essere quindi pesata (moltiplicata) per la sua frequenza.
∑∑ x fx f i ii i ==x n ∑ f i
APPUNTI A CURA DI MARIONCINI GAIA
Quando invece, si ha a che fare con variabili quantitative ricodificate in classi, e si vuole calcolare la media pesata, occorre innanzitutto trovare un valore centrale di classe, per ognuna di quelle che compaiono nella tabella.
estremo superiore + estremo inferiore
valore centrale di classe: =x 2k
in questo modo si calcola un valore di sintesi, per poter calcolare la media dei valori dentro la classe dellasta trovando il valore mediano sarà quella in cui la frequenza cumulata % supera il 50% ma non supera il 100%.raggiunge la frequenza cumulata % maggiore o uguale al 50%, è la classe mediana. La stessa cosa, può essere effettuata con la frequenza assoluta: la classe in cui, sommando le varie frequenze assolute, si raggiunge il valore calcolato con la formula per la posizione del valore mediano, è la classe mediana. MISURE DI DISPERSIONE. Danno una valutazione di quanto le osservazioni sono distanti, variabili fra loro, e questa variabilità viene calcolata sulla base delle misure di posizione. Le misure di dispersione maggiormente utilizzate sono: - varianza e deviazione standard. Permettono di valutare la distanza tra le osservazioni e la media. La varianza è