Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Tipi di grafici
DIAGRAMMA A TORTA
Si rappresenta la distribuzione di frequenza percentuale o assoluta di caratteri quantitativo discreto, continuo, qualitativo ordinabile e non ordinabile; se si ha una distribuzione di frequenza si può utilizzare il grafico a torta per qualsiasi tipo di dato. Non ha senso fare un grafico a torta con fette piccolissime, in tal caso si usa "altro" per rappresentare quelle minoranze.
CARTOGRAMMI
Sono grafici che rappresentano una cartina geografica (e non, vedi carte senato e camera) e rappresentano i dati mediante scale di colori o colori differenti, generalmente il colore più intenso indica maggiore presenza del carattere che si osserva.
GRAFICO LINEARE (diagrammi cartesiani)
Il grafico lineare ha senso principalmente quando si hanno dati di ordine cronologico. NON ha senso usare questo tipo di grafico per i caratteri quantitativi sconnessi. Bisogna mettere in x il tempo e in y il valore preso in considerazione.
ISTOGRAMMA
Si usa quando ha degli intervalli nei caratteri quantitativi.
caratteri discreti o continui, è necessario calcolare primal'ampiezza dell'intervallo e poi la densità facendo frequenza/ampiezza. Per disegnare l'istogramma sull'asse delle x si mettono gli intervalli che forniscono la larghezza del rettangolo relativo all'intervallo, sulla y si mettono i valori delle densità che forniscono l'altezza del rettangolo.
ESEMPIO DISCRETO
ESEMPIO CONTINUO
INDICI STATISTICI DI POSIZIONE
Gli indici statistici si dividono in:
- Medie analitiche:
- Media aritmetica (unica che studieremo)
- Media geometrica
- Media armonica
- Media quadratica
- Media di ordine r
- Medie lasche (o di posizione)
- Moda
- Mediana
- Quantili
- Quartili
- Percentili
- Decili
MEDIANA ( secondo quartile)
Modalità posseduta dall'unità statistica che occupa la posizione centrale nell'elenco ordinato delle unità statistiche, si indica con Me.
NON posso osservare la mediale con caratteri
qualitativo, la mediana rappresenta la posizione centrale dei dati quando sono ordinabili. Per calcolare la mediana, è necessario ordinare l'intero set di dati in ordine crescente o decrescente. Quando viene richiesto di calcolare la mediana, è consigliabile fare la distribuzione di frequenza cumulata. Questo significa che si calcola la somma delle frequenze fino a un certo punto e si trova il primo valore che supera o è uguale al 50% del totale delle frequenze. Questo valore rappresenta la mediana. Se il numero di dati è dispari, la posizione mediana corrisponde a (n+1)/2, dove n è il numero totale di dati. Questo indica solo la posizione della mediana e non il valore effettivo dell'osservazione. Se il numero di dati è pari, ci sono due posizioni mediane: la posizione n/2 e la posizione (n/2)+1. In questo caso, se i due valori mediani sono diversi, si avranno due valori mediani nel caso qualitativo. Ricorda che la mediana rappresenta solo la posizione centrale dei dati e non fornisce informazioni sulla modalità o il valore effettivo dell'osservazione.quantitativo sia discreto che continuo con n pari la mediana si calcola facendo la media deidue caratteri presenti nelle posizioni della mediana. La mediana non varia in base al valore dei caratteri all'interno della lista, è un valore solido.
MEDIA ARITMETICA
Si indica con x con una barra sopra
Con protocollo elementare
La media aritmetica per un protocollo elementare si calcola sommando tutti i caratteri tra loro e dividere per il numero di caratteri. Il valore che esce da questo calcolo non si arrotonda. Il risultato della sommatoria si chiama quantità complessiva di carattere → c. La media aritmetica è sempre c/n.
Con distribuzione di frequenza
Si moltiplica il valore osservato per il numero di volte che compare. Divido il risultato ottenuto per n.
ESEMPIO
Es.: in questo caso 147/63 = 2.01
Con distribuzione di frequenza con classi a intervalli
Si prende il valore centrale tra le due frequenze e si moltiplica quel valore per il carattere x con il cappello → è il
valore stimato
ESEMPIO
Es.: in questo caso 147/63 = 2.01
PROPRIETÀ DELLA MEDIA ARITMETICA
- Identità di somma
- Nullità della somma algebrica degli scarti dalla media aritmetica
- La somma dei quadrati degli scarti dalla media aritmetica è un minimo
- Equivarianza rispetto a trasformazioni lineari
- La media è compresa tra la più piccola e la più grande modalità della distribuzione
- Associatività
MODA
La moda si indica con Mt.
La moda è la modalità che si presenta con la massima frequenza (assoluta, relativa o percentuale)
La moda può essere calcolata con tutti i tipi di carattere.
Quando si ha il protocollo elementare si fa una distribuzione di frequenza
Moda con distribuzione di diversa ampiezza
In questo caso bisogna dividere le frequenze delle classi per la loro ampiezza e confrontare taliquozienti: la più elevata densità di frequenza individuerà la classe modale.
ESEMPIOw =
differenza tra gli estremi → densità = n / wi i i ESERCITAZIONE 1 QUARTILI Quando parliamo di mediana dividiamo il collettivo in 2 parti e prendiamo i/il valore/i centrali/e, con i quantili dividiamo invece il collettivo in 4 di pari ampiezza. I quartili sono 3 (perché ci sono 3 divisioni per avere 4 parti). Per i quartili bisogna prima di tutto ordinare i dati, dividere il collettivo per 4 e individuare i caratteri nei punti di divisione. Si indicano con: - Q1 → Quartile 1 - Q2 → Quartile 2 o Mediana - Q3 → Quartile 3 Per i quartili non si distinguono pari e dispari, Per calcolare i quartili i caratteri devono essere ordinabili CALCOLO CON PROTOCOLLO ELEMENTARE Primo quartile Pos Q1 = (n+1)/4 Con risultato -,5 trovo due risultati e faccio la media tra i due risultati, se non si può fare la media avrò 2 risultati come primo percentile. Terzo quartile Pos Q3 = [3(n+1)]/4 CALCOLO CON DISTRIBUZIONE DI FREQUENZA RELATIVA PERCENTUALE Se nella mediana (Q2)cercavamo il 50% per il primo quartile si cerca il 25% e per il terzo quartile si cerca il 75%
BOX-PLOT
Deriva al calcolo dei quartili, si tratta di un grafico rappresentante una scatola alta al primo al terzo quartile con una riga in mezzo che rappresenta la mediana e due baffi uno superiore e uno inferiore per il calcolo del box-plot.
Per calcolare il box-plot sono necessari: i 3 quartili, il massimo, il minimo, e un calcolo collegato alla differenza interquartile (distanza tra il primo quartile e il terzo quartile).
Questo grafico si può fare solo con un carattere di tipo quantitativo.
In questo grafico i puntini sopra o sotto ai minimi sono considerati dati anomali ovvero che avvengono una volta sola e non vengono conteggiati come massimi o minimi
Minimo → Q0
Quartili → Q1, Q2, Q3
Massimo → Q4
La differenza interquartile (IQR) è la differenza tra il terzo e il primo quartile → Q3 - Q1
Baffo superiore Q3+1.5*IQR
Devo scegliere il valore più piccolo tra il
calcolo sopra e il massimo (Q4)Baffo inferiore
Q1-1.5*IQR
Devo scegliere il valore più grande tra il calcolo sopra e il minimo (Q1)
Ci sono situazioni limite in cui il boxplot può non avere baffi, soprattutto quando ci sono pochi dati
CONFRONTI TRA DATI STATISTICI
DIVARIO RELATIVO
Per ogni unità del denominatore ho tot unità al numeratore
ESEMPI
Per ogni 100 sportivi ci sono 37,6 calciatori
VARIAZIONE RELATIVA
Ci si riferisce generalmente al tempo.
Serve a vedere l’aumento o la diminuzione nel corso del tempo di un determinato carattere
ESEMPIO
VARIABILITÀ
Il valore medio fornisce una sintesi della distribuzione di un carattere e spesso il valore rappresentato
non è mai rilevato tra i caratteri.
La variabilità è l’attitudine di un carattere quantitativo X ad assumere valori differenti tra le unità
componenti un insieme statistico.
Affianchiamo agli indicatori un altro valore che cerca di misurare la variabilità.
Se nonc'è variabilità (tutte le misure sono identiche) la misura di variabilità deve valere 0. Gli indicatori solitamente utilizzati possono essere divisi in 3 categorie:
- Indicatori che misurano la diversità fra due termini della distribuzione o fra due quartili (intervallo di variabilità, differenza interquartile)
- NON VERRÀ STUDIATO - Indicatori che misurano le disuguaglianze a due a due fra tutti i valori individuali
- Indicatori che misurano la dispersione dei valori osservati x attorno a un valore medio (scostamenti medi)
secondo caso (Chi quadrato) media e mediana non corrispondono, la mediana divide sempre a metà l'area della curva
CURVA NORMALE
Nella curva normale la media è posta precisamente al centro, questo porta ad avere la probabilità di avere un soggetto minore o maggiore della media del 50%, se prendo tutti i dati e gli aggiungo un valore fisso anche la media risentirà dell'aggiunta di quel determinato valore e la curva si sposta a sinistra se sottraggo o a destra se aggiungo un determinato valore.
L'area della curva è sempre uguale a 1 quindi co