Anteprima
Vedrai una selezione di 6 pagine su 22
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
1 su 22
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Tipi di grafici

DIAGRAMMA A TORTA

Si rappresenta la distribuzione di frequenza percentuale o assoluta di caratteri quantitativo discreto, continuo, qualitativo ordinabile e non ordinabile; se si ha una distribuzione di frequenza si può utilizzare il grafico a torta per qualsiasi tipo di dato. Non ha senso fare un grafico a torta con fette piccolissime, in tal caso si usa "altro" per rappresentare quelle minoranze.

CARTOGRAMMI

Sono grafici che rappresentano una cartina geografica (e non, vedi carte senato e camera) e rappresentano i dati mediante scale di colori o colori differenti, generalmente il colore più intenso indica maggiore presenza del carattere che si osserva.

GRAFICO LINEARE (diagrammi cartesiani)

Il grafico lineare ha senso principalmente quando si hanno dati di ordine cronologico. NON ha senso usare questo tipo di grafico per i caratteri quantitativi sconnessi. Bisogna mettere in x il tempo e in y il valore preso in considerazione.

ISTOGRAMMA

Si usa quando ha degli intervalli nei caratteri quantitativi.

caratteri discreti o continui, è necessario calcolare primal'ampiezza dell'intervallo e poi la densità facendo frequenza/ampiezza. Per disegnare l'istogramma sull'asse delle x si mettono gli intervalli che forniscono la larghezza del rettangolo relativo all'intervallo, sulla y si mettono i valori delle densità che forniscono l'altezza del rettangolo.

ESEMPIO DISCRETO

ESEMPIO CONTINUO

INDICI STATISTICI DI POSIZIONE

Gli indici statistici si dividono in:

  • Medie analitiche:
    • Media aritmetica (unica che studieremo)
    • Media geometrica
    • Media armonica
    • Media quadratica
    • Media di ordine r
  • Medie lasche (o di posizione)
    • Moda
    • Mediana
    • Quantili
      • Quartili
      • Percentili
      • Decili

MEDIANA ( secondo quartile)

Modalità posseduta dall'unità statistica che occupa la posizione centrale nell'elenco ordinato delle unità statistiche, si indica con Me.

NON posso osservare la mediale con caratteri

qualitativo, la mediana rappresenta la posizione centrale dei dati quando sono ordinabili. Per calcolare la mediana, è necessario ordinare l'intero set di dati in ordine crescente o decrescente. Quando viene richiesto di calcolare la mediana, è consigliabile fare la distribuzione di frequenza cumulata. Questo significa che si calcola la somma delle frequenze fino a un certo punto e si trova il primo valore che supera o è uguale al 50% del totale delle frequenze. Questo valore rappresenta la mediana. Se il numero di dati è dispari, la posizione mediana corrisponde a (n+1)/2, dove n è il numero totale di dati. Questo indica solo la posizione della mediana e non il valore effettivo dell'osservazione. Se il numero di dati è pari, ci sono due posizioni mediane: la posizione n/2 e la posizione (n/2)+1. In questo caso, se i due valori mediani sono diversi, si avranno due valori mediani nel caso qualitativo. Ricorda che la mediana rappresenta solo la posizione centrale dei dati e non fornisce informazioni sulla modalità o il valore effettivo dell'osservazione.

quantitativo sia discreto che continuo con n pari la mediana si calcola facendo la media deidue caratteri presenti nelle posizioni della mediana. La mediana non varia in base al valore dei caratteri all'interno della lista, è un valore solido.

MEDIA ARITMETICA

Si indica con x con una barra sopra

Con protocollo elementare

La media aritmetica per un protocollo elementare si calcola sommando tutti i caratteri tra loro e dividere per il numero di caratteri. Il valore che esce da questo calcolo non si arrotonda. Il risultato della sommatoria si chiama quantità complessiva di carattere → c. La media aritmetica è sempre c/n.

Con distribuzione di frequenza

Si moltiplica il valore osservato per il numero di volte che compare. Divido il risultato ottenuto per n.

ESEMPIO

Es.: in questo caso 147/63 = 2.01

Con distribuzione di frequenza con classi a intervalli

Si prende il valore centrale tra le due frequenze e si moltiplica quel valore per il carattere x con il cappello → è il

valore stimato

ESEMPIO

Es.: in questo caso 147/63 = 2.01

PROPRIETÀ DELLA MEDIA ARITMETICA

  • Identità di somma
  • Nullità della somma algebrica degli scarti dalla media aritmetica
  • La somma dei quadrati degli scarti dalla media aritmetica è un minimo
  • Equivarianza rispetto a trasformazioni lineari
  • La media è compresa tra la più piccola e la più grande modalità della distribuzione
  • Associatività

MODA

La moda si indica con Mt.

La moda è la modalità che si presenta con la massima frequenza (assoluta, relativa o percentuale)

La moda può essere calcolata con tutti i tipi di carattere.

Quando si ha il protocollo elementare si fa una distribuzione di frequenza

Moda con distribuzione di diversa ampiezza

In questo caso bisogna dividere le frequenze delle classi per la loro ampiezza e confrontare taliquozienti: la più elevata densità di frequenza individuerà la classe modale.

ESEMPIOw =

differenza tra gli estremi → densità = n / wi i i ESERCITAZIONE 1 QUARTILI Quando parliamo di mediana dividiamo il collettivo in 2 parti e prendiamo i/il valore/i centrali/e, con i quantili dividiamo invece il collettivo in 4 di pari ampiezza. I quartili sono 3 (perché ci sono 3 divisioni per avere 4 parti). Per i quartili bisogna prima di tutto ordinare i dati, dividere il collettivo per 4 e individuare i caratteri nei punti di divisione. Si indicano con: - Q1 → Quartile 1 - Q2 → Quartile 2 o Mediana - Q3 → Quartile 3 Per i quartili non si distinguono pari e dispari, Per calcolare i quartili i caratteri devono essere ordinabili CALCOLO CON PROTOCOLLO ELEMENTARE Primo quartile Pos Q1 = (n+1)/4 Con risultato -,5 trovo due risultati e faccio la media tra i due risultati, se non si può fare la media avrò 2 risultati come primo percentile. Terzo quartile Pos Q3 = [3(n+1)]/4 CALCOLO CON DISTRIBUZIONE DI FREQUENZA RELATIVA PERCENTUALE Se nella mediana (Q2)

cercavamo il 50% per il primo quartile si cerca il 25% e per il terzo quartile si cerca il 75%

BOX-PLOT

Deriva al calcolo dei quartili, si tratta di un grafico rappresentante una scatola alta al primo al terzo quartile con una riga in mezzo che rappresenta la mediana e due baffi uno superiore e uno inferiore per il calcolo del box-plot.

Per calcolare il box-plot sono necessari: i 3 quartili, il massimo, il minimo, e un calcolo collegato alla differenza interquartile (distanza tra il primo quartile e il terzo quartile).

Questo grafico si può fare solo con un carattere di tipo quantitativo.

In questo grafico i puntini sopra o sotto ai minimi sono considerati dati anomali ovvero che avvengono una volta sola e non vengono conteggiati come massimi o minimi

Minimo → Q0

Quartili → Q1, Q2, Q3

Massimo → Q4

La differenza interquartile (IQR) è la differenza tra il terzo e il primo quartile → Q3 - Q1

Baffo superiore Q3+1.5*IQR

Devo scegliere il valore più piccolo tra il

calcolo sopra e il massimo (Q4)
Baffo inferiore
Q1-1.5*IQR
Devo scegliere il valore più grande tra il calcolo sopra e il minimo (Q1)
Ci sono situazioni limite in cui il boxplot può non avere baffi, soprattutto quando ci sono pochi dati
CONFRONTI TRA DATI STATISTICI
DIVARIO RELATIVO
Per ogni unità del denominatore ho tot unità al numeratore
ESEMPI
Per ogni 100 sportivi ci sono 37,6 calciatori
VARIAZIONE RELATIVA
Ci si riferisce generalmente al tempo.
Serve a vedere l’aumento o la diminuzione nel corso del tempo di un determinato carattere
ESEMPIO
VARIABILITÀ
Il valore medio fornisce una sintesi della distribuzione di un carattere e spesso il valore rappresentato
non è mai rilevato tra i caratteri.
La variabilità è l’attitudine di un carattere quantitativo X ad assumere valori differenti tra le unità
componenti un insieme statistico.
Affianchiamo agli indicatori un altro valore che cerca di misurare la variabilità.
Se nonc'è variabilità (tutte le misure sono identiche) la misura di variabilità deve valere 0. Gli indicatori solitamente utilizzati possono essere divisi in 3 categorie:
  • Indicatori che misurano la diversità fra due termini della distribuzione o fra due quartili (intervallo di variabilità, differenza interquartile)
  • NON VERRÀ STUDIATO - Indicatori che misurano le disuguaglianze a due a due fra tutti i valori individuali
  • Indicatori che misurano la dispersione dei valori osservati x attorno a un valore medio (scostamenti medi)
Intervallo di variabilità I = x - x̄ / n - 1 L'intervallo di variabilità è dato dal massimo meno il minimo, questo intervallo risente molto di dati estremi. Differenza interquartile Iqr = x - x̄ = Q3 - Q1 / 3/4 - 1/4 La differenza interquartile può risultare 0. La differenza interquartile non si può calcolare se ho gli intervalli. VARIANZA Si utilizza il quadrato per avere sempre valori positivi.devianza si calcola facendo la somma di tutti i valori meno la media al quadrato. La varianza si calcola dividendo la devianza per n/2. La varianza si indica con σ (Sigma) al quadrato. La deviazione standard si calcola facendo la radice quadrata della varianza e si indica con σ. ESEMPIO Coefficiente di variazione CV = deviazione standard/media CURVA DI DENSITÀ Si tratta di un istogramma in cui le barre hanno una base sottilissima e l'altezza corrisponde alla densità, mettendo vicino questi rettangoli si crea una curva. La funzione di questa curva sta sempre sopra l'asse orizzontale e l'area della curva è 1. La curva di sinistra è una curva simmetrica, nel caso come questo in cui la curva è simmetrica sull'asse delle x si trovano sia la media che la mediana corrispondente al punto più alto. Nel caso la curva sia asimmetrica (a destra se la coda va verso destra come in questo caso, in alternativa a sinistra) come nel

secondo caso (Chi quadrato) media e mediana non corrispondono, la mediana divide sempre a metà l'area della curva

CURVA NORMALE

Nella curva normale la media è posta precisamente al centro, questo porta ad avere la probabilità di avere un soggetto minore o maggiore della media del 50%, se prendo tutti i dati e gli aggiungo un valore fisso anche la media risentirà dell'aggiunta di quel determinato valore e la curva si sposta a sinistra se sottraggo o a destra se aggiungo un determinato valore.

L'area della curva è sempre uguale a 1 quindi co

Dettagli
A.A. 2021-2022
22 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher lollo.dellorto di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Lubisco Alessandro.