Anteprima
Vedrai una selezione di 18 pagine su 81
Appunti statistica I Pag. 1 Appunti statistica I Pag. 2
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 6
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 11
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 16
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 21
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 26
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 31
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 36
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 41
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 46
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 51
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 56
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 61
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 66
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 71
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 76
Anteprima di 18 pagg. su 81.
Scarica il documento per vederlo tutto.
Appunti statistica I Pag. 81
1 su 81
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

La media geometrica

La media geometrica di un insieme di n valori x1, x2, … xn (xi > 0) di un carattere quantitativo X è data da:

Se il carattere X è rappresentato mediante una distribuzione di frequenza:

Differenza rispetto alla media aritmetica: la media aritmetica può essere calcolata per qualsiasi valore reale dato un insieme di valori reali. Non è così per la media geometrica, che può essere calcolata solo se ho un insieme di valori strettamente positivi. Infatti, potrebbe risultarmi un numero negativo sotto radice, non possibile da calcolare.

Proprietà della media geometrica.

  • La media geometrica gode della proprietà di Cauchy:
  • Il prodotto dei valori osservati è uguale al valore medio elevato numero di unità:

Per cui si può quindi dire che la media geometrica lascia invariato il prodotto dei valori osservati.

La media geometrica è sempre inferiore o uguale alla media aritmetica:

TRIMMED MEAN (medie troncate)

La trimmed mean è la media aritmetica calcolata su una fissata percentuale di valori centrali di un insieme di dati, in modo da eliminare l'influenza dei valori anomali.

Ad esempio, nella trimmed mean al 90%, si escludono il 5% dei valori più piccoli e il 5% dei valori più grandi.

Esempio: con valori del carattere (3, 5, 5, 6, 8, 8, 9, 150) la trimmed mean sarà ottenuta escludendo il valore più piccolo e il valore più grande.

7-11/03/20

LA MODA

La moda può essere calcolata per qualsiasi tipo di carattere (qualitativo o quantitativo).

Per caratteri qualitativi e quantitativi con modalità non in classi, la moda (o valore modale) è la modalità prevalente, cioè la modalità a cui corrisponde la frequenza più elevata.

Per caratteri quantitativi con modalità in classi, la moda è la classe (classe modale) a cui corrisponde la densità di frequenza più elevata.

Spesso si considera come moda il valore centrale della classe modale. Esempi: Risposte corrette al test: percentuale più elevata, che è 35, quindi la moda è pari ad 1. Studenti Erasmus: la frequenza assoluta maggiore è 168, quindi la moda è Lingue. Patrimonio delle persone più ricche al mondo: c’è una divisione in classi. Si guarda la densità di frequenza più alta, ossia 347, quindi la moda è la classe 1.0-2.5. 18 Considerazioni sulla moda.

  • La moda fornisce informazioni solo su una modalità del carattere, quella prevalente, e ignora le altre;
  • La moda dipende solo dalle frequenze;
  • La moda acquista validità solo se vi è una netta prevalenza di una modalità rispetto alle altre;
  • La moda non esiste se tutte le modalità hanno la medesima frequenza/densità o se queste sono molto simili;
  • Esistono distribuzioni bimodali o plurimodali, quando compaiono due o più
modalità che hanno la stessa frequenza che è la più elevata.
LA MEDIANA è la modalità presentata dall'unità centrale in un collettivo ordinato di valori.
Essa divide il collettivo in due sottoinsiemi di uguale numerosità: uno con modalità di ordine più basso e l'altro con modalità di ordine più alto.
Per questo la mediana è definita solo per caratteri quantitativi o qualitativi ordinabili. Se è sconnesso non si può calcolare la mediana, perché per farlo devo ordinare i caratteri in senso non decrescente.
Considerazioni sulla mediana.
  • La mediana non è sensibile alla presenza di valori anomali perché considera solo la/le unità centrali. Per questo si dice che la mediana è più robusta della media aritmetica, che invece risente dei valori anomali.
  • La mediana rende minima la somma degli scarti considerati in valore assoluto:
In sostanza: possodire che la metà dei valori è sotto la mediana, l'altra metà sopra. I PERCENTILI Per i caratteri con modalità ordinate i percentili sono quei valori che dividono la distribuzione in centoparti di uguale numerosità. I percentili sono pertanto 99. Il percentile di ordine p (0basso. Più del 50% dei bambini della sua età sono più alti di lui.

2) Conversione dei voti degli studenti Erasmus: i voti vengono convertiti sulla base della tabella in figura. La tabella mi dice che A è il voto preso dal 10% degli studenti migliori, B dal 25% degli studenti un po’ meno bravi, C è il voto centrale preso dal 30% e via dicendo… Per fare le conversioni vengono presi in considerazione i percentili.

QUARTILI: I percentili di uso più frequente sono il 25-esimo, il 50-esimo e il 75-esimo percentile, detti anche primo (Q1), secondo (Q2) e terzo quartile (Q3) che dividono la distribuzione in quattro parti di uguale numerosità (la mediana corrisponde al secondo quartile, Q2):

  • per Q1 si ha p = 0,25
  • per Q2 si ha p = 0,50 (è la mediana!)
  • per Q3 si ha p = 0,75

3 208 – 12/03/20

VARIABILITÀ ED ASIMMETRIA

VARIABILITÀ

Come gli indici di posizione, anche gli indici di variabilità

Permettono di analizzare in maniera sintetica le caratteristiche più importanti di una distribuzione. La media riesce a rappresentare bene una distribuzione se la maggior parte dei valori si collocano vicino ad essa. La variabilità di una distribuzione, definita solo per caratteri quantitativi, esprime la tendenza delle unità di un collettivo ad assumere modalità del carattere tra loro diverse. Mette in evidenza quanti valori osservati sono mediamente distanti dalla media.

Esempio: Questi studenti hanno dato tutti gli stessi 15 esami. Se si usa la media aritmetica per confrontare queste distribuzioni, non emergono differenze. In realtà si nota che gli studenti non sono uguali: con la variabilità mettiamo in luce questo aspetto. Un indice di variabilità mette in luce la differenza tra i valori osservati. Esso deve soddisfare tre requisiti:

  • deve assumere il valore zero se e solo se tutte le unità della distribuzione presentano
ugualemodalità del carattere (distribuzione degenere); deve aumentare all'aumentare della "diversità" tra le modalità assunte dalle varie unità; deve rimanere invariato se a tutti i valori osservati xi viene sommata la stessa quantità. LA VARIANZA (indice di variabilità) La varianza è definita come la media aritmetica degli scarti dalla media elevati al quadrato (devo elevare al quadrato perché quando faccio la somma degli xi meno la media ottengo 0). La varianza di n valori x1, x2, ..., xn è pari a: (il simbolo si chiama "sigma") Il numeratore è detto devianza: Osservazione: la varianza non è espressa nella stessa unità di misura dei valori della distribuzione, ma nell'unità di misura elevata al quadrato. Si può utilizzare perciò come indice di variabilità la deviazione standard o scarto quadratico medio che è espresso nella

stessa unità di misura del carattere: 21

La varianza di una distribuzione di frequenza è pari a:

Se le modalità sono raggruppate in classi si usa il valore centrale di classe cj. 9 – 18/03/20

Proprietà della varianza.

Varianza di una trasformazione lineare.È data da:

Con a, b costanti reali (sostituiscono xi). L’elevamento al quadrato di b si ha perché faccio xi meno la media al quadrato e quindi anche b in questo caso va al quadrato.

“a” scompare perché

Per la deviazione standard vale che: metto sotto radice b quadro var(X)

Uso il modulo perché la radice di b quadro è sia positiva che negativa, ma sotto radice serve un valore positivo.

Coefficiente di variazione.

Osservazione: la varianza e la deviazione standard sono indici assoluti di variabilità perché risentono dell’unità di misura e dell’ordine di grandezza dei dati.

Pertanto, il confronto della variabilità tra

collettivi diversi o caratteri diversi non risulta agevole. Per confrontare la variabilità di due distribuzioni (con media aritmetica > 0) può essere utilizzato il coefficiente di variazione:

Dove x è la media aritmetica. In questo modo riesco a fare il confronto perchè numeratore e denominatore sono espressi nella stessa unità di misura.

Il coefficiente di variazione è un numero puro (non ha unità di misura) e può essere usato per confrontare la variabilità quando:

  • i caratteri sono espressi in unità di misura differenti
  • i caratteri, pur avendo la medesima unità di misura, sono caratterizzati da intensità medie diverse

Un esempio di confronto di variabilità. Si considerino 9 industrie con dispositivo anti-inquinante di tipo A e 9 di tipo B: per vedere quale è migliore, utilizziamo la quantità di pulviscolo emessa. La distribuzione B presenta una maggior variabilità rispetto

o crescente, il campo di variazione è dato dalla differenza tra il valore massimo e il valore minimo: campo di variazione = valore massimo - valore minimo La deviazione media assoluta. La deviazione media assoluta è data dalla media dei valori assoluti delle differenze tra ciascun valore e la media aritmetica: deviazione media assoluta = (|valore1 - media aritmetica| + |valore2 - media aritmetica| + ... + |valoren - media aritmetica|) / n La varianza. La varianza è data dalla media dei quadrati delle differenze tra ciascun valore e la media aritmetica: varianza = ((valore1 - media aritmetica)^2 + (valore2 - media aritmetica)^2 + ... + (valoren - media aritmetica)^2) / n La deviazione standard. La deviazione standard è la radice quadrata della varianza: deviazione standard = radice quadrata della varianza Questi indici di variabilità sono utili per valutare la dispersione dei dati intorno alla media aritmetica e per comprendere la variabilità dei valori nella distribuzione.
Dettagli
A.A. 2019-2020
81 pagine
1 download
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher letiziaarmanni di informazioni apprese con la frequenza delle lezioni di Statistica I e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bergamo o del prof Caviezel Valeria.