Anteprima
Vedrai una selezione di 10 pagine su 129
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 31
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 36
Anteprima di 10 pagg. su 129.
Scarica il documento per vederlo tutto.
Statistica Pag. 41
1 su 129
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Medie analitiche media aritmetica

Dato un insieme di n valori osservati x1, x2, x3... si definisce media aritmetica del carattere quantitativo X la somma dei valori osservati divisa per il numero n di osservazioni.

Il carattere deve essere per forza QUANTITATIVO. Si presuppone che la distribuzione sia unitaria.

Esempio: retribuzione mensile. Faccio la somma delle x e poi divido per n. Interpretazione: osserviamo che la media aritmetica, essendo un rapporto, indica quella parte del tot che spetterebbe a ciascuna unità qualora questa venisse suddivisa in n parti uguali.

La media coincide con la modalità del carattere che dovrebbe possedere ogni unità statistica se l'ammontare complessivo del carattere fosse ripartito in egual misura tra tutte le unità.

Quindi, facendo riferimento all'esempio precedente, se tutti i dipendenti avessero la stessa retribuzione mensile, questa sarebbe pari a 1740€.

Se nell'esame si chiede interpretazione deve...

essere fatta!!

Media aritmetica per distribuzioni di frequenza

Dato il carattere quantitativo X se conosciamo la relativa distribuzione di frequenze definiamo media aritmetica ponderata: dove K è il numero di modalità assunte dal carattere X.

La somma di: modalità x frequenze assolute e poi divido per il numero di osservazioni.

Quindi, sommatoria di K moltiplicata per nj e poi divido per il numero di osservazioni.

Se le frequenze sono relative, allora sommatoria di K x fj. In realtà in questo caso le fj sono già state divise per il numero di osservazioni. Quindi non serve calcolarlo nuovamente.

Se non avessi le frequenze avrei sommato i valori per tutte le volte in cui appare tale valore per la modalità presa in considerazione.

Esempio: numero di figli

Se usassimo le frequenze assolute:

Se utilizziamo le frequenze relative il risultato finale sarà lo stesso

Media aritmetica per distribuzione in classi

Non conosciamo con esattezza i valori

osservati ma solo la classe di appartenenza serve un'ipotesi sul valore da assumere come "rappresentativo" dell'intera classe. Il valore che consideriamo è il valore centrale della classe se ho uniformità delle unità nella classe. Cj = (estremo inf + estremo sup) / 2 Con K identifico il numero di modalità assunte dal carattere e cj è il valore centrale della classe j-esima. Quindi prendo tutti i centri delle classi e lo moltiplico per la frequenza assoluta e faccio la somma dei prodotti e successivamente divido per il numero di osservazioni. Se parto dalle frequenze relative, non servirà dividere per n. (L'ho già fatto!) Esempio: altezze 1) 2) Se tutte le persone del collettivo avessero avuto la stessa altezza, questa sarebbe 160,75. (INTERPRETAZIONE) Pregi e difetti media aritmetica: - è facile da calcolare - è semplice da interpretare - tende a correggere, annullando gli errori di misurazione - gode di

apprezzabili proprietà difetto risente in misura rilevante della presenza di eventuali outliers, ossia valori anomali della distribuzione (è poco robusta). Basta un valore molto diverso rispetto agli altri e fa sballare tutta la misurazione

PROPRIETÀ

  1. internalità: Il valore della media aritmetica è sempre compreso tra il valore più piccolo osservato e il valore più grande. Nei casi limite coincide con questi estremi. Non potrà mai essere al di fuori.
  2. invarianza: la media aritmetica, se sostituita a ciascuna delle singole modalità osservate, lascia invariata la somma delle modalità.
  3. Linearità: siano a e b due costanti. Se i valori x1 vengono trasformati nei valori yj = a + bxj, allora tra la media aritmetica delle yj e quella delle xj esiste la stessa relazione (lineare) ovvero:

ESEMPIO

Sapendo che il tasso di cambio tra dollaro ed euro è pari a 0,88$, calcolare il prezzo medio pagato da Carlo.

Indicare con x i...

Voglia dare uno sguardo oltre al centro della distribuzione, ci interessa avere anche un'idea di quanto diversi siano i valori assunti dalla variabile, ossia ci interessa avere una idea della variabilità del carattere.

Ci interessa avere anche un'idea di quanto diversi siano i valori assunti dalla variabile, ossia ci interessa avere una idea della variabilità del carattere. Per farlo, possiamo vedere come si muovono le osservazioni intorno al centro della distribuzione.

Studiare la variabilità di un carattere è importante perché:

  • Analizzare e misurare l'attitudine a variare di un fenomeno, rappresenta una delle finalità che si vuole perseguire con l'analisi statistica valore→intrinseco
  • L'impiego delle medie non è sufficiente a sintetizzare le informazioni rilevate sulla popolazione oggetto di studio, specialmente quando occorre confrontare tra di loro popolazioni diverse accuratezza della sintesi

Requisiti per gli indici di variabilità:

  1. Se almeno due osservazioni sono diverse tra di loro allora dev’essere >0
  2. Se tutte le osservazioni sono uguali tra di loro (carattere degenere), allora deve assumere un valore minimo.
  3. Se il carattere X è più variabile di del carattere Y, allora l’indice di variabilità di X dev’essere maggiore dell’indice di variabilità di Y.

CAMPO DI VARIAZIONE

Dato un insieme di n valori osservati x , x , .. x si definisce campo di variazione (range) la differenza tra il valore più grande e il valore più piccolo.

R= x – xn 1

Pregi:

  • È semplice da calcolare
  • È di immediata interpretazione (rappresenta l’ampiezza dell’intervallo in cui si è manifestato il fenomeno)

Difetti:

  • Dipende solo da due osservazioni e non tiene conto delle altre
  • È poco stabile in quanto estremamente sensibile agli outliers.

Ha un impiego limitato a poche

applicazioni (es: controllo statistico dellaproduzione)

Esempio con distribuzione unitaria

Esempio con distribuzione di frequenza:

Esempio con distribuzione in classi:

DIFFERENZA INTERQUARTILE

Rappresenta l'ampiezza dell'intervallo centrale (intorno alla mediana) nel quale si collocano il 50% dei valori. Tanto più è piccola tanto più la metà delle osservazioni risulterà addensata intorno alla mediana.

Dato un insieme di n valori osservati x1, x2, ..., xn, si definisce differenza interquartile la differenza tra il terzo e il primo quartile.

DI = Q3 - Q1

Pregio:

- È più stabile del campo di variazione perché non si basa sulle osservazioni estreme;

Difetto:

- Potrebbe essere nulla senza che il carattere sia degenere

Esempio con distribuzioni unitarie

Esempio con distribuzioni di frequenza

Esempi con distribuzioni in classi

BOX PLOT

Fornisce un'idea schematica d'insieme di dati (di una distribuzione) basata su quartili.

da 15,29 a 21,65, ovvero fino a 25;4. vanno disegnate esplicitamente le osservazioni più piccole di −3,55 o più grandi di 25 ⇒ in questo caso 30, 35, 40.Graficamente:

all'osservazione più grande tra quelle minori di Q3 +9, 81 = 22, 61, ovvero fino a 20;4. Non ci sono outliers.

Graficamente:

Esempio con due distribuzioni a confronto

Distribuzione di frequenze del carattere: numero figli, ci sono però due collettivi diversi

Graficamente:

Per misurare la variabilità, possiamo utilizzare la "distanza" delle osservazioni dal centro della distribuzione. Proviamo ad utilizzare la media per caratterizzare il centro della distribuzione. 2(xi - M)

Consideriamo lo scarto al quadrato: .

Perché il quadrato? "amplifica" le distanze grandi e "attenua" quelle piccole. Esempio: 10 = 100, 0.1 = 0.01.

Quindi, per costruire un indice di variabilità, possiamo costruire queste n quantità (per i = 1, . . . , n) e farne una media.

La varianza è la media dei quadrati degli scarti di ogni osservazione dalla media aritmetica

Esempio: varianza per 5 osservazioni, la media aritmetica è

M= 2,8

La varianza è:

Se abbiamo una distribuzione di frequenza:

La varianza è la media dei quadrati degli scarti di ogni osservazione della media aritmetica per la frequenza.

Esempio: ore di sonno per notte, le osservazioni sono n= 80, la media aritmetica M= 7,4

La varianza è:

Varianza con distribuzione in classi

Per il calcolo della varianza, possiamo fare ricorso alla formula operativa utilizzando la stessa strategia adottata per il calcolo della media da distribuzioni di frequenza, ovvero utilizzando il valore centrale di

Dettagli
Publisher
A.A. 2021-2022
129 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ____lisa____ di informazioni apprese con la frequenza delle lezioni di Modelli statistici per le decisioni aziendali e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Modena e Reggio Emilia o del prof Pelle Elvira.