Anteprima
Vedrai una selezione di 1 pagina su 9
Il contenuto si trova sul sito dell'Università.
Questa è un'anteprima a titolo informativo.
Media e varianze Pag. 1
1 su 9
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Calcolo della media e della varianza della variabile X

Per calcolare la media e la varianza della variabile X, possiamo utilizzare le seguenti formule:

Media (x̄) = Σ(xn) / n

Varianza (σ) = Σ((x - x̄)^2) / n

Alternativamente, la varianza può essere calcolata utilizzando la formula:

Varianza (σ) = Σ(xf - x̄)^2 / n

Nel caso in cui una variabile sia suddivisa in classi, la media e la varianza vengono calcolate sostituendo ad ogni classe il suo valore centrale. La radice quadrata della varianza si chiama deviazione standard.

Esercizi

1. Calcolo della media e della varianza della variabile X nelle tre seguenti situazioni:

x n f classi k
-5 7 -1 [−3, −2) 0.1
0 12 0 [−2, 0.5) 0.35
13 4 11 [0.5, 2) 0.42
1 1 15 [2, 5] 0.15

Soluzione:

Caso 1:

Media (x̄) = (7 * -5 + 12 * 0 + 4 * 13 + 1 * 1) / (7 + 12 + 4 + 1) = 1.58

Varianza (σ) = ((-5 - 1.58)^2 * 7 + (0 - 1.58)^2 * 12 + (13 - 1.58)^2 * 4 + (1 - 1.58)^2 * 1) / (7 + 12 + 4 + 1) = 51.33

Caso 2:

Media (x̄) = (7 * -5 + 12 * 0 + 4 * 13 + 1 * 1) / (7 + 12 + 4 + 1) = 1.58

Varianza (σ) = ((-1 - 1.58)^2 * 7 + (0 - 1.58)^2 * 12 + (11 - 1.58)^2 * 4 + (15 - 1.58)^2 * 1) / (7 + 12 + 4 + 1) = 22.2

50.64σ = x kkk=1 Caso 3 Poiché la variabile è suddivisa in classi, media e varianza verranno calcolate sostituendo ad ogni classe il suo valore centrale, chiamiamolo x: ka + a classi f x = k−1 kk k 2[−3, −2) 0.1 -2.5 [−2, 0.5) 0.35 -0.75 [0.5, 2) 0.4 1.25 [2, 5] 0.15 3.5 P Kx̄ = x f = 0.51k kk=1 P K2 2 2σ = x f − x̄ = 3.28kkk=1 2. La durata media di 100 telefonate ricevute ad un call center è pari a 2 minuti, la deviazione standard è pari a 0.5 minuti, mentre la durata mediana è pari a 1.5 minuti. • Si calcoli la media degli scarti quadratici delle osservazioni dalla mediana M e nX1 2(x − M e) in i=1 • Qual'è la proporzione minima delle telefonate che durano tra 1 e 3 minuti? • Qual'è la proporzione massima delle telefonate che durano meno di 1.4 e più di 2.6 minuti? Soluzione. Per le proprietà della media e della varianza si ha: P P n n 2 2 2 (x − x̄) + n(x̄ − M e)(x − M e) = i i i=1 i=1 3quindi possibile calcolare: nX X1 12 2 2[ (x - M e) ] = [ (x - x̄) + n(x̄ - M e) ] =i in ni=1 i=1P n 2 2(x - x̄) n(x̄ - M e)ii=1= + =n n2 2= σ + (x̄ - M e) =2 2= (0.5) + (2 - 1.5) = 0.5 La proporzione minima di telefonate che durano tra 1 e 3 minuti è pari a 2σ1 - = 0.75 2² con ² = 3 - x̄ = x̄ - 1 = 1 La proporzione massima di telefonate che durano meno di 1.4 minuti e più di 2.6 minuti è pari a 2σ = 0.69 2² con ² = 2.6 - x̄ = x̄ - 1.4 = 0.63. Se la durata media delle telefonate che facciamo giornalmente è di 5 minuti, con una deviazione standard di 3 minuti, quanto sarà il costo medio delle telefonate e la sua deviazione standard se paghiamo 5 centesimi al minuto con 10 centesimi di scatto alla risposta? Soluzione. Dato t̄ = 5, σ = 3, i costi sono espressi dalla relazione lineare c = t10 + 5t. Quindi il costo medio sarà: c̄ = 10 + 5 t̄ = 35; e

Poiché √2^2^2^225 = 15σ = 5 σ = 225, la deviazione standard sarà: σ =cc t3

Medie e varianze condizionate

Supponiamo di aver rilevato congiuntamente una variabile qualitativa sconnessa X ed una variabile quantitativa Y, ottenendo la distribuzione di frequenze doppia

4y ... y ... y1 k Kx n ... n ... n n1 11 1k 1K 1·.. .. .. .. ... . . . .x n ... n ... n nh h1 hk hK h·.. .. .. .. ... . . . .x n . . . n . . . n nH H1 Hk HK H·n . . . n . . . n n·1 ·k ·K

Allora la media marginale (o totale) della variabile Y si può ottenere sia attraverso la distribuzione marginale della Y

KX1ȳ = y nk ·kn k=1 P K1

che come media della distribuzione delle H medie condizionate

ȳ = y n ,h k hkk=1nh

Cioè HX1ȳ = ȳ n .h h·n h=1

Gli H - 1 segmenti che uniscono i punti (x , ȳ ) costituiscono la spezzata di regressione, che raffigura la dipendenza in media della variabile Y dalla X. Se X è una

variabile qualitativa, la spezzata di regressione puo' essere costruita solo codificando numericamente le modalità x.

La varianza marginale di Y può essere calcolata considerando la distribuzione marginale della Y:

σY = (y - ȳ) / n * ΣkYk / n

oppure come somma della varianza spiegata dalle medie condizionate (σ2) e della varianza residua (σ2),

σ2 = σ2 + σ2

dove:

σY = (ȳ - ȳ) / n * ΣhYh / n

σY = σ2 * ΣhWh / n

e dove le varianze condizionate sono date da:

σY = (y - ȳ) / n * Σhkh / n

Il rapporto di correlazione σ2 / σ2 misura la proporzione di varianza della Y, spiegata dalla X, ed è pari a 0 quando tutte le medie condizionate ȳ sono uguali tra loro, ed uguale ad 1 quando σ2 = σ2, ovvero quando tutte le varianze σ2 = 0. Diciamo che Y è

independentesono nulle. Quando ηcondizionate σ h Y |x2in media da X, mentre quando η = 1, diciamo che la dipendenza in mediaY |xdi Y da X e’ massima.

4 Esercizi

  1. La seguente tabella illustra la distribuzione del salario mensile percepitoda un numero di lavoratori dipendenti in aziende, classificate secondola loro localizzazione geografica

    [0, 800) [800, 1000) [1000, 2000) [2000, 5000]
    sud 23 14 9 3
    centro 7 19 29 8
    nord 5 21 30 34
  2. disegnare la spezzata di regressione

  3. calcolare σ e σB W

  4. calcolare il rapporto di correlazione

Soluzione.

Per disegnare la spezzata di regressione e per il calcolo della varianzaspiegata dalle medie condizionate e della varianza residua occorre cal-2colare la media ȳ della variabile Y e la varianza condizionata σ .h h 2n ȳ σ

[0, 800) [800, 1000) [1000, 2000) [2000, 5000] h. h h
sud 23 14 9 3 49 934.69 596143.27
centro 7 19 29 8 63 1450.79 748531.12
nord 5 21 30 34 90 2054.44 1354924.69
n 35 54 68 45

202.k 6

Dettagli
Publisher
A.A. 2010-2011
9 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi Roma Tre o del prof Lagona Francesco.