Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
ANALISI DELLA QUALITÀ DEI DATI
Analisi descrittiva ed esplorativa
I principali valori di interesse del campione in esame sono:
- n1μ = Σx = Media campionaria → 143,54
- in = 1iMediana campionaria → 146.2
- n1Σ2( )= ❑ −μs x = Varianza campionaria → 261.42in−1 i=1
- √n1s = Σ2( )❑ −μx = 16.17Deviazione standard → in−1 i=1
Media e mediana hanno valori molto vicini. Possiamo quindi capire che il campione in esame possiede una distribuzione approssimativamente normale.
Verifichiamo ulteriormente costruendo l'istogramma e il boxplot relativi ai dati in esame ricavati mediante l'utilizzo del software R:
Istogramma Prelievo Biomasse
15ycn 10euqfre 50 100 120 140 160 180 Milioni di tonnellate
Dall'istogramma possiamo notare una distribuzione dei dati a forma di 'campana' tipica dei campioni normali. Tuttavia si nota anche uno sbilanciamento a sinistra del campione in esame, infatti il valore della
energetici.Come possiamo vedere dal grafico, le biomasse hanno un impatto quasi irrilevante sul totale delle risorse prelevate dal nostro Paese. La risorsa più utilizzata in Italia sono i minerali non energetici.
Descrizione dei metodi usati
Passiamo ora ad analizzare la serie storica secondo l'approccio classico. Si assume che una serie storica osservata sia il risultato della decomposizione di:
- Una sequenza completamente deterministica f(t), che costituisce la parte sistematica della serie
- Una sequenza di variabili casuali u(t) che rappresenta la parte stocastica della serie ed obbedisce ad una determinata legge di probabilità
Y = f(t) + ...
(t)tTale approccio prevede la decomposizione della parte deterministica della serie storica in esame in un insieme di componenti:- Trend (T)t
- Ciclo (C)t
- Stagionalità (S)t
- Componente accidentale (ε)t
Y = T + C + S + εt
ANALISI PRELIMINARE DELLA STRUTTURA E DELL'ANDAMENTO DELLA SERIE STORICA
Riportiamo di seguito il grafico dell'andamento della serie storica nel tempo ricavato sia con il software Excel sia con R.
Dopo aver riportato i dati da Excel su R:
> biomasse <- ts(data=x,start=1951,end=2014,frequency=1) > plot(biomasse)
Questo primo grafico mostra un trend che tendeva alla crescita fino agli anni '80 per poi cambiare verso un trend in decrescita fino al 2014.
Sempre con excel costruiamo una prima previsione dell'andamento futuro dei dati della serie in esame a partire dai dati grezzi noti.
Prelievo Biomasse (milioni di tonnellate) | Previsione (Prelievo Biomasse (milioni di tonnellate)) | Limite di confidenza inferiore (Prelievo Biomasse (milioni di tonnellate)) | Limite di confidenza superiore (Prelievo Biomasse (milioni di tonnellate)) |
---|---|---|---|
250.0 | 200.0 | 150.0 | 100.0 |
50.0 | -50.0 | 59 | 67 |
75 | 79 | 87 | 95 |
07 | 15 | 23 | 27 |
51 | 55 | 63 | 71 |
83 | 91 | 99 | 03 |
11 | 19 | 19 | 19 |
19 | 19 | 19 | 19 |
19 | 19 | 19 | 19 |
19 | 19 | 19 | 19 |
19 | 19 | 19 | 19 |
19 | 20 | 20 | 20 |
20 | 20 | 20 | 20 |
20 | 20 | 20 | 20 |
20 | 20 | 20 | 20 |
DECOMPOSIZIONE
Trend-Ciclo
Andiamo ora a 'livellare' la nostra serie storica facendo uso del metodo delle medie mobili. Per fare ciò ci serviamo del software excel.
Media mobile | Effettive | Valore | Previsione |
---|---|---|---|
180.0 | 160.0 | 140.0 | 120.0 |
100.0 | 80.0 | 60.0 | 40.0 |
20.0 | -1 | 4 | 7 |
10 | 13 | 16 | 19 |
22 | 25 | 28 | 31 |
34 | 37 | 40 | 43 |
46 | 49 | 52 | 55 |
58 | 61 |
> t<-1:length(x)
> lm.lineare<-lm(x~t)
> summary(lm.lineare)
Il software restituisce:
Call:
lm(formula = x ~ t)
Residuals:
Min 1Q Median 3Q Max
-38.68 -10.22
4.05 10.56 27.05
Coefficients:
Estimate | Std. Error | t value | Pr(>|t|) | ||
---|---|---|---|---|---|
(Intercept) | 152.7722 | 3.9404 | 38.771 | <2e-16 | *** |
t | -0.2975 | 0.1054 | -2.822 | 0.0064 | ** |
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 15.58 on 62 degrees of freedom
Multiple R-squared: 0.1138, Adjusted R-squared: 0.09954
F-statistic: 7.964 on 1 and 62 DF, p-value: 0.006404
Modello quadratico:
In R:
> t2<-t^2 > lm.quadratico<-lm(x~t2) >summary(lm.quadratico)
Il software restituisce:
Call:lm(formula = x ~ t2)
Residuals:
Min 1Q Median 3Q Max
-39.483 -9.175 3.044 8.597 24.401
Coefficients:
Estimate | Std. Error | t value | Pr(>|t|) | ||
---|---|---|---|---|---|
(Intercept) | 153.010938 | 2.625933 | 58.269 | < 2e-16 | *** |
t2 | -0.007089 | 0.001406 | -5.041 | 4.28e-06 | *** |
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 13.94 on 62 degrees of freedom
Multiple R-squared: 0.2907,
Adjusted R-squared: 0.2793
F-statistic: 25.42 on 1 and 62 DF, p-value: 4.283e-06
Modello cubico
In R:
> t3<-t^3 > lm.cubico<-lm(x~t3) > summary(lm.cubico) Call: lm(formula = x ~ t3) Residuals: Min 1Q Median 3Q Max -38.830 -5.877 1.783 7.864 22.335 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.523e+02 2.131e+00 71.49 <2e-16 *** t3 -1.365e-04 2.093e-05 -6.52 1.45e-08 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 12.75 on 62 degrees of freedom Multiple R-squared: 0.4068, Adjusted R-squared: 0.3972 F-statistic: 42.51 on 1 and 62 DF, p-value: 1.446e-08
Proviamo a costruire ulteriori modelli di regressione:
Modello lineare + quadratico:
In R:
> lm.B1<-lm(x~t+t2) > summary(lm.B1)
Il software restituisce:
Call: lm(formula = x ~ t + t2) Residuals: Min 1Q Median 3Q Max -16.473 -5.121 0.428 3.204 13.639 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.523e+02 2.131e+00 71.49 <2e-16 *** t 1.365e-04 2.093e-05 6.52 1.45e-08 *** t2 -1.365e-04 2.093e-05 -6.52 1.45e-08 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 12.75 on 62 degrees of freedom Multiple R-squared: 0.4068, Adjusted R-squared: 0.3972 F-statistic: 42.51 on 1 and 62 DF, p-value: 1.446e-08
119.88449 2.44722 48.99 <2e-16 ***t 2.69233 0.17373 15.50 <2e-16 ***t2 -0.04600 0.00259 -17.76 <2e-16 ***
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.323 on 61 degrees of freedom
Multiple R-squared: 0.8563, Adjusted R-squared: 0.8516
F-statistic: 181.8 on 2 and 61 DF, p-value: < 2.2e-16
Modello lineare + cubico:
In R :> lm.B2<-lm(x~t+t3)> summary(lm.B2)
R restituisce:
Call:lm(formula = x ~ t + t3)
Residuals:Min 1Q Median 3Q Max-18.4394 -4.1675 0.4848 4.0602 16.4724
Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 1.280e+02 2.554e+00 50.14 < 2e-16 ***t 1.394e+00 1.277e-01 10.91 5.66e-16 ***t3 -4.471e-04 3.100e-05 -14.42 < 2e-16 ***
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 7.478 on 61 degrees of freedom
Multiple R-squared: 0.7991, Adjusted
R-squared: 0.7925 F-statistic: 121.3 on 2 and 61 DF, p-value: < 2.2e-16 Modello lineare+quadratico+cubico In R: > lm.B3<-lm(x~t+t2+t3) > summary(lm.B3) Il software restituisce: Call: lm(formula = x ~ t + t2 + t3) Residuals: Min 1Q Median 3Q Max -14.699 -3.599 0.057 3.633 13.060 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.135e+02 3.160e+00 35.905 < 2e-16 *** t 3.833e+00 4.178e-01 9.174 5.04e-13 *** t2 -8.952e-02 1.487e-02 -6.019 1.14e-07 *** t3 4.464e-04 1.505e-04 2.967 0.00432 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.954 on 60 degrees of freedom Multiple R-squared: 0.8747, Adjusted R-squared: 0.8685 F-statistic: 139.6 on 3 and 60 DF, p-value: < 2.2e-16 L'ultimo modello di regressione costruito restituisce l'R^2 aggiustato di 0.8685.