Anteprima
Vedrai una selezione di 7 pagine su 26
Tesina Probabilità e statistica - Biomasse Pag. 1 Tesina Probabilità e statistica - Biomasse Pag. 2
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Tesina Probabilità e statistica - Biomasse Pag. 6
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Tesina Probabilità e statistica - Biomasse Pag. 11
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Tesina Probabilità e statistica - Biomasse Pag. 16
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Tesina Probabilità e statistica - Biomasse Pag. 21
Anteprima di 7 pagg. su 26.
Scarica il documento per vederlo tutto.
Tesina Probabilità e statistica - Biomasse Pag. 26
1 su 26
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

ANALISI DELLA QUALITÀ DEI DATI

Analisi descrittiva ed esplorativa

I principali valori di interesse del campione in esame sono:

  • n1μ = Σx = Media campionaria → 143,54
  • in = 1iMediana campionaria → 146.2
  • n1Σ2( )= ❑ −μs x = Varianza campionaria → 261.42in−1 i=1
  • √n1s = Σ2( )❑ −μx = 16.17Deviazione standard → in−1 i=1

Media e mediana hanno valori molto vicini. Possiamo quindi capire che il campione in esame possiede una distribuzione approssimativamente normale.

Verifichiamo ulteriormente costruendo l'istogramma e il boxplot relativi ai dati in esame ricavati mediante l'utilizzo del software R:

Istogramma Prelievo Biomasse

15ycn 10euqfre 50 100 120 140 160 180 Milioni di tonnellate

Dall'istogramma possiamo notare una distribuzione dei dati a forma di 'campana' tipica dei campioni normali. Tuttavia si nota anche uno sbilanciamento a sinistra del campione in esame, infatti il valore della

energetici. Impatto delle biomasse sulle risorse energetiche

Come possiamo vedere dal grafico, le biomasse hanno un impatto quasi irrilevante sul totale delle risorse prelevate dal nostro Paese. La risorsa più utilizzata in Italia sono i minerali non energetici.

Descrizione dei metodi usati

Passiamo ora ad analizzare la serie storica secondo l'approccio classico. Si assume che una serie storica osservata sia il risultato della decomposizione di:

  1. Una sequenza completamente deterministica f(t), che costituisce la parte sistematica della serie
  2. Una sequenza di variabili casuali u(t) che rappresenta la parte stocastica della serie ed obbedisce ad una determinata legge di probabilità

Y = f(t) + ...

(t)tTale approccio prevede la decomposizione della parte deterministica della serie storica in esame in un insieme di componenti:
  • Trend (T)t
  • Ciclo (C)t
  • Stagionalità (S)t
  • Componente accidentale (ε)t
Andremo quindi a descrivere un modello di tipo additivo dato dalla somma di tutte le componenti appena elencate:

Y = T + C + S + εt

ANALISI PRELIMINARE DELLA STRUTTURA E DELL'ANDAMENTO DELLA SERIE STORICA

Riportiamo di seguito il grafico dell'andamento della serie storica nel tempo ricavato sia con il software Excel sia con R.

Dopo aver riportato i dati da Excel su R:

> biomasse <- ts(data=x,start=1951,end=2014,frequency=1)
> plot(biomasse)

Grafico R

Grafico Excel

Questo primo grafico mostra un trend che tendeva alla crescita fino agli anni '80 per poi cambiare verso un trend in decrescita fino al 2014.

Sempre con excel costruiamo una prima previsione dell'andamento futuro dei dati della serie in esame a partire dai dati grezzi noti.

Prelievo Biomasse (milioni di tonnellate) Previsione (Prelievo Biomasse (milioni di tonnellate)) Limite di confidenza inferiore (Prelievo Biomasse (milioni di tonnellate)) Limite di confidenza superiore (Prelievo Biomasse (milioni di tonnellate))
250.0 200.0 150.0 100.0
50.0 -50.0 59 67
75 79 87 95
07 15 23 27
51 55 63 71
83 91 99 03
11 19 19 19
19 19 19 19
19 19 19 19
19 19 19 19
19 19 19 19
19 20 20 20
20 20 20 20
20 20 20 20
20 20 20 20

DECOMPOSIZIONE

Trend-Ciclo

Andiamo ora a 'livellare' la nostra serie storica facendo uso del metodo delle medie mobili. Per fare ciò ci serviamo del software excel.

Media mobile Effettive Valore Previsione
180.0 160.0 140.0 120.0
100.0 80.0 60.0 40.0
20.0 -1 4 7
10 13 16 19
22 25 28 31
34 37 40 43
46 49 52 55
58 61
DatoIn blu osserviamo i dati reali della serie storica, in arancione la serie storica 'delineata' dai risultati delle medie mobili. Queste ultime sono state calcolate con un intervallo pari a 5. Trend Vogliamo per prima costruire un modello di regressione che ci consentirà di 'detrendizzare' la nostra serie storica. A tal fine ci serviamo del software statistico R grazie al quale potremo anche ottenere un grafico della serie senza il trend (serie iniziale - il trend di riferimento). Per individuare il modello di regressione adeguato andremo a costruire diversi modelli andando quindi a scegliere quello che si adatterà meglio ai nostri dati. Costruiamo, per iniziare, un modello di regressione lineare, uno quadratico e uno cubico. Modello lineare In R: Abbiamo definito x come vettore dati: > t<-1:length(x) > lm.lineare<-lm(x~t) > summary(lm.lineare) Il software restituisce: Call: lm(formula = x ~ t) Residuals: Min 1Q Median 3Q Max -38.68 -10.22

4.05 10.56 27.05

Coefficients:

Estimate Std. Error t value Pr(>|t|)
(Intercept) 152.7722 3.9404 38.771 <2e-16 ***
t -0.2975 0.1054 -2.822 0.0064 **

---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 15.58 on 62 degrees of freedom

Multiple R-squared: 0.1138, Adjusted R-squared: 0.09954

F-statistic: 7.964 on 1 and 62 DF, p-value: 0.006404

Modello quadratico:

In R:

> t2<-t^2
> lm.quadratico<-lm(x~t2)
>summary(lm.quadratico)

Il software restituisce:

Call:lm(formula = x ~ t2)

Residuals:

Min 1Q Median 3Q Max

-39.483 -9.175 3.044 8.597 24.401

Coefficients:

Estimate Std. Error t value Pr(>|t|)
(Intercept) 153.010938 2.625933 58.269 < 2e-16 ***
t2 -0.007089 0.001406 -5.041 4.28e-06 ***

---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 13.94 on 62 degrees of freedom

Multiple R-squared: 0.2907,

Adjusted R-squared: 0.2793

F-statistic: 25.42 on 1 and 62 DF, p-value: 4.283e-06

Modello cubico

In R:

> t3<-t^3
> lm.cubico<-lm(x~t3)
> summary(lm.cubico)
Call:
lm(formula = x ~ t3)
Residuals:
    Min      1Q  Median      3Q     Max 
-38.830  -5.877   1.783   7.864  22.335 
Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.523e+02  2.131e+00  71.49   <2e-16 ***
t3          -1.365e-04  2.093e-05  -6.52  1.45e-08 ***
--- 
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 12.75 on 62 degrees of freedom
Multiple R-squared: 0.4068, Adjusted R-squared: 0.3972 
F-statistic: 42.51 on 1 and 62 DF, p-value: 1.446e-08

Proviamo a costruire ulteriori modelli di regressione:

Modello lineare + quadratico:

In R:

> lm.B1<-lm(x~t+t2)
> summary(lm.B1)

Il software restituisce:

Call:
lm(formula = x ~ t + t2)
Residuals:
    Min      1Q  Median      3Q     Max 
-16.473  -5.121   0.428   3.204  13.639 
Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.523e+02  2.131e+00  71.49   <2e-16 ***
t            1.365e-04  2.093e-05   6.52  1.45e-08 ***
t2          -1.365e-04  2.093e-05  -6.52  1.45e-08 ***
--- 
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 12.75 on 62 degrees of freedom
Multiple R-squared: 0.4068, Adjusted R-squared: 0.3972 
F-statistic: 42.51 on 1 and 62 DF, p-value: 1.446e-08

119.88449 2.44722 48.99 <2e-16 ***t 2.69233 0.17373 15.50 <2e-16 ***t2 -0.04600 0.00259 -17.76 <2e-16 ***

---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.323 on 61 degrees of freedom

Multiple R-squared: 0.8563, Adjusted R-squared: 0.8516

F-statistic: 181.8 on 2 and 61 DF, p-value: < 2.2e-16

Modello lineare + cubico:

In R :> lm.B2<-lm(x~t+t3)> summary(lm.B2)

R restituisce:

Call:lm(formula = x ~ t + t3)

Residuals:Min 1Q Median 3Q Max-18.4394 -4.1675 0.4848 4.0602 16.4724

Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 1.280e+02 2.554e+00 50.14 < 2e-16 ***t 1.394e+00 1.277e-01 10.91 5.66e-16 ***t3 -4.471e-04 3.100e-05 -14.42 < 2e-16 ***

---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 7.478 on 61 degrees of freedom

Multiple R-squared: 0.7991, Adjusted

R-squared: 0.7925 F-statistic: 121.3 on 2 and 61 DF, p-value: < 2.2e-16 Modello lineare+quadratico+cubico In R: > lm.B3<-lm(x~t+t2+t3) > summary(lm.B3) Il software restituisce: Call: lm(formula = x ~ t + t2 + t3) Residuals: Min 1Q Median 3Q Max -14.699 -3.599 0.057 3.633 13.060 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.135e+02 3.160e+00 35.905 < 2e-16 *** t 3.833e+00 4.178e-01 9.174 5.04e-13 *** t2 -8.952e-02 1.487e-02 -6.019 1.14e-07 *** t3 4.464e-04 1.505e-04 2.967 0.00432 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.954 on 60 degrees of freedom Multiple R-squared: 0.8747, Adjusted R-squared: 0.8685 F-statistic: 139.6 on 3 and 60 DF, p-value: < 2.2e-16 L'ultimo modello di regressione costruito restituisce l'R^2 aggiustato di 0.8685.
Dettagli
Publisher
A.A. 2020-2021
26 pagine
1 download
SSD Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher erik9922 di informazioni apprese con la frequenza delle lezioni di Probabilità e statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università telematica Niccolò Cusano di Roma o del prof Drago Carlo.