Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Analisi esplorativa
Elaborazione della variabile tempo Boxplot Analisi delle componenti principali Analisi della correlazione Regressione Discussione e conclusioni R script Introduzione Lo scopo di questo breve elaborato sarà quello di analizzare la qualità dell'aria della città di Taranto attraverso l'analisi dellaconcentrazione media giornaliera di NO₂. Nel corso di questa trattazione cercherò di verificare le ipotesi secondo cui le variazioni di tale concentrazione, regolamentata in Italia dal decreto legislativo 155 del 2010, che pone come valore limite 40 μg/m³, siano legate a fluttuazioni di numerose variabili di origine ambientale e antropica. Sito di studio Il sito di studio è localizzato nella parte sud-orientale della penisola italiana, nella regione della Puglia, tra le Murge e la fossa Bradanica. Taranto è una città costiera sviluppatasi nel golfo omonimo bagnato dalle acque del mar Ionio e delimitato dalle isole Cheradi. Nell'area tarantina sono presenti numerosi e diversificati elementi di pressione antropica, si hanno infatti: - fonti di natura civile, principalmente rappresentati da veicoli e sistemi di riscaldamento delle abitazioni; - industriali, legate ai settori petrolchimico e siderurgico; - commerciali, sebbene l'impatto diquest'ultima categoria sia meno rilevante di quanto ci si potrebbe aspettare data la natura prevalentemente militare del porto cittadino.Materiali e metodi
I dati utilizzati in questo elaborato provengono da sei centraline dislocate nell’area della città di Taranto. Sono disponibili le concentrazioni giornaliere di NO₂ (questi valori sono poi sintetizzati con media, mediana e massimo) dell’anno 2009, oltre a informazioni su numerosi parametri ambientali riportati da qui in avanti come segue in Tabella 1. Le analisi effettuate sono state realizzate tramite il software R Studio; in Tabella 1 accanto alle variabili, è riportato il nome con cui tali variabili sono state indicate nel software.
Sigla | Variabile |
---|---|
tmp | temperatura |
umr | umidità relativa |
pgg | pioggia totale |
rdz | radiazione solare |
prs | pressione |
vv | velocità del vento |
dv | direzione del vento |
data | data della rilevazione |
Tabella 1: Abbreviazioni dei dati disponibili
Executive summary
È stata condotta
È stata eseguita un'analisi delle componenti principali (PCA) per individuare le variabili più significative, a cui è seguita un'analisi di correlazione realizzata tramite grafici a dispersione, matrice di correlazione ed un test di correlazione di Pearson. Queste analisi hanno permesso di evidenziare i fattori ambientali maggiormente correlati con la variazione di concentrazione dell'agente inquinante e di evidenziare l'importanza di alcuni aspetti di natura temporale, come il giorno della settimana o il periodo dell'anno.
A seguito di queste analisi, sono stati
stimati i coefficienti di un modello di regressione lineare multipla (R-squared = 0.4803, Adjusted R-squared = 0.4626, p-value < 2.2e^-16). Il modello con AIC più basso (1196.98) è stato selezionato tramite procedura stepwise in entrambe le direzioni. L'analisi dei suoi residui mediante grafico a dispersione, test di normalità (QQplot e shapiro-wilks test -- W = 0.99007, p-value = 0.014) e istogramma ha permesso di verificare ulteriormente il modello stimato. Ciononostante l'autocorrelazione dei residui mostra la presenza di correlazione temporale.
Risultati Analisi esplorativa
Importato il dataset di nome "taranto", sono state ottenute le statistiche di base relative ai dati analizzati utilizzando i seguenti comandi:
summary(taranto) attach(taranto) sd(media) sd(tmp) sd(umr) sd(pgg) sd(rdz) sd(prs) sd(vv)
I risultati sono riportati nella tabella 2:
[NO₂] Variabili Ambientali Median Massi Media a mo tmp umr pgg rdz prs
Min | 1° Quart | Mediana | 3° Quart | Max | Media | Deviaz. | St. | |
---|---|---|---|---|---|---|---|---|
vv | 6.701 | 15.375 | 19.349 | 25.231 | 44.5 | 20.403 | 13.14 | 6.9080 |
4.5 | 13.282 | 16.907 | 22.334 | 39.5 | 17.781 | 12.38 | 6.536 | |
13 | 30 | 39 | 47 | 90 | 39.05 | 2.031 | 2 | |
3 | 11 | 15 | 23 | 30 | 16.68 | 5 | ||
28 | 51 | 62 | 71 | 86 | 60.78 | 8.527 | ||
0.0 | 0.0 | 0.0 | 0.8 | 121.6 | 3.72 | 6.450 | ||
0 | 2 | 7 | 15 | 43 | 9.423 | 0 | ||
987 | 1007 | 1011 | 1014 | 1027 | 1010 | |||
0.21° | 1.4 | 2.33° | 3.8 | 10.9 | 2.907 |
La maggior parte dei dati esaminati presenta una distribuzione relativamente asimmetrica, con valori massimi particolarmente marcati. La vicinanza tra media e mediana nei valori relativi alla concentrazione dell'NO₂ fa supporre la normalità di tali dati; sono state quindi analizzate le skewness e la curtosi delle variabili esaminate. A tale scopo è stato installato il pacchetto "moments" e sono stati utilizzati i comandi di seguito elencati:
- skewness(media)
- skewness(tmp)
- skewness(umr)
- skewness(pgg)
- skewness(rdz)
- skewness(prs)
- skewness(vv)
- kurtosis(media)
- kurtosis(tmp)
umr | pgg | rdz | prs | vv | |
---|---|---|---|---|---|
Skewness | 0.5631653 | 0.1427635 | -0.2882275 | 5.990148 | 1.074057 |
Kurtosis | 0.0859513 | -1.224649 | -0.7048266 | 45.29413 | 1.014018 |
Tab. 3: Skewness e Kurtosis
La Skewness o indice di asimmetria è un indicatore molto usato; partendo dalla distribuzione di frequenza di un qualunque fenomeno, la skewness fornisce l'indicazione di quanto questa distribuzione si concentri attorno alla propria media oppure si disperda a destra o a sinistra di questa. In particolare, quando la Skewness è < 0 il fenomeno tende a formare una gobba a destra della media, formando di conseguenza una coda allungata a sinistra; viceversa quando è > 0 la coda tende ad allungarsi a destra formando una gobba a sinistra della media. Assume invece valore zero quando la distribuzione è perfettamente centrata attorno alla propria media.
La curtosi o kurtosis, indica un allontanamento dalla normalità distributiva, rispetto alla quale si verifica un maggiore appiattimento (distribuzione platicurtica) o un maggiore allungamento (distribuzione leptocurtica). La sua misura più nota è l'indice di Pearson e il valore dell'indice corrispondente alla distribuzione normale gaussiana è 0; un valore minore di 0 indica una distribuzione platicurtica, mentre un valore maggiore di 0 indica una distribuzione leptocurtica; è possibile che alcuni indici non siano centrati in zero e quindi il valore ottenuto nel caso di normalità è 3. Come ipotizzato, la media di NO₂ non si discosta molto da una distribuzione gaussiana, contrariamente a quanto avviene per la pioggia totale, la radiazione solare e la velocità del vento che sembrano essere asimmetriche a sinistra e poco vicine alla normalità di distribuzione. La normalità di NO₂ è stata inoltre
essere utilizzato per testare l'ipotesi nulla che i dati provengano da una distribuzione normale. Se il valore p associato al test di Shapiro-Wilk è inferiore a un livello di significatività prefissato, si può rigettare l'ipotesi nulla e concludere che i dati non seguono una distribuzione normale.assumere valori da 0 a 1, e qualora il suo valore sia troppo piccolo, il test rifiuta l'ipotesi nulla che i valori campionari siano distribuiti come una variabile casuale normale.
I risultati del test di Shapiro-Wilks ottenuti per la NO₂ media (W = 0.97631 ; pvalue: 1.073e^-05) confermano tale ipotesi. Le istruzioni di R utilizzate, sono riportate di seguito:
- shapiro.test(taranto$media)
- qqnorm(taranto$media)
- qqline(taranto$media, col = "red")
Fig. 1: Q-Q plot delle concentrazioni medie di NO₂
Elaborazione della variabile tempo
Il biossido di azoto (NO₂) è un inquinante che viene normalmente generato a seguito di processi di combustione. In particolare, tra le sorgenti emissive, il traffico veicolare è stato individuato essere quello che contribuisce maggiormente all'aumento dei livelli di biossido d'azoto nell'ambiente. Altre importanti fonti di ossidi di azoto sono gli impianti termici, le centrali termoelettriche, la produzione dei
fertilizzanti azotati, la produzione di acido nitrico per ossidazione dell'ammoniaca e la fabbricazione degli esplosivi. L'NO₂ è un inquinante per lo più secondario, che svolge un ruolo fondamentale nella formazione dello smog fotochimico in quanto costituisce l'intermedio di base per la produzione di tutta una serie di inquinanti secondari pericolosi come l'ozono, l'acido nitrico e l'acido nitroso. Una volta formatisi, questi inquinanti possono depositarsi al suolo per via umida (tramite le precipitazioni) o secca, dando luogo al fenomeno delle piogge acide, con conseguenti danni alla vegetazione ed agli edifici. Si tratta inoltre di un gas tossico irritante per le mucose e responsabile di specifiche.