Anteprima
Vedrai una selezione di 4 pagine su 12
Elementi di statistica Pag. 1 Elementi di statistica Pag. 2
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Elementi di statistica Pag. 6
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Elementi di statistica Pag. 11
1 su 12
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Statistica applicata all'idrologia

Tutti i casi possibili, ovvero i dati, rappresentano la popolazione da cui si estrae un campione di dati/casi possibili.

La popolazione è una grandezza statistica non nota, mentre i dati del campione sono noti.

Un insieme di dati costituisce un campione, rappresentabile con:

  • serie temporali
  • istogrammi

Parametri che caratterizzano il campione

Data una variabile X è definito l'insieme dei dati da cui è stata estratta: popolazione della variabile X {x, X}.

Dalla popolazione viene estratto un campione [x₁, x₂, ..., xn].

Dato un campione possono essere calcolate varie statistiche:

  • valore medio x̄ = (1/n) Σ xi
  • probabilità p
  • densità di probabilità p
  • ampiezza del campione xmin ... xmax
  • divisione del campione in classi (xmin, xmax) / num. classi
  • ampiezza delle classi Δx = (xmax - xmin) / num. classi
  • frequenze assolute di classe fai= num. valori presenti all'interno della classe
  • frequenza relativa di classe frk = fak / n
  • densità di frequenza fk = fk / Δx

Inferenza Statistica

L'inferenza statistica (o statistica inferenziale) è il procedimento per cui si inducono le caratteristiche di una popolazione dall'osservazione di una parte di essa, detta campione, selezionato solitamente mediante un esperimento casuale (aleatorio). Dal punto di vista filosofico si tratta di tecniche matematiche per quantificare il processo di apprendimento tramite l'esperienza.

Si considerano esempi assai semplici di insiemi di n che possono venire interpretati come n realizzazioni indipendenti di un esperimento di base, nelle medesime condizioni.

Dal momento che si considera un esperimento casuale si conviene il calcolo delle probabilità e secondo questo, noto il processo di generazione dei dati sperimentali, si è in grado di valutare la probabilità dei diversi possibili risultati di n esperienze.

Selezionando un campione, l'esperimento dei dati sperimentali non è in modo completo e le tecniche statistiche tendono a rilevare le caratteristiche di tale popolazione delle osservazione dei dati sperimentali di base.

Il processo sequenziale va, dalla formulazione delle conclusioni relative ad una popolazione, verso basi di confronto di osservazioni di osservazioni estratte a caso dalla popolazione.

Altri indicatori di posizione (oltre al valore medio) sono:

  • modo x0, ovvero il valore più frequente
  • mediano x1, il valore dei dati tale per cui il 50% degli stessi ha valori superiori (inferiori) ad essi

Assegnato l'insieme dei dati x1, x2, ..., xn ∈ (xi) si può individuare una distribuzione cumulativa dei dati, un valore che è stato estratto l'insieme xi, ordinato in modo crescente degli stessi dati.

La distribuzione cumulata può essere illustrata attraverso la curva di frequenza.

Il valore di ordinata indicata dalla curva si dice:

  • Frequenza di non superamento F(x ≤ xi) numero di volte che il valore non viene superato
  • Frequenza cumulata di superamento F(x > xi) numero di volte che il valore x si supera o eguaglia

Si identificano inoltre altre statistiche che ne sono indicatori:

  • Si definisce il campo di variazione, range, come la differenze tra il valore più alto e il valore più basso della distribuzione.

Poiché p(x) = dy/dx si ha p(y) = df(y)/dy

Eseguo x = μ + σy e dy/dx = 1/σ

si ha: p(y) = dx/dy = 1/σ

P(y) = 1/√2π e-½y²

la forma canonica è: x⟶y=ax+b⟶(x-μ)/σ⟶(y-μ)/σ

Questa vale per la

distribuzione normale standardizzata, ovvero una

distribuzione normale con medio μ = 0 e deviazione

standard σ = 1.

GUMBEL: distribuzione F(x) di Gumbel

Tale distribuzione è solitamente utilizzata per modellare

la distribuzione del massimo (o del minimo) di un numero

di campioni d varie distribuzioni; questa è una distribuzione

di probabilità centrata a due parametri:

P(X ≤ x) = e-e-(x-μ)/λ

se y = x-μ(x - μ) nì ha P(y ≤ y) = e-e-y

inoltre p(x) = σ e-(x-μ(x)μ) e-e-(x-μ)/σ,

dove σ e μ sono parametri della distribuzione.

OSSERVAZIONE

P(y) = e-y e-e-y

Poiché mety = media = num eulero μ = 0.5772 e

σy² = varianza = π²/6 allora σy = √π²/6

Per tale σy = σxx = σ/√(nlogn ⟶ 1/√τ

Segue μx = μ(y) σx = 0,52 √π/6/σx

σx = μx / √π/6

Ne consegue che, per questo tipo di distribuzione, i

parametri relativi, e.g. μ, λ, possono essere stimati

come: μ = μ(x)⟶ 0.5772

σx = π/√6/√π/6

LOGNORMALE : Distribuzione Lognormale

Tale è la distribuzione di probabilità di una variabile

aleatoria X il cui logaritmo, logX, segue una distri-

buzione normale; le variabili casuale X di dice, quindi,

distribuita in modo lognormale e può essere visto come

una specie di cambio di coordinata.

Posto y = log x si ha P(x) = 1/√2π sx e-(logx-μx)²/σ²

dove μ e σ sono

parametri della distribuzione.

Nei caso di dati associati a variabili continue, comodamente esi-

eLOGNORM un = log μᵢ, l’effettuazione di una adatta-

mente gicolutica - τσ(a)

P(x) degli est oltre a 1) e in media può period

di adeguamento dei parametri di distribuzione

di compiere un errore di tipo 2, ovvero di accettare

l’ipotesi che sia vera anche se non lo è.

NB: Quando H0 è vera, si verifica un errore di 1o tipo se H0 è rifiutata; mentre quando H0 è falsa,

si verifica un errore di 2o tipo se H0 non è rifiutata.

Esistono quattro possibili risultati:

  • tabella
Rifiuto Non rifiuto H0 vera Errore di 1o tipo Decisione corretta H0 falsa Decisione corretta Errore di 2o tipo

TEST NON PARAMETRICO

Si supponga di avere un determinato numero di variabili

reali X1, X2, X3,..., Xn, indipendenti tra loro e di somma. ΣniXi, la quantità è definita che la funzione φ call density di probabilitá P(χ2 =)

dei valori k sulla riga e x sulla colonna si individuano

i valori critici.

χ2P(> χ < 2α) = 1-α, rappresenta la probabilità d’non

superamento, e α questa fa fare riferimento per l’eventuale validazione del test.

È, dunque, ora possibile procedere con il (test parametrico), dato un campione di ampiezza Ni,

  • Si dividono i dati del campione in k classi... ni è
  • l’effettiva frequenza (asserrato) della i-esima classe, ovvero
  • il numero dei valori che ricadono nella classe

2

0, per ogni intervallo Δχ si associa una probabilità k x

della classe e si definisce Npi come il numero delle

osservazioni che dovrebbero ricadere nella i-esima

  • Si confrontano i parametri test con χ2= (Ni-Npi)2

si coltiva avendo grado di libertà v... e così

  • 1 individuarli i gradi di libertà, così definito :

χ

dei valori che estende la numerosità del campione assume distribuzione. X2

  • perché per il test di avere un test (per X22 >
  • ...differenza ossia conoscenza probabilità teoriche
Dettagli
A.A. 2015-2016
12 pagine
SSD Ingegneria civile e Architettura ICAR/02 Costruzioni idrauliche e marittime e idrologia

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ValeFranchetto di informazioni apprese con la frequenza delle lezioni di Elementi di costruzioni e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Trento o del prof Franceschini Giulia.