vuoi
o PayPal
tutte le volte che vuoi
Statistica applicata all'idrologia
Tutti i casi possibili, ovvero i dati, rappresentano la popolazione da cui si estrae un campione di dati/casi possibili.
La popolazione è una grandezza statistica non nota, mentre i dati del campione sono noti.
Un insieme di dati costituisce un campione, rappresentabile con:
- serie temporali
- istogrammi
Parametri che caratterizzano il campione
Data una variabile X è definito l'insieme dei dati da cui è stata estratta: popolazione della variabile X {x, X}.
Dalla popolazione viene estratto un campione [x₁, x₂, ..., xn].
Dato un campione possono essere calcolate varie statistiche:
- valore medio x̄ = (1/n) Σ xi
- probabilità p
- densità di probabilità p
- ampiezza del campione xmin ... xmax
- divisione del campione in classi (xmin, xmax) / num. classi
- ampiezza delle classi Δx = (xmax - xmin) / num. classi
- frequenze assolute di classe fai= num. valori presenti all'interno della classe
- frequenza relativa di classe frk = fak / n
- densità di frequenza fk = fk / Δx
Inferenza Statistica
L'inferenza statistica (o statistica inferenziale) è il procedimento per cui si inducono le caratteristiche di una popolazione dall'osservazione di una parte di essa, detta campione, selezionato solitamente mediante un esperimento casuale (aleatorio). Dal punto di vista filosofico si tratta di tecniche matematiche per quantificare il processo di apprendimento tramite l'esperienza.
Si considerano esempi assai semplici di insiemi di n che possono venire interpretati come n realizzazioni indipendenti di un esperimento di base, nelle medesime condizioni.
Dal momento che si considera un esperimento casuale si conviene il calcolo delle probabilità e secondo questo, noto il processo di generazione dei dati sperimentali, si è in grado di valutare la probabilità dei diversi possibili risultati di n esperienze.
Selezionando un campione, l'esperimento dei dati sperimentali non è in modo completo e le tecniche statistiche tendono a rilevare le caratteristiche di tale popolazione delle osservazione dei dati sperimentali di base.
Il processo sequenziale va, dalla formulazione delle conclusioni relative ad una popolazione, verso basi di confronto di osservazioni di osservazioni estratte a caso dalla popolazione.
Altri indicatori di posizione (oltre al valore medio) sono:
- modo x0, ovvero il valore più frequente
- mediano x1, il valore dei dati tale per cui il 50% degli stessi ha valori superiori (inferiori) ad essi
Assegnato l'insieme dei dati x1, x2, ..., xn ∈ (xi) si può individuare una distribuzione cumulativa dei dati, un valore che è stato estratto l'insieme xi, ordinato in modo crescente degli stessi dati.
La distribuzione cumulata può essere illustrata attraverso la curva di frequenza.
Il valore di ordinata indicata dalla curva si dice:
- Frequenza di non superamento F(x ≤ xi) numero di volte che il valore non viene superato
- Frequenza cumulata di superamento F(x > xi) numero di volte che il valore x si supera o eguaglia
Si identificano inoltre altre statistiche che ne sono indicatori:
- Si definisce il campo di variazione, range, come la differenze tra il valore più alto e il valore più basso della distribuzione.
Poiché p(x) = dy/dx si ha p(y) = df(y)/dy
Eseguo x = μ + σy e dy/dx = 1/σ
si ha: p(y) = dx/dy = 1/σ
P(y) = 1/√2π e-½y²
la forma canonica è: x⟶y=ax+b⟶(x-μ)/σ⟶(y-μ)/σ
Questa vale per la
distribuzione normale standardizzata, ovvero una
distribuzione normale con medio μ = 0 e deviazione
standard σ = 1.
GUMBEL: distribuzione F(x) di Gumbel
Tale distribuzione è solitamente utilizzata per modellare
la distribuzione del massimo (o del minimo) di un numero
di campioni d varie distribuzioni; questa è una distribuzione
di probabilità centrata a due parametri:
P(X ≤ x) = e-e-(x-μ)/λ
se y = x-μ(x - μ) nì ha P(y ≤ y) = e-e-y
inoltre p(x) = σ e-(x-μ(x)μ) e-e-(x-μ)/σ,
dove σ e μ sono parametri della distribuzione.
OSSERVAZIONE
P(y) = e-y e-e-y
Poiché mety = media = num eulero μ = 0.5772 e
σy² = varianza = π²/6 allora σy = √π²/6
Per tale σy = σxx = σ/√(nlogn ⟶ 1/√τ
Segue μx = μ(y) σx = 0,52 √π/6/σx
σx = μx / √π/6
Ne consegue che, per questo tipo di distribuzione, i
parametri relativi, e.g. μ, λ, possono essere stimati
come: μ = μ(x)⟶ 0.5772
σx = π/√6/√π/6
LOGNORMALE : Distribuzione Lognormale
Tale è la distribuzione di probabilità di una variabile
aleatoria X il cui logaritmo, logX, segue una distri-
buzione normale; le variabili casuale X di dice, quindi,
distribuita in modo lognormale e può essere visto come
una specie di cambio di coordinata.
Posto y = log x si ha P(x) = 1/√2π sx e-(logx-μx)²/σ²
dove μ e σ sono
parametri della distribuzione.
Nei caso di dati associati a variabili continue, comodamente esi-
eLOGNORM un = log μᵢ, l’effettuazione di una adatta-
mente gicolutica - τσ(a)
P(x) degli est oltre a 1) e in media può period
di adeguamento dei parametri di distribuzione
di compiere un errore di tipo 2, ovvero di accettare
l’ipotesi che sia vera anche se non lo è.
NB: Quando H0 è vera, si verifica un errore di 1o tipo se H0 è rifiutata; mentre quando H0 è falsa,
si verifica un errore di 2o tipo se H0 non è rifiutata.
Esistono quattro possibili risultati:
- tabella
TEST NON PARAMETRICO
Si supponga di avere un determinato numero di variabili
reali X1, X2, X3,..., Xn, indipendenti tra loro e di somma. ΣniXi, la quantità è definita che la funzione φ call density di probabilitá P(χ2 =)
dei valori k sulla riga e x sulla colonna si individuano
i valori critici.
χ2P(> χ < 2α) = 1-α, rappresenta la probabilità d’non
superamento, e α questa fa fare riferimento per l’eventuale validazione del test.
È, dunque, ora possibile procedere con il (test parametrico), dato un campione di ampiezza Ni,
- Si dividono i dati del campione in k classi... ni è
- l’effettiva frequenza (asserrato) della i-esima classe, ovvero
- il numero dei valori che ricadono nella classe
2
0, per ogni intervallo Δχ si associa una probabilità k x
della classe e si definisce Npi come il numero delle
osservazioni che dovrebbero ricadere nella i-esima
- Si confrontano i parametri test con χ2= (Ni-Npi)2
si coltiva avendo grado di libertà v... e così
- 1 individuarli i gradi di libertà, così definito :
χ
dei valori che estende la numerosità del campione assume distribuzione. X2
- perché per il test di avere un test (per X2<α2 >
- ...differenza ossia conoscenza probabilità teoriche