replicati
I sono campioni, aventi all’incirca la stessa dimensione, analizzati esattamente nello stesso modo. I replicati variano da un
numero di due a 5.
media
La di due o più valori è la media aritmetica ed è la misura del valore centrale maggiormente usata.
mediana
La è il valore centrale di un insieme di dati che sono stati ordinati in ordine numerico. L’uso della mediana è particolarmente
vantaggioso quando un insieme di dati contiene un outlier, cioè un risultato che differisce significativamente dagli altri valori nell’insieme.
Un outlier può avere un effetto significativo sulla media dell’insieme ma non ha effetto sulla mediana.
da medio
voore
Distanza
>
-
precisione
La è una valutazione dell’accordo fra i risultati ottenuti nello stesso identico modo. Descrive la riproducibilità della misurazioni,
in altre parole descrive la vicinanza dei risultati ottenuti tutti nello stesso modo. Generalmente la precisione può essere determinata con
una semplice ripetizione della misurazione sui campioni replicati. Tre termini sono ampiamente usati per descrivere la precisione di una
serie di dati replicati: la deviazione standard, la varianza e il coefficiente di variazione. Questi tre termini sono una funzione di come il
singolo risultato xi differisce dalla media, cioè della deviazione standard dei dati della media di. i precisione
- di
accuratezza IXi -I
=
del
media vero
valore
distanza della
>
-
L’accuratezza rappresenta la vicinanza di un valore misurato rispetto al valore vero o accettato come tale. È espressa in termini di errore
assoluto o relativo.
Errore assoluto E:
• è la differenza fra il valore misurato e il valore vero. Il segno dell’errore assoluto indica se il valore in questione è più
alto (segno +) o più basso (segno -) del valore vero.
E Xv
Xi-Xv Valore vero
= =
Errore relativo Er:
• è l’errore assoluto diviso il valore vero. Esso può essere espresso in percento, in parti per mille o in parti per milione a
seconda della grandezza del risultato. In questo capitolo viene trattato l’errore relativo assoluto mentre nel prossimo l’errore relativo
casuale. Xi-Xv
Er %=
pot-partipernado
100 1 10ppt
= .
Xv
tipi di errori nei dati sperimentali:
Esistono diversi E
• Errori casuali o indeterminati: sono errori che influenzano la precisione di una misura. Maggiore è l’errore casuale, maggiore è la
dispersione dei dati intorno al valore medio -
• Errori sistematici o determinati: sono errori che influenzano l’accuratezza dei risultati
• Errore grossolano: generato dall’essere umano, è spesso grande e può generare un valore sia maggiore che minore rispetto al valore
vero. Gli errori grossolani sono responsabili degli outliers.
errori sistematici
Gli hanno un valore definito e una causa determinabile e, per misure replicate eseguite nello stesso modo, sono dello
stesso ordine di grandezza. Gli errori sistematici danno luogo ad un bias nei risultati di misura. Il bias ha un segno negativo se determina
un risultato più basso del valore vero e segno positivo in caso contrario. Esistono tre tipi di errori sistematici:
Errori strumentali:
• causati dal malfunzionamento degli strumenti di misura, da errata calibrazione o dall’uso non appropriato delle
condizioni di misura
Errori di metodo:
• sorgono in seguito a comportamento chimico o fisico non ideale dei sistemi analitici
Errori personali:
• sono dovuti a disattenzioni
Gli errori sistematici possono essere sia costanti che proporzionali, gli errori costanti sono indipendenti dalla grandezza del campione da
analizzare mentre quelli proporzionali aumentano o diminuiscono in proporzione alla quantità del campione.
Gli errori sistematici di metodo possono essere identificati tramite:
• Analisi di campioni standard
• Analisi indipendenti: un secondo metodo indipendente e affidabile puo essere utilizzato in parallelo con il metodo analitico che stiamo
valutando. Il metodo indipendente deve differire quanto più possibile da quello che è oggetto di valutazione in modo da minimizzare la
possibilità che qualche fattore comune nel campione produca gli stessi effetti in entrambi i metodi
• Determinazione del bianco: il bianco è una soluzione che contiene i reagenti e i solventi utilizzati in una determinazione ma non
l’analita. Quando possibile il bianco può contenere anche altri costituenti del campione in modo da simulare l’ambiente in cui si trova
l’analita, definito matrice del campione. L’analisi del bianco rivela errori dovuti alle interferenze dei contaminanti, dei reagenti e dei
contenitori utilizzati.
• Variazione della quantità di campione distanta dalla media
>
-
Generalmente, la maggior parte dei fattori che contribuiscono all’errore casuale non può essere identificata. Anche qualora si riescano ad
identificare le origini degli errori casuali, è impossibile quantificarli poiché la maggior parte di essi è così piccola da non poter essere
rivelata singolarmente. La sommatoria degli effetti delle singole incertezze provoca una fluttuazione casuale dei dati replicati intorno al
valore medio dell’insieme. -
> Distante dalla media
Immaginiamo una situazione in cui 4 piccoli errori si combinano per dare un errore totale. Assumiamo che ciascuna incertezza abbia
uguale probabilità di verificarsi e che ciascuna possa fare sì che il risultato finale sia maggiore o minore di una quantità fissa +-U. Solo una
combinazione porta a +4U, quattro combinazioni danno una deviazione +2U, sei danno una deviazione di 0U e una sola porta a -4U.
-
Questa distribuzione 1:4:6:4:1 è una misura della probabilità di deviazione di ciascuna grandezza.
Quando la stessa procedura viene applicata ad un numero molto grande di errori individuali, ne risulta una curva a campana chiamata
curva gaussiana curva normale dell’errore.
o
dispersione
La in un insieme di misure replicate è la differenza tra il valore più grande e quello più piccolo.
istogramma.
La distribuzione di frequenza dei dati origina un grafico a barre, o All’aumentare del numero delle misure, l’istogramma
assume la stessa forma della gaussiana che possiede la stessa media e la stessa deviazione standard dei dati dell’istogramma.
Una curva gaussiana o curva normale dell’errore è una curva che mostra una distribuzione simmetrica dei dati intorno alla media di un
insieme infinito di dati.
Trattamento statistico dell’errore casuale
popolazione campione
Una rappresenta l’insieme di tutte le misure di interesse per lo sperimentatore, mentre un è un sottoinsieme di
misure estratte dalla popolazione. Bisogna fare attenzione a non confondere il campione analitico con il campione statistico:
consideriamo quattro campioni di acqua presi dalla stessa fornitura ed analizzati in laboratorio per determinare il contenuto di calcio; i
quattro campioni analitici forniscono quattro misure appartenenti ad una medesima popolazione e quindi costituiscono un solo campione
statistico.
La curva gaussiana può essere descritta da un’equazione che contiene solo due parametri, la media della popolazione (μ) e la deviazione
standard (σ). media della
• La media del campione ( ) è la media aritmetica di un campione limitato preso da una popolazione di dati mentre la
*
popolazione è la media vera relativa alla popolazione. In assenza di errori sistematici, il valore della media della popolazione coincide
con il valore vero della quantità misurata. E
deviazione standard
• La è una misura della precisione di una popolazione di dati
C’è un altro tipo di curva normale in cui sulle ascisse troviamo il parametro z che rappresenta la deviazione di un risultato dalla media
della popolazione rispetto alla deviazione standard. M)
(X
z -
=
varianza.
Il quadrato della deviazione standard viene chiamato
sottesa
Il 68,3% dell'area ad una curva gaussiana di una popolazione di dati è relativo a valori compresi in un intervallo di una deviazione
standard (+-1 σ) intorno alla media μ. Inoltre, approssimativamente il 95,4% di tutti i dati ha un valore compreso nell'intervallo +-2 σ e il
99,7% in quello +-3 σ intorno alla media.
Se siamo in presenza di pochi dati, l’equazione che serve per calcolare la deviazione standard deve essere modificata, nasce per questo
deviazione standard del campione
la s. Si avrà quindi anche la varianza del campione s^2.
standard popolazione
Deviazione (Xi)
X
diz
si-
Ki- azione
media -
O -
S
=>
1
i = =
N
N
N 1 1 N 1
-
- -
Gradi Albertà
di
Se da una popolazione vengono prelevati diversi insiemi di misure replicate, ognuno contenente N misure, le medie di ogni insieme
errore
differiranno tra loro sempre meno all’aumentare di N. La deviazione standard corrispondente ad ogni media viene chiamata
standard della media Sm. =
Sm I
& +
il 2(
(X (Xi
- *
Scumulata
stima cumulata
La di s è una media pesata delle singole stime +...
: -
=
↳ stima insiemi
Numero
N1 Nz
N2
o tot
di +... -
+ -
deviazione standard relativa
Spesso si valuta la DSR il cui risultato è espresso in ppt (parti per mille) o in percentuale. La deviazione
standard relativa percentuale si è chiamata coefficiente di variazione CV.
2
(V
=* - %
DSR DSRipet pot
1000 100
= .
= .
Regole per determinare il numero di cifre significative:
1. Trascurare tutti gli zeri iniziali
2. Trascurare tutti gli zeri finali purché non seguano una virgola decimale
3. Sono significative tutte le restanti cifre, inclusi gli zeri compresi tra le cifre diverse da zero
somme differenze,
Per quanto riguarda e il risultato ha lo stesso numero di cifre decimali dell’addendo con il più piccolo numero di
posizioni decimali. 10 10
3.4 730 7
7 31
0020 =
+ + = .
. .
prodotti quozienti,
Nel caso invece di e il risultato deve essere arrotondato in modo tale da contenere tante cifre significative quante
erano quelle del numero di partenza con il più piccolo numero di cifre significative.
3
+
2 4 52
24 108 1
1
- =
, = .
0
100 4
. -
Considerando le incertezze: le incertezze relative associate a ciascuno di questi numeri sono 1/24, 1/452 e 1/1000. Poiché la prima
incertezza relativa è molto più grande delle altre due, anche l’incertezza relativa del risultato è pari a 1/24. L’incertezza assoluta è quindi:
1 risultato
08 04570 04
1 0 1.08
è
Il
=
=
. .
.
. 24
4 965
24 02 0 0965 0
1 96
0 04
0
040
esempio =
attro =
.
: . .
= = .
.
.
.
100 0 24
,
logaritmi antilogaritmi:
Se siamo in presenza di ed
• Nel logaritmo di un numero bisogna mantenere a destra della virgola dei decimali, un numero di cifre pari alle cifre significative del
numero originale
• Nell’antilogaritmo di un numero bisogna mantenere tante cifre quante sono quelle contenute a destra della virgola dei decimali nel
numero originale. arrotondati,
I risultati devono essere opportunamente un numero che termina con 5 si arrotonda in modo tale che il risultato finale termini
sempre con un numero pari. Per esempio 0,635–>0,64 mentre 0,625–>0,62.
di fiducia
L’intervallo IF per una media è l’intervallo di valori entro il quale ci si aspetta di trovare con una probabilità data la media μ della
popolazione. I suoi estremi sono chiamati limiti di fiducia. L’ampiezza dell’intervallo di fiducia è correlata alla stima della deviazione
standard del campione (s) in relazione alla deviazione standard della popolazione.
livello di fiducia
Il è la probabilità che il valore medio vero si trovi entro un intervallo dato. Spesso viene espresso in percentuale.
6 livello di significatività.
La probabilità che un risultato cada al di fuori dell’intervallo di fiducia è spesso chiamato
=z
IF X
susdo valore M
Se 5
Abbiamo un : = .
. =
IF
media N
di M
se assiamo una Misure : .
Gli intervalli di fiducia ricavati con la precedente formula si applicano solo se possiamo assumere che s sia una buona approssimazione di
σ (s—> σ). Se le limitazioni ci impediscono di eseguire sufficienti misure per assumere che s sia una buona stima di σ, si usa t.
t =
singola
se abbiamo misura
una : o
abbiamo
Se non
=
MFM
=
t
abbiamo misure
se : verifica
Ci sono casi in cui c’è la necessità di confrontare la media della popolazione μ con un lavoro noto μ0. Per fare ciò si usa una
statistica dell’ipotesi. Ci sono due esiti contraddittori che noi consideriamo in ogni verifica di ipotesi:
• L’ipotesi nulla H0, afferma che μ = μ0
• L’ipotesi alternativa Ha: se μ μ0, μ > μ0 e μ < μ0
≠
test z
Il si utilizza se è disponibile un grande numero di risultati e quindi quando s è una buona stima di σ.
1. Si stabilisce l’ipotesi nulla H0: μ = μ0
2. Si formula il test statistico: Mo
*
z -
= N
&:
3. Si stabilisce l’ipotesi alternativa Ha doppia coda
a
Test
>
-
3 coda
Test singola
a
test t
Il si usa per un piccolo numero di risultati.
1. Si stabilisce l’ipotesi nulla H0: μ = μ0
2. Si formula il test statistico: + campione
Test un
a
Mo
X
t -
= Va
S :
3. Si stabilisce l’ipotesi alternativa Ha media
la
La curva B è data da errori sistematici tra valore
ce differenza mo
vero
e il
>
-
↓
Accuratezza
Per determinare le differenze tra le medie di due insiemi di dati si utilizza il test t. Si suppone che l’analista 1 abbia ottenuto da N1 analisi
replicate un x1 e che l’analista 2 abbia ottenuto da N2 analisi replicate un x2. L’ipotesi nulla afferma che le due medie sono identiche e che
-
-
ogni differenza è il risultato di errori casuali μ1 = μ2. Mentre l’ipotesi alternativa afferma che μ1 μ2 e quindi si utilizza il test a doppia coda.
≠
Si assume in
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.