Gli errori nelle analisi chimiche
Per quanto riguarda la valutazione dei dati analitici possiamo dire che:
- Ogni misura fisica è affetta da un grado di incertezza.
- Non esistono metodi semplici per stimare con certezza assoluta la qualità di un risultato sperimentale.
- Il lavoro impiegato nella valutazione dei risultati è confrontabile con lo sforzo che è stato necessario per ottenerli.
Valutazione dei risultati analitici
Considerando che un’analisi non fornisce informazioni sulla variabilità dei risultati, si effettua solitamente una procedura analitica di un dato campione, una serie (replicati) da 2 a 5. Solitamente viene usato come risultato rappresentativo quello centrale, che dovrebbe essere quello più affidabile. Si usano molto spesso media e mediana.
Media: rappresenta il valore numerico ottenuto dividendo la somma di un set di misure ripetute per il numero di risultati del set.
Mediana: è il risultato centrale quando i dati sono ordinati in modo crescente o decrescente. Per un set di numeri pari, si usa la coppia centrale. La mediana è usata in un set di dati contenente un outlier, cioè un valore che differisce in modo significativo dal resto dei dati.
Precisione e accuratezza
Altri termini da introdurre per la valutazione dei dati analitici sono la precisione e l’accuratezza.
Precisione: descrive la riproducibilità dei risultati; può essere definita come una semplice ripetizione della misura sui campioni replicati.
Accuratezza: indica la vicinanza della misura al valore accettato e viene espressa dall’errore.
Metodi per esprimere precisione e accuratezza
Esistono diversi metodi per esprimere la precisione e sono:
- Deviazione standard
- Varianza
- Coefficiente di deviazione
La deviazione della media è un metodo comune per descrivere la precisione ed è semplicemente la differenza numerica fra il valore sperimentale e la media del set.
L’accuratezza è invece espressa in termini di errore assoluto o relativo; per quanto riguarda l’errore assoluto di una misura è la differenza tra il valore misurato ed il valore vero; invece, quello relativo è dato dall’errore assoluto diviso il valore vero, può essere espresso in %, in p.p.mille o p.p.milione.
Categorie di errori
Gli errori possono essere divisi in categorie:
- Errori sistematici (determinati)
- Errori casuali (indeterminati)
- Errori grossolani (outliers)
Errori sistematici
Gli errori sistematici: hanno una causa assegnabile ed un valore definito, spesso rende tutti i risultati di un set di misure ripetute, più alti o più bassi, e non alcuni più alti e altri più bassi. Gli errori sistematici inoltre introducono un il bias misura l’errore sistematico associato ad un’analisi.
Cause degli errori sistematici
Le cause degli errori sistematici sono molteplici e possono essere:
- Strumentali: tutti gli strumenti sono causa di questo tipo di errore, esempio pipette, burette e palloni, o anche strumenti elettronici o strumenti che non vengono calibrati in modo frequente.
- Di metodo: comportamento chimico o fisico non ideale dei reagenti, incompletezza di alcune reazioni ed instabilità di alcune specie.
- Personali: stima della posizione di un indice tra due tacche di divisione, il colore di una soluzione al punto finale di una titolazione o il livello di un liquido in una pipetta o buretta graduata.
Tipologie di errori sistematici
Questi errori possono essere suddivisi in costanti o proporzionali:
- Costanti: è un errore assoluto, sono indipendenti dalla quantità di campione da analizzare ma diventa importante al diminuire della quantità misurata, esempio perdita di composto per solubilizzazione.
- Proporzionali: sono dovuti alla presenza di contaminanti o interferenti nel campione.
Metodi per compensare gli errori sistematici
Per individuare e compensare gli errori sistematici possiamo usare diversi metodi:
- Analisi di campioni standard: con uso di materiali standard di riferimento che contengono uno o più analiti a livelli e concentrazioni note.
- Analisi indipendenti: deve essere completamente diverso dal metodo usato precedentemente poiché questo minimizza la possibilità che qualche fattore comune nel campione possa produrre gli stessi effetti in entrambi i metodi.
- Determinazione del bianco: intanto, tutti i passaggi sono eseguiti in assenza di campione, i risultati bianchi ottenuti sono usati come correzione alle misure del campione. Il bianco è una soluzione che contiene tutti i reagenti dell’analisi, volte sono usati anche per simulare la matrice del campione; la matrice è l’insieme di tutti i costituenti del campione.
- Variazione della quantità di campione: l’effetto dell’errore costante, diminuisce all’aumentare del valore della misura; quindi l’errore può essere spesso evidenziato variando la quantità di campione.
Gli errori casuali nelle analisi chimiche
Gli errori casuali si incontrano tutte le volte che un sistema di misura viene usato al massimo della sua sensibilità, i risultati così non saranno costanti ma fluttuano in maniera casuale intorno ad un valore medio. Le fonti di queste fluttuazioni non possono essere determinate poiché sono il risultato di migliaia di piccole incertezze. Gli errori casuali, inoltre, non possono essere eliminati dalle misure. Gli errori casuali possono essere trattati in modo statistico, solitamente usando una distribuzione gaussiana.
La curva di Gauss ha queste caratteristiche:
- Frequenza massima in corrispondenza dell’errore casuale nullo.
- Una simmetria intorno al massimo che indica che gli errori positivi e negativi hanno luogo con uguale frequenza.
- Un decremento esponenziale della frequenza con il crescere dell’entità dell’errore.
In statistica un numero finito di osservazioni, viene chiamato campione, che viene trattato come una piccola frazione di un numero infinito di osservazioni. Il numero teorico infinito viene indicato come popolazione.
La deviazione standard della popolazione σ, è indicata con σ che rappresenta una costante con un valore unico per ogni set di dati composto da un gran numero di misure. La varianza σ2, è indicata con σ2 ed è il quadrato della deviazione standard, la varianza totale è data, invece, dalla somma delle singole varianze. Per un piccolo numero di misure singole in un set di dati il valore calcolato dalla deviazione standard farà diminuire la sua riproducibilità e svilupperà un bias negativo, infatti esso tende ad essere più piccolo al diminuire del numero di misure.
Il parametro N gradi di libertà indica i gradi di libertà; quando N > 20 ed s e σ sono approssimativamente uguali vi sono due possibilità:
- Il metodo non implica un eccessivo consumo di tempo. Es. misura del pH.
- Il metodo implica un eccessivo consumo di tempo.
La dispersione o intervallo o range (w) è un altro termine per indicare la precisione di un insieme di risultati replicati; è la differenza tra il valore più grande e quello più piccolo dell’insieme.
Dati già calcolati e accuratezza
Per quanto riguarda dati già calcolati, dobbiamo avere informazioni sulla sua accuratezza attraverso tre metodi:
- Fornire un intervallo di fiducia del 90-95%.
- Riportare deviazione standard o coefficiente di variazione.
- Usare cifre significative.
Le cifre significative sono tutte cifre certe più la prima che è detta incerta. L’arrotondamento tramite cifre significative, deve seguire alcune regole:
- Trascurare tutti gli 0 iniziali.
- Trascurare tutti gli 0 finali purché non seguono una virgola decimale.
- Sono significative tutte le restanti cifre, inclusi gli 0 compresi tra le cifre diverse da 0.
- Uno 0 sempre circondato da altre cifre è significativo.
- Gli 0 che sono collocati prima del punto decimale non sono significativi.
Trattamento e valutazione dei dati statistici
Possiamo applicare formule di statistica alla valutazione dei dati, le applicazioni più comuni sono:
- Definire l’intervallo numerico attorno la media di un insieme di risultati replicati entro il quale è possibile aspettarsi di trovare con una certa possibilità, la media della popolazione. Questo intervallo è detto intervallo di fiducia IF ( ) o confidenza.
- Determinare il numero di misure replicate richiesto per assicurare che una media sperimentale rientri in un intervallo con un dato livello di probabilità.
- Stimare che la probabilità che (a) una media sperimentale e un valore vero o (b) che due medie sperimentali siano diversi.
- Determinare con una data probabilità se la precisione dei due insiemi di misura differisce.
- Confrontare le medie di più di due campioni per determinare se la differenza tra le medie sono reali o solo un errore casuale.
- Decidere con una certa probabilità se un apparente outlier sia il risultato di un errore grossolano.
Intervallo di fiducia
Per una media è l’intervallo di valori entro il quale ci si aspetta di trovare con una certa probabilità la media della popolazione; il valore vero della media non può essere determinato poiché richiederebbe un numero di misure prossimo all’infinito. La teoria statistica permette di porre dei limiti attorno ad una media sperimentale nei quali il valore vero cade con un certo grado di probabilità; sono detti limiti di fiducia.
La grandezza dell’intervallo di fiducia dipende dall’accuratezza di s, cioè da quanto noi pensiamo che la deviazione standard sia vicina alla vera deviazione standard. Se abbiamo ragione di credere che s sia un’ottima approssimazione di σ, allora, l’IF può essere più stretto rispetto a quando la stima di s è basata su due o tre replicati.
L’intervallo di fiducia si indica con: z = (x - µ)/σ. Dove z può essere sia negativo che positivo. Così il limite dell'indice di fiducia sarà dato da: µ = x ± zσ.
Per quanto riguarda la media di N misure; si usa l’errore standard della media al posto di σ, quindi: IF per µ = x ± z (σ/√N). I valori di z sono tabellati. Bisogna sapere che all’aumentare dell’IF desiderato, aumenti anche il valore di z. Per quanto riguarda l’intervallo di fiducia per σ sconosciuto, si fa riferimento a t, definito allo stesso modo di z, tranne che a σ si mette s.
Possiamo calcolare il limite di fiducia per la media x di N replicati che può essere derivata da t: IF per µ = x ± ts/√N.
Test statistici e ipotesi nulla
I test statistici che includono dei confronti tra due dati, si basano su un'ipotesi nulla. Per confrontare i risultati di metodo analitico con quello che è ritenuto essere il valore vero, possiamo calcolare la differenza tra x - µ dove x è la media sperimentale e µ la media della popolazione od il valore vero. Se la differenza osservata x - µ è minore di quella calcolata ad un dato livello di probabilità, l’ipotesi che x e µ siano uguali deve essere presa in considerazione. Il valore critico per il rigetto dell’ipotesi è basato sul t-test.
Per stabilire l’ipotesi nulla H0: µ = µ0 avremo:
- t-test campioni piccoli: t = (x - µ )/(s/√N)
- z-test campioni grandi: z = (x - µ )/(σ/√N)
Il t-test è utilizzato anche per le differenze nelle medie, in questo caso, utilizziamo l’ipotesi nulla il campione avrà una differenza osservata (x1 - x2) e sia il risultato di errori indeterminabili. Per testare questa ipotesi abbiamo bisogno di utilizzare il t-test statistico dato da: t = (x1 - x2)/scumulata √(N1 + N2)/(N1N2).
Il t-test statistico viene confrontato con il valore critico t ricavato dalla tabella per il particolare IF desiderato. Se il valore assoluto del t-test statistico è inferiore rispetto al valore critico, l’ipotesi nulla non è accettata e non ci saranno differenze significative tra le medie.
Esiste un altro metodo per l’analisi di un campione, ed è il t-test accoppiato, simile al t-test con l’eccezione che bisogna usare una coppia di dati; in questo caso la deviazione standard sarà la deviazione standard della differenza della media. t = (d – Δ0)/(sd/√N), dove Δ è la differenza della media e Δ0 è la differenza che spesso è = 0.
Per confrontare le varianze o le deviazioni standard di due popolazioni, si può usare il test-F, alla condizione che le popolazioni seguano una distribuzione Gaussiana. Il test-F è basato sull’ipotesi nulla che le varianze delle due popolazioni siano uguali: H0: σ12 = σ22.
Il test F è definito come il rapporto delle due varianze quindi: F = σ12/σ22 ed è calcolato e poi confrontato con il valore critico di F. L’ipotesi nulla è scartata se il test F differisce troppo da 1.
ANOVA e analisi della varianza
Per quanto riguarda l’analisi della varianza si può usare una procedura detta ANOVA che permette il confronto tra più di due medie di popolazione. Si ricavano le differenze delle medie delle popolazioni confrontandole con le varianze.
Per confrontare I medie, l’ipotesi nulla sarà: H0: µ1 = µ2 = µ3 = … µi. Nell’ipotesi alternativa avremo: Ha: almeno due valori di µ sono differenti.
ANOVA segue delle applicazioni e sono:
- C’è una differenza nei risultati di cinque analisti che determinano il Ca mediante metodo volumetrico?
- Quattro diverse composizione di un solvente hanno influenze differenti sulla resa di una sintesi chimica?
In entrambe le situazioni, le popolazioni presentano valori diversi di una caratteristica (analista; solvente), comune detta fattore i differenti valori del fattore sono chiamati livelli o gruppi (analista1, analista2…composizione1, composizione2…) i confronti fra le varie popolazioni, vengono esaurite da una risposta (Ca, resa della reazione).
Per calcolare il rapporto della varianza necessario per l’F test, si richiedono delle quantità dette: somme dei quadrati.
- La somma dei quadrati dovuti al fattore SQF (effetto del fattore).
- La somma dei quadrati dovuti all’errore SQE.
Le somme dei quadrati vengono usate per ottenere la variazione tra i gruppi e la variazione all’interno dei gruppi. La somma dei quadrati totale SQT è ottenuta dalla somma di SQF e SQE.
Dividendo la somma dei quadrati per i loro rispettivi gradi di liberà, possiamo ottenere le quantità che rappresentano le stime delle variazioni tra i gruppi e all’interno dei gruppi, chiamate: valori dei quadrati delle medie e sono definiti:
- QMF = SQF/I-1 Quadrato della media dei livelli del fattore.
- EQM = SQE/N-1 Errore del quadrato della media.
Se il fattore ha poca influenza, la varianza tra i gruppi dovrebbe essere piccola in confronto alla varianza dell’errore. In questo caso, i due quadrati delle medie dovrebbero essere quasi identici. Se, l’effetto del fattore è significativo, il QMF è più grande dell’EQM; quindi l’F sarà così calcolabile: F = QMF/EQM.
Se ANOVA indica differenze significative, esistono vari metodi per determinare quali medie sono significativamente diverse. Il più semplice è il metodo della minima differenza significativa (MDS), per un numero uguale di repliche si calcola: MDS = t [(2 * EQM)/N ]0,5 con t = N-1 (gradi di libertà).
Nel caso in cui un gruppo di dati contiene un outlier, bisogna decidere se rigettarlo o meno, questa scelta, può essere presa attraverso un metodo statistico detto Q-test. Il Q-test è la differenza tra il risultato più dubbio ed il risultato con il valore a lui più prossimo. Il rapporto risultante viene allora confrontato con i valori critici del quoziente di scarto per un certo livello di confidenza. Se Qexp > Qcrit, il risultato incerto può essere eliminato con il grado di confidenza specificato.
Campionamento, standardizzazione, calibrazione
Quantità del campione: usata per classificare il tipo di analisi eseguita; si divide in:
- Macroanalisi: campione con massa > 0,1g.
- Semimicroanalisi: tra 0,01 e 0,1g.
- Microanalisi: tra 10-4 e 10-2.
- Ultramicroanalisi: < di 10-4.
Campioni reali: l’analisi degli stessi è complicata dalla presenza della matrice del campione, la quale può contenere specie con proprietà chimiche simili all’analita. Tali specie possono reagire come l’analita, ovvero eluire da una colonna GC in tempi uguali. Ciò crea un’interferenza, se sono causate da specie estranee nella matrice, sono detti effetti della matrice.
Campionamento: processo tramite il quale viene acquisita una frazione rappresentativa del materiale. Questo passaggio limita l’accuratezza, inoltre è il processo mediante il quale si riduce la dimensione di una popolazione ad una quantità di materiale omogenea che può essere facilmente manipolata in laboratorio e la cui composizione è rappresentata dalla popolazione.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.