Statistica

Appunti presi a lezione. Contengono spiegazione del professore e spiegazioni aggiuntive per capire meglio l'argomento. A fine di ogni capitolo contengono un piccolo riassunto per facilitare il …

Esame Chimica analitica

Facoltà Farmacia

Dal corso del Prof. Malegori Cristina

Università Università degli studi di Genova

Publisher Valentina2212

A.A. 2021-2022

54 pagine

Appunto

Vota 3,0 / 5 (1)

Scarica

Estratto del documento

LA COVARIANZA:

Es. Devo valutare la quantità di limone e arancia nel succo ace.

Include entrambe le variabili misurate, quindi dice come varia una varianza rispetto ad un'altra. 43

L’unità di misura dell’unione di due varianze risulta incomprensibile, per questo esiste il

coefficiente di correlazione, un numero adimensionale con estremi fissi, quindi una

standardizzazione.

Il valore della covarianza di per sé non è indicativo dell’entità della correlazione poiché dipende

dall’unità di misura delle variabili considerate. Il segno risulta, di contro, molto informativo.

IL COEFFICIENTE DI CORRELAZIONE: Numero che correla due varianze

Covarianza/ varianza delle x ∙ varianza delle y =>

r è adimensionale e può assumere valori compresi tra –1 e 1.

Tipologie di correlazione:

Il coefficiente di correlazione (r - detto anche coefficiente di correlazione di Pearson) è

adimensionale e può assumere valori compresi tra –1 e 1: il segno deriva della covarianza e quindi

può essere ugualmente interpretato, il valore assoluto esprime, invece, l’entità della correlazione

in una scala tra 0 e 1 (0 = minima correlazione, 1= massima correlazione).

!!!!Ricorda!!!= all’esame se ti chiede di disegnare un grafico di no correlazione=Disegno una

nuvola di punti senza correlazione (a caso) per r=0, quindi disegno figura in mezzo che deve essere

diversa da r=0.3

La regressione la faccia a r=1 o 0,8 e a r=-1,-0,8. 44

Gli istogrammi marginali:

Possiamo rappresentare una distribuzione bivariata in uno spazio ortogonale definito dalle due

variabili misurate X e Y. Ogni punto nel piano rappresenterà una coppia di dati xi yi e, quindi, il

risultato ottenuto da uno o più campioni analizzati. Gli istogrammi relativi alla distribuzione delle

due variabili X e Y, prese singolarmente, vengono definiti istogrammi MARGINALI.

Vedo uno spazio con la variabile x e y in uno

spazio ortogonale con una correlazione positiva

con r=0.3

Le linee blu laterali sono gli intervalli di fiducia.

I test bivariati e l’intervallo di fiducia congiunto

L’intervallo di fiducia bivariato (congiunto) non corrisponde all’intersezione tra gli intervalli di

fiducia univariati delle variabili X e Y ma è definito come sezione della campana di distribuzione

bivariata. Le ellissi isotetiche sono, quindi, i confini dell'intervallo di fiducia bivariato e cambiano

orientamento in accordo con la natura della correlazione tra le variabili X e Y.

Devo unire le variabili

per capire se il mio

dato è dentro o fuori al

limite.

L’intervallo di fiducia di

due variabili è

un’ellisse e non un

rettangolo.

Questo perché se guardiamo il nostro dato preso con variabili singoli risulta corretto ma con le

variabili congiunte risulta un out liner come nel grafico.

La probabilità bivariato:

Ricordando il parallelismo tra campione e popolazione e, dunque, tra frequenza e probabilità, è

possibile definire una distribuzione di probabilità bivariata caratterizzata da una forma a sezione

di campana centrata sul massimo assoluto dei dati.

L’intervallo di fiducia della distribuzione bivariata normale è la superficie che contiene il p% della

probabilità e che è delimitata da una ELLISSE ISOTETICA (linea che congiunge i punti con eguale 45

valore della densità di probabilità). In pratica, la campana viene sezionata orizzontalmente ad una

altezza definita in funzione della probabilità di fiducia scelta a priori.

Quindi, io taglio la testa alla mia distribuzione a campana e se la taglio solo la parte alta ho un

intervallo di fiducia più piccolo. Se taglio la mia campana bassa ho un intervallo di fiducia più

grande e una distribuzione tonda. Come ho scelto di tagliare la campana trovo un’ellisse più

piccolo o più grande; quindi, è influenza dalla correlazione dei miei dati se ben correlati avrà una

campana molto magra e viceversa.

CONCETTO: Io miei dati sono una correlazione di x e y, ho una campana piena di colonnine di

istogramma che esse mi dicono quante vote nella popolazione la correlazione di e y (combinate) e

così creo la mia campana in 3D.

Se mi danno un bicchiere e mi dicono di disegnare la campana io la disegno a seconda dei punti

che riempiono l’area del bicchiere.

Quindi trovo un’ellisse più grande o più piccolo facendo riferimento all’andamento bivariato.

Da correlazione a regressione:

In un sistema BIVARIATO, quando è presente correlazione tra due variabili è possibile modellarne

matematicamente la relazione al fine di predirne una a partire dalla conoscenza dell’altra. Tale

procedimento è noto come regressione univariata. 46

Strategie per il confronto tra metodi analitici:

VALUTAZIONE DEI MODELLI DI REGRESSIONE

Coefficiente di determinazione R :

Coefficiente positivo

Elevando ci mangiamo il segno

parametro molto abusato, che corrisponde al quadrato del coefficiente di correlazione (r) tra x e y.

È adimensionale e può assumere valori numerici compresi tra 0 e 1 (caso ritenuto ideale).

Quantifica quanto un modello di regressione si avvicina ai punti sperimentali.

A differenza di quanto spesso millantato, il parametro R NON indica:

• se il modello di regressione scelto (es. lineare) è quello più corretto

• se la scelta operata dei livelli di x è ottimale

• se esiste un nesso di causalità (rapporto causa-effetto) tra x e y VALUTAZIONE DEI MODELLI DI

REGRESSIONE. 2

Inoltre, ci sono molte situazioni di pessimi modelli i cui valori di R (va preso insieme alla retta e

non da solo) sono apparentemente buoni:

Ai fini di una valutazione dei modelli di

regressione, risulta molto

più informativa (per quanto meno usata)

rispetto a R l’analisi dei residui: 47

CONFRONTO TRA METODI ANALITICI

Si dosa con due metodi analitici diversi (metodo 1 e metodo 2) uno stesso analita in una serie di

campioni a concentrazioni diverse. I dati sono pertanto abbinati a coppie (matching pairs). Si vuole

verificare se i due metodi analitici forniscano risultati comparabili, oppure significativamente

diversi tra loro.

Questa tipologia di confronto è già stata affrontata, mediante applicazione di un test di Student

per dati accoppiati. Il test di Student, tuttavia, richiede che la variabile differenza (d) calcolata sia

una variabile random, esente da effetti deterministici.

Lo stesso confronto può essere effettuato (e

più appropriatamente) mediante un test

congiunto (bivariato) su intercetta (a) e

pendenza (b) della retta di regressione tra

metodo 1 (x) e metodo 2 (y).

Nel caso ideale (H0 ), infatti, i due metodi fornirebbero esattamente gli stessi risultati per tutti i

campioni analizzati: Metodo 2 = Metodo1 Tale relazione corrisponde alla retta y=x (bisettrice del

primo quadrante) nel piano. Ossia, deve essere contemporaneamente:

a = 0 ; b = 1

Per questo tipo di confronto, non può essere utilizzato il metodo di regressione dei minimi

quadrati, in quanto questo prevede che la x sia esente da errore. Si ricorre a metodi alternativi,

come il metodo di Passing-Bablok, regressione non parametrica che ammette che anche la x sia

affetta da errore, e fornisce risultati comparabili invertendo x e y (b’ = –1/b): 48

Per questo tipo di confronto, non può essere utilizzato il metodo di regressione dei minimi

quadrati, in quanto questo prevede che la x sia esente da errore. Si ricorre a metodi alternativi,

come il metodo di Passing-Bablok, regressione non parametrica che ammette che anche la x sia

affetta da errore, e fornisce risultati comparabili invertendo x e y.

Analisi del segnale:

COSA È UN SEGNALE?

Segnale = mezzo per codificare INFORMAZIONE

Informazione può essere CONSERVATIVA oppure un segnale si può TRASMETTERE

SEGNALI = «Oggetto specifico di una teoria dell’informazione [...] Unità di

trasmissione che possono essere computate quantitativamente indipendentemente

dal loro significato possibile.

L’eccitazione (es. fornendo calore, o ad un campo magnetico o

elettrico o gravitazionale) di un sistema genera un segnale che ci

dà informazione su come il sistema ha interagito con l’energia

fornita (quella che ha eccitato il sistema), abbiamo

un’elaborazione del segnale per ottenere un segnale utile. Che

dopo operazioni come la calibrazione ci dà un informazione

chimica grezza, essa viene trasformata in informazione chimica

utile che è quella consente di risolvere il problema alla base della

nostra indagine.

ECCITAZIONE (p.e. aumento della temperatura, irraggiamento,

sottoposizione ad un campo gravitazionale)

RISPOSTA, quantità fisica, risultato di una perturbazione del sistema

chimico-analitico operata da una opportuna sollecitazione fisica.

Ambedue queste quantità fisiche (risposta ed eccitazione)

costituiscono una informazione. 49

Segnale: informazione fisica trasmessa a distanza

La natura del segnale può essere:

- elettrica

- meccanica

- elettromagnetica (ottica)

Principali segnali di interesse chimico-analitico:

• SPETTRI → SPETTROSCOPIA

(intensità di assorbimento/trasmissione/riflessione di una radiazione elettromagnetica, in

funzione della λ o di una sua trasformata)

• CROMATOGRAMMI → CROMATOGRAFIA

(intensità di risposta di un rivelatore in funzione di un tempo)

• CRONOAMPEROGRAMMI → CRONOAMPEROMETRIA

(corrente in funzione del tempo, a potenziale costante)

• VOLTAMMOGRAMMI → VOLTAMMETRIA

(corrente in funzione di un potenziale variabile). SEGNALI IDEALI:

Questi sono grafici con

andamenti simili a quelli di

Gauss e quindi con

andamento normale.

Tipo di segnale:

cromatogrammi.

Sull’asse x poniamo il tempo

e nelle y c’è la risposta

relativa.

Nella realtà abbiamo delle oscillazioni radmon quindi senza logica e con interferenze che possono

derivare anche dal sistema; quindi, il segnale

è sporco dal rumore.

Es. il fruscio nelle registrazioni è dato dal

rumore radmon.

Se il rumore diventa più alto del segnale

possiamo ricavare poche informazioni.

Il rapporto segnale rumore si misura con h

altezza picco rispetto alla linea di base e la si

rapporta con l’altezza del rumore. = S/C

(segnale/rumore).

Se esso è alto abbiamo poco rumore e tanto

segnale al contrario se il numero trovato dal

rapporto è tipo 3 abbiamo tanto rumore e

poco segnale. 50

Quale che sia la natura del segnale, esso ha fondamentalmente una caratteristica ondulatoria:

Un segnale semplice (sinusoidale) è caratterizzato da:

Anteprima

Vedrai una selezione di 12 pagine su 54