Anteprima
Vedrai una selezione di 9 pagine su 40
Appunti esame System Biology Pag. 1 Appunti esame System Biology Pag. 2
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 6
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 11
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 16
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 21
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 26
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 31
Anteprima di 9 pagg. su 40.
Scarica il documento per vederlo tutto.
Appunti esame System Biology Pag. 36
1 su 40
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

MATRICE DI ESPRESSIONE

→ →

Disegno sperimentale alla base dello studio dell’espressione genica indipendentemente

→ →

dall’uso dei microarray esiste lui cioè come noi disegniamo i campioni che vogliamo studiare

all’interno dell’array e successivamente li riorganizziamo per la loro analisi generalmente

→ →

qualunque sia disegno sperimentale il risultato è sempre quella che noi chiamiamo matrice

→ → → → →

di espressione grande matrice dove righe troviamo i trascritti quindi i geni colonne

→ → →

le condizioni ovvero i campioni che siamo andati ad analizzare ciascun elemento della

matrice indica livello di espressione di quel particolare gene (riga) in quella particolare

condizione (colonna) misurato come log in base 2 del rapporto tra rosso e verde nel caso di

esperimenti microarray a due colori o log base 2 dell’intensità di fluorescenza normalizzata nel

→ → →

caso di one color caratteristica essenziale matrice rettangolare numero di righe quasi

sempre molto + grande del numero di colonne numero di geni maggiore del numero di

→ → → →

condizioni per motivi economici ad oggi macroarray costa sui 150 prezzo gestibile ma

→ →

con 1000 esperimenti prezzo sale molto altro motivo sta nella sperimentazione stessa cioè

nella disposizione di materiali fare 100 200 2000 esperimenti vuol dire avere 100 200 2000 array

→ →

di solito + di 800-900 migliaia di campioni difficile trovarli nello stesso patch sperimentale

ovviamente se numero di condizioni particolarmente basso matrice diventa + piccola di ordine.

COSA POSSIAMO FARE CON QUESTE MATRICI

→ → →

Possiamo fare due cose espressione differenziale e clustering espressione differenziale

→ →

significa trovare le differenze di espressione tra due gruppi gruppo A gruppo B dobbiamo

→ → →

avere dunque divisione dicotomica del campione fatta a priori ad esempio sani-malati

→ →

possono essere ciò che ci pare importante che sia fatta a priori obiettivo identificare quei

geni in cui c’è differenza significativa nei livelli di espressione tra gruppo A e B ho già quindi una

→ →

categorizzazione dei campioni o dei pazienti cerchiamo quali geni sono differenti partendo

→ →

dalla rappresentazione classica quando abbiamo parlato di normalizzazione la coda di pesce

possiamo in linea generale definire l’espressione differenziale ciò che sta sopra semiasse

→ → →

positivo è espresso dal rosso ciò che sta sotto lo 0 semiassi negativo espresso dal verde

dove con espressione differenziale intendiamo quei geni in cui c’è una espressione maggiore di un

→ →

fattore rispetto ad un altro ciò che sta sopra detto generalmente over-espressione sotto

under-espressione due categorie di metodi statistici per l’identificazione dell’espressione

→ → →

differenziale single slide consentono di analizzare un singolo esperimento si basano su

→ → →

questo tipo di plot che vediamo sopra obiettivo è quello di definire un cut off soglia

ovvero valore che vada a definire una over espressione e under espressione nei primi approcci

→ →

fu scelto come soglia 4 scelta senza un senso vero e proprio solo una soglia per essere sicuri

che gene fosse sovra o sotto espresso in termini di grafico significa che un gene era considerato

sovra se superava 2 e sotto se era meno di -2 in altre parole il livello di intensità di fluorescenza

→ →

rispetto al valore di controllo doveva essere 4 volte alla fine degli anni ’90 e inizio ’00

introdotti due metodi che facevano delle assunzioni sulle distribuzioni di probabilità delle

→ → →

grandezze della fluorescenza assunzioni di tipo probabilistico metodo chen assume

intensità di fluorescenza come variabili gaussiane distribuzione che seguono andamento

→ →

normale consente di identificare cut off su base probabilistica per l’espressione differenziale

assunzione che intensità di fluorescenza segue distribuzione gaussiane non del tutto accettabile

→ →

perché distribuzione gaussiana può anche essere negativa mentre intensità sempre positiva

assumendo dunque una distribuzione gamma trova metodo per stimare parametri metodo

newton consente di calcolare la probabilità che un gene sia potenzialmente espresso in funzione

anche della sua intensità prende in considerazione quindi anche il rumore che c’è negli

→ →

esperimenti array quel rumore di cui si parlava con la normalizzazione si considera quindi il

→ → →

fatto che aumentando intensità numerica degli spot varianza + bassa diminuire intensità

→ →

varianza aumenta quindi probabilità che gene sia differenzialmente diverso è + bassa questo

comportamento è semplicemente dovuto alla natura intrinseca del rumore del dato e non alla vera

differenza di espressione biologica si mette appunto dunque questo nuovo metodo dove si ha +

facilmente espressione differenziale a intensità maggiore che ad intensità minore questi due

metodi citati sono discussi per importanza a livello storico e perché in alcuni casi usati ancora oggi

→ →

spesso quando si ha carenza di materiale biologico esistono patologie molta rare per cui

→ → →

trovare campioni è difficile multi-slide generalmente prevedono 15-20-30 esperimenti

questi disegni sperimentali hanno come principio di fondo la replicazione ovvero eseguire lo

→ →

stesso esperimento + volte replicare quindi lo stesso array la replicazione all’interno

→ →

dell’esperimento può essere di due tipi replicazione tecnica estrarre lo stesso materiale

→ → →

biologico suddividerlo in parti uguali e fare un certo numero di esperimenti ad esempio

ho un campione lo divido in 4 e faccio 4 esperimenti sull’array sto quindi studiando la variabilità

→ → →

sperimentale dell’array consente di studiare lo strumento si fa poco solo quando si vuole

studiare un sistema o un metodo per cercare di capire quali possono essere le variabilità e

→ →

prenderle in considerazione replicazione biologica significa avere 4 campioni diversi

→ →

caratterizzati nello stesso modo esempio 4 campioni di persone affette della stessa patologia

→ →

o 4 campioni trattati con lo stesso farmaco estrarre RNA e fare esperimento metodo sfruttato

→ →

dagli array multipli detto t-statistic sia in caso di replicazione tecnica sia in caso di quella

→ → →

biologica possiamo avere due tipi di disegni sperimentali one sample e two sample nel

primo caso per la matrice di espressione abbiamo un solo gruppo mentre il secondo quando ne

abbiamo due →

Nel caso due quindi il t test è la differenza tra le medie di due gruppi e la variabilità dei gruppi

→ →

può assumere valori positivi e negativi positiva quando la media del gruppo affetti + grande

della media del gruppo non affetti negativa quando è la media del gruppo non affetti ad essere

+ grande il segno dunque ci dice quanto i livelli di espressioni siano + grandi uno rispetto all’altro

→ l’entità del valore assoluto è una misura di quanto le medie siano diverse rispetto alla variabilità

→ il t-test che sia one o two sample possiamo applicarlo per ogni riga della matrice di espressione

→ →

se questa è fatta ad esempio da 200 condizioni e 2200 trascritti facendo t test per ogni

→ →

trascritto ho 2200 t test box plot fa riferimento al caso two sample ed è un modo per

riassumere la distribuzione dei dati significa che all’interno del rettangolo c’è tra il 25esimo ed il

→ →

75esimo percentile dei dati quindi a metà tra i dati all’interno delle due righe orizzontali c’è il

98% dei dati e quella linea in grassetto è la mediana dei dati significa che i dati sono distribuiti

→ →

all’interno di questa struttura qui affetti non affetti

→ →

t-student il t test ottenuto possiamo valutarlo grazie ad una distribuzione perché la statistica

t segue la distribuzione t-student una distribuzione a campana che assume diverse ampiezze in

→ →

funzione del parametro df che identifica i gradi di libertà all’aumentare di questi la

distribuzione tende ad una gaussiana i gradi di libertà sono numero di replicazioni che si hanno

nell’esperimento meno 1 quindi dato che statistica t segue distribuzione t-student e soprattutto

statistica t calcolata su n campioni segue una distribuzione ad n-1 gradi di libertà possibile

→ →

calcolare quanto è statisticamente rilevante numero del t-test riassumendo per ogni roga

della matrice calcoliamo la nostra statistica t che andiamo a confrontare con la distribuzione t-

→ →

student con un numero di gradi di libertà n-1 n numero di replicati fatti nel nostro disegno

→ →

sperimentale se statistica t confrontata con la distribuzione t student abbastanza grande

superiore del 1 o 5% delle statistiche t della distribuzione statistica t viene detta statisticamente

significativa in questo caso il gene testato è differenzialmente espresso in maniera significativa

→ →

in particolare over espresso se valore della statistica è positivo under espresso se valore della

statistica è negativo.

SIGNIFICATIVITA’ STATISTICA →

Questa viene chiamata comunemente p calcolata confrontando la statistica t con la

distribuzione t student andandosi a calcolare la probabilità che la statistica t calcolata dai dati

sia + grande della statistica t della distribuzione t student se questa probabilità è + piccola

→ →

(0,01/0,05) vuol dire che valore della statistica t calcolata è molto grande nel caso 0,01 vuol

dire che valore della statistica t calcolato molto + grande del 99% dei valori t della distribuzione t

student con quel numero di gradi di libertà quindi un valore molto alto e si definisce

→ →

statisticamente significativo con un live

Dettagli
A.A. 2024-2025
40 pagine
SSD Scienze biologiche BIO/11 Biologia molecolare

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher caterinafdifanti di informazioni apprese con la frequenza delle lezioni di System biology e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Magi Alberto.