Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
COME SI ORIGINANO NUOVI GENI DA PRE-ESISTENTI?
Si generano per duplicazione e divergenza, per fusione o fissione genica, per trasferimento orizzontale, per
retroposizione; nel contesto della duplicazione ma anche fusione e fissione può avvenire anche exon shuffling, ovvero
per ricombinazione di esoni di geni diversi.
Famiglie geniche
I geni paraloghi sono geni simili, quindi filogeneticamente correlati, presenti nello stesso genoma. Sono geni paraloghi
o geni appartenenti alla stessa famiglia genica quei geni che originano da un progenitore comune che è andato
incontro a fenomeni di divergenza e exon shuffling.
Famiglia genica = gruppo di paraloghi.
Quante famiglie geniche ci sono nel genoma? Confrontando organismi di gruppi diversi posso contare le famiglie
geniche presenti e il numero di membri → per vedere se c’è qualche tendenza in macrogruppi di organismi…
Nella figura 6.8 vengono presi come riferimento 5 organismi
modello a partire dai procarioti, agli eucarioti semplici fino alle piante-animali. Vediamo che:
La percentuale di geni unici si riduce all’aumentare della complessità dell’organismo (da procarioti a eucarioti
pluricellulari).
La percentuale di famiglie con pochi membri aumenta all’aumentare della complessità dell’organismo
La percentuale di famiglie numerose (numero di membri > di 4) è minore in tutti i gruppi rispetto al precedente
parametro ma segue lo stesso trend
Le famiglie geniche sono rare nei procarioti, abbondanti negli eucarioti e in modo particolare in quelli pluricellulari;
anche il numero di geni all’interno di una famiglia aumenta passando dai procarioti agli eucarioti pluricellulari.
Nella figura 6.7 vediamo che per i batteri il numero di geni totali e di famiglie distinte corrispondono → sono costituiti
principalmente da geni unici; nell’uomo invece il numero di famiglie geniche distinte è minore rispetto al totale dei
geni → ci sono più famiglie geniche numerose.
Un procariote è unicellulare e il suo adattamento all’ambiente è tale che le sue funzioni geniche devono direttamente
interfacciarsi con l’ambiente esterno; un eucariote unicellulare è abbastanza simile ma ha complessità maggiore
(organuli, meiosi) mentre nei pluricellulari, con sviluppo e differenziamento cellulare, abbiamo una specializzazione
delle cellule, ci sono organi con funzioni specifiche… il numero di funzioni biologiche necessarie l’ elevata necessità di
diversificare il comportamento cellulare potrebbe essere legato ad una duplicazione di funzioni pre-esistenti: non è
necessario inventare nuove funzioni ma si riciclano funzioni pre-esistenti. Quando infatti si fa una mappatura
9
dell’espressione di geni paraloghi, spesso si vede che questi sono espressi in diversi distretti tissutali: diverse isoforme
di una proteina permettono le funzioni specifiche di un tessuto.
Causa remota: duplicazioni geniche che formano paraloghi → nel momento in cui l’organismo ha evoluto tipi cellulari
diversi → queste mutazioni sono state funzionali alla fisiologia dell’organismo.
Es: l’evoluzione di una Hb fetale, formata da un paralogo della catena β differente = con maggiore affinità verso
l’ossigeno → permette lo scambio di ossigeno tra Hb materna e fetale (altrimenti equilibrio) a livello ombelicale →
possibile funzionamento della placenta. Prima era uno pseudogene che l’eucariote si portava dietro → poi assume una
funzione.
Come si formano famiglie geniche?
Duplicazione e divergenza (accumulo di mutazioni) o exon shuffling → nuovi geni che si sono mantenuti
InterPro = database curato dove si trovano le famiglie geniche
Geni ortologhi
Geni ortologhi = stessi geni presenti su genomi di specie differenti; gene presente in organismi diversi che deriva da
un gene antenato comune presente nell’antenato comune alle due specie.
Usiamo un concetto evoluzionistico per identificare geni simili → la spiegazione più ovvia è che derivino da un antenato
comune.
*invece paraloghi sono geni derivanti da un gene ancestrale comune ma nello stesso organismo.
Es. la nostra globina α è ortologa a quella di uccello e rettile perché deriviamo da un antenato comune che aveva una
globina α → con delle differenze che si sono accumulate nel tempo che permettono, confrontando le sequenze, di fare
la filogenesi molecolare (studio evoluzione organismi).
Assunto concettuale con cui spieghiamo la similarità: più vicina è la parentela nel tempo, più simili saranno le
seuquenze→ perché le mutazioni avvengono per caso con un tasso più o meno costante nel tempo → tante più
mutazioni un gene ha accumulato rispetto ad un altro, tanto più lontano sarà l’antenato in comune.
Il concetto di similarità è pero soggettivo, allora come posso definire due geni ortologhi? Non c’è un modo per stabilirlo
in maniera univoca → quando si trova un gene ortologo/paralogo di un altro bisogna anche capire a che livello di
similarità stiamo guardando.
Quando parlo di ortologhi (es. citocromo C mio e gatto) io sto identificando due proteine con uno stesso nome in base
alla similarità di sequenze a cui però attribuisco anche la stessa funzione (catena trasporto elettroni) → ma chi ci dice
che in realtà quella sequenza simile non codifichi per un altro citocromo? È un aspetto rilevante per l’utilizzo di modelli
di malattia animali. C’è un approccio empirico con cui vengono confrontate le sequenze e non solo → a step successivi
si riesce ad identificare ragionevolmente una funzione simile attraverso strumenti computazionali; per verificare
l’ortologia/paralogia reale di due geni è necessario fare un esperimento: rendo un organismo knock out e faccio
complementazione con l’ortologo.
Risvolto pratico di conoscere gli ortologhi:
Utilizzo organismi modello (più facilmente
mutagenizzabili)
Organismo ancestrale A con 3 geni (1a, 2a, 3a) da cui si evolvono
due nuove specie:
B con geni 1b 2b 3b
C con geni 1c, 2c, 3c 10
Se non c’è stata perdita di geni, questi si ritrovano nei nuovi organismi. Le coppie di ortologhi saranno: (1b,1c); (2b,
2c); (3b, 3c). Questi geni, che hanno stessa funzione, sono quelli che derivano dall’antenato comune (+ mutazioni
diverse).
Se però durante l’evoluzione da A a B-C
avviene una duplicazione del gene 2a in
tandem → nell’organismo intermedio a’
(prima della divergenza) avremo il gene 2.1a’ e
2.2a’.
B e C ereditano un diverso set di geni rispetto
al caso precedente.
L’ortologo di 2.1b è 2.1c o 2.2c? Come
possiamo saperlo nello scenario reale?
Dobbiamo capire chi è il parente di chi perché
2.1 e 2.2 sul DNA non c’è scritto!! Si vede solo
ce sono due geni molto simili…
Il modo più ovvio è quello di andare a vedere quale coppia è più simile perché in questo caso la duplicazione genica
ha preceduto la divergenza delle specie → assunto: se le mutazioni sono casuali e con tasso costante nel tempo per
ogni specie, allora 2.1 e 2.2 più diversi tra loro rispetto a 2.1a’ e 2.1b → guardando le similarità di sequenza trovo il
reale ortologo.
Confronto i 4 geni dell’organismo C con quelli dell’organismo B andando a vedere quali sono più simili; lo strumento
utilizzato è l’algoritmo BLAST (basic local allignment search tool): algoritmo di allineamento di sequenza che divide la
sequenza in segmenti e guarda le differenze tra una sequenza “query” (utilizzata per vedere se qualcuna è simile) e
delle sequenze “subject” nel database → per misurare il grado di similarità tra sequenze nucleotidiche o
amminoacidiche. Utilizzato per esempio per vedere la similarità di una sequenza su un database (es. GeneBank).
Prendendo come query il 2.1c e lo confrontiamo con tutti i geni dello organismo B vediamo che il più simile è il 2.1b
(top subject) → potrebbe essere il più simile. Si vede anche però che 2.2b è simile e c’è una debolissima similiarità con
3b.
La verifica si fa prendendo il subject (2.1b) e usandolo come query contro l’organsimo C → si ritrova che il top subject
è il 2.1c e più debolmente 2.2c. Di conseguenza posso affermare che 2.1b e 2.1c formano una coppia di ortologhi.
Questa procedura va sotto il nome di “Reciprocal best blast hit”.
COME SI IDENTIFICANO GLI ORTOLOGHI? Attraverso il reciprocal best blast hit con cui si ricerca il grado di similarità…
Complicazioni: non sempre le situazioni sono da manuale, i tempi di divergenza potrebbero essere molto stretti, es
divergenza 2.1 e 2.2 vicino alla divergenza tra le due specie → i due geni non si sono distinti molto, allora come si trova
il reale parente? Quando le famiglie geniche sono grandi e hanno avuto divergenze recenti, non è facile risalire
all’ortologia basandosi sull’algoritmo blast, in questo caso sono necessari ulteriori strumenti. BLAST è un programma
automatico che posso lanciare su tutti i geni del genoma che da qualche minuto a qualche ora ci fornisce il risultato: il
rischio è che unisca oggetti che realmente non sono ortologhi; ha dei limiti: non si capisce bene l’evoluzione dei geni…
(es. famiglie di trasportatori, molto grandi).
Quindi ricorriamo ad altri strumenti che ricostruiscono un albero filogenetico, utilizzo un modello di evoluzione che
permette di pesare (mutazioni più o meno probabili) le varie differenze nucleotidiche o amminoacidiche e ricostruire
la filogenesi dei geni. Si risolve l’ambiguità difficilmente valutabile con il Reciprocal best blast hit, il quale fornisce una
valore di similarità percentuale.
A volte anche questo non basta, è necessario considerare la sintenia: se la localizzazione dei geni rimane la stessa.
Non sempre è possibile ricavarlo, dipende dalla qualità del campione e del sequenziamento fatto: se il DNA è
estremamente frammentato e non si riesce ricostruire l’intera sequenza non è possibile trovare la sintenia. Servono
11
sistemi di sequenziamento più avanzati. Assunto evoluzionistico: se i geni sono parenti, la loro posizione nel genoma
non è cambiata → se non è successo niente di sconvolgente e i tempi di divergenza non sono così elevati → la
ricombinazione genetica non ha spostato pezzi per traslocazione (pochissimo frequenti); partendo da questo assunto,
allora posso trovare gli ortologhi basandosi sulla sintenia.
Geni 1, 2, 3 nell’organismo A
Se 1 e 3 sono ortologhi con gli stessi geni in posizione dell’organismo B → Allora anche