vuoi
o PayPal
tutte le volte che vuoi
Quindi apparentemente non c’è relazione tra complessità fenotipica e complessità genotipica.
Uno può dire che il fenomeno di splicing alternativo nell’uomo è maggiore rispetto ad un nematode
o ad un microrganismo, dove il numero di introni è minore e quindi il numero di proteine è minore
rispetto all’uomo, ma la complessità fenotipica dell’uomo non è determinata dal numero di geni
codificanti proteine.
Dal penultimo release (numero 37) del genoma umano , appare evidente il numero di paia di basi
in un genoma aploide che è 3,279,005,676. Di queste, circa l’1 % è codificante per proteine. Il
numero di geni invece è intorno ai 21mila. Queste sono statistiche pubblicate dal consorzio per il
sequenziamento del genoma umano (GRC). In questo release abbiamo anche 615 geni nuovi, che
sono stati scoperti. Dopo cominciano le sorprese, per cosi dire, che in qualche modo potrebbero
spiegare il paradosso del valore c da cui ero partito.
Innanzitutto c’è questo dato:ci sono più della metà, rispetto ai geni codificanti per proteine, di
pseudo geni . Quasi 13.400 di geni che non sono funzionanti, quindi pseudo geni. Questi sono
pezzi di gene o geni interi che si sono duplicati ma hanno accumulato un tasso di mutazioni cosi
elevato da non essere più funzionanti. Quindi sono dei relitti che sono presenti all’interno del
genoma e non si capisce perché ci sono, ma se hanno resistito alla selezione evolutiva vuol dire
che hanno una funzione altrimenti si sarebbero persi. E il fatto notevole è che circa della metà di
questi sono espressi e cioè si trovano nel trascrittoma delle cellule. Se sono trascritti, dovrebbero
avere una funzione, ma la situazione è poco chiara.
Un altro elemento notevole, inatteso, è la presenza dei trascritti. Ci sono circa 170mila trascritti
diversi all’interno del genoma umano, anzi all’interno del trascrittoma, contro 35mila tra geni e
pseudo geni. Trascritti diversi, quindi vuol dire che ci sono trascritti che non corrispondono a geni e
se questi ci sono vuol dire che tendenzialmente se ci sono ci sarà una funzione, anche se di questi
trascritti non conosciamo la funzione. Se cosi fosse, il fenotipo non sarebbe determinato solo dai
geni codificanti proteine ma anche da questi altri trascritti non codificanti proteine, che dal punto di
vista quantitativo sono la gran parte all’interno di una cellula.
Poi ci sono molte varianti del genoma che potrebbero, anzi, sono di sicuro, anche se non capiamo
perfettamente perché, alla base delle differenze individuali e che potrebbero incidere anche sul
fenotipo. Quindi l’osservazione di questi numeri potrebbe in qualche modo spiegare il paradosso
del valore c però lo sposta semplicemente perché dice che il fenotipo non dipende soltanto dai
geni ma anche da tutte queste altre regioni genomiche che sono trascritte ma non sono dei geni in
senso classico.
Il problema diventa stabilire la funzione di questi trascritti non codificanti. Con il progetto ENCODE,
che mira a definire un’enciclopedia di tutti gli elementi con attività funzionale. Tutto il genoma viene
trascritto, ogni singolo pezzo di DNA. Ogni locus genico in senso classico genera più di un mRNA,
più di un trascritto in senso più generale e comunque più di un RNA codificante proteine.
Ci sono vari progetti che sono arrivati allo stesso risultato, ad esempio FANTOM 3 che è arrivato
allo stesso risultato attraverso il genoma di topo. Il numero di trascritti indipendenti all’interno delle
cellule murine è lo stesso molto grande relativamente al numero di geni murini, che è molto simile
a quello umano.
Se la trascrizione è pervasiva e avviene dappertutto, sorge il dubbio di come questa trascrizione
venga regolata. Se voi riflettete sul modello con cui avviene la regolazione della trascrizione
(promotore, regioni controllo dove si legano fattori di trascrizione che attivano la trascrizione), chi
regola la trascrizione di queste regioni non codificanti, che magari non hanno un promotore?
Attraverso le tecniche di sequenziamento parallelo si può andare a vedere i siti di binding di fattori
di trascrizioni in tutto il genoma.
Il tipo di quadro che viene fuori è che i siti di binding di fattori di trascrizione (TFBS) non stanno
soltanto nei promotori e negli enhancer e questo è un esempio dei geni p53, cMyc e Sp1, tutti e tre
fattori di trascrizione abbastanza noti. Il 17% di tutti questi siti sta vicino a pseudo geni o in regioni
ambigue, nel senso che sono regioni prossime agli pseudo geni e prossime anche ai geni. Il 24%
di questi siti sono nuovi, completamente non conosciuti prima, quindi vuol dire che non stanno nei
promotori ne vicino a un gene, ma completamente in altre regioni. Mentre un 22% sta in 5’ al
gene,che è il promotore o sta vicino al promotore e un 36% che sta in regioni introniche o in 3’
rispetto a un gene.
Quindi si vede come anche i fattori di trascrizione si trovino in regioni inattese e questo coincide
con il fatto che tutto il genoma viene trascritto.
Se prendiamo come riferimento un locus tipico, quello che si nota è che si, c’è un solo mRNA, ma
è molto più facile trovarne più di uno, più isoforme di mRNA, quindi che codifica per proteine, ma
molto spesso si hanno situazioni molto complicate, nel senso che si hanno punti di inizio della
trascrizione diversi (più di uno), punti di inizio della trascrizione in senso inverso (quindi trascritti
antisenso rispetto all’mRNA) e una pletora di piccoli mRNA , le cui funzioni di alcuni di questi sono
abbastanza conosciute come nel caso dei microRNA.
E poi ci sono locus anche molto grandi che riguardano i cosiddetti “Long non coding RNA” e cioè
RNA non codificanti lunghi, il tipico esempio è HIST, che è un RNA non codificante molto lungo,
implicato nella repressione del cromosoma X nelle femmine di mammifero. Il meccanismo di
repressione è cromatinico, nel senso che si forma una cromatina chiusa, compatta, non
accessibile e quindi non si può trascrivere. Il processo è di regolazione della cromatina è
controllato da questo RNA non codificante lungo quanto quasi tutto il cromosoma X, che lega i
fattori di repressione della cromatina.
Il problema sta nel dare una funzione a questo RNA non codificante, la quale potrebbe spiegare la
relazione tra genotipo e fenotipo.
I microRNA sono dei piccoli RNA, molto corti (21-22 basi), che regolano la traduzione degli mRNA.
L’esempio è del p53: tra le sue funzioni, attiva anche miR-34, che è un fattore di trascrizione che
inibisce la produzione di proteina BCL-2 (fattore per la sopravvivenza cellulare). Quindi i miR-34 si
inseriscono in questi pathway molecolari agendo a livello della traduzione, quindi c’è una
regolazione dell’espressione genica a livello post trascrizionale. Cioè si vanno ad appaiare per
complementarietà con l’mRNA (soprattutto nella regione 3’ UTR), che richiamano il complesso
RISC sull’mRNA, per cui l’ mRNA non viene degradato.
Tipicamente i miRNA hanno qualche base al proprio interno che non si appaia, non è
completamente complementare con l’mRNA. Questo vuol dire che un miRNA non colpisce un solo
mRNA, poiché la sequenza target può essere presente in più mRNA. E un mRNA può avere più
miRNA che possono regolarlo.
In questa diapositiva (numero 16) è anche descritta la via di produzione dei miRNA quindi si parte
dal genoma, perché i miRNA hanno una regione genomica che li produce, cioè sono presenti dei
cluster, delle regioni dove sono raggruppati i miRNA, c’è la formazione di una struttura a forcina e
la struttura di questo mRNA viene riconosciuta DROSC(???) o da un’altra struttura che processa
questi pre-miRNA su cui agisce DICER che rompe la struttura a forcina producendo il miRNA
appaiato con un RNA complementare che è la regione a stelo della struttura a forcina. Questo è
quello che viene caricato sul RISC e il RISC con il proprio miRNA va e “attacca” l’mRNA.
A volte il legame del miRNA al mRNA non produce soltanto un’inibizione della traduzione e quindi
conservazione dell’mRNA ma anche una degradazione di quest’ultimo. Questo avviene soprattutto
quando c’è un completo appaiamento tra la sequenza del miRNA con l’mRNA target, e questo si
ha quando c’è un siRNA.
siRNA sta per short interfering RNA, quindi è un RNA non codificante che agisce in maniera molto
simile al miRNA. L’unica differenza sta nel fatto che la sequenza del siRNA è completamente
complementare, non ci sono basi spaiate.
Quindi viene caricato sempre nel RISC ma i siRNA, a differenza dei miRNA, attivano la
degradazione del mRNA che porta a silenziamento del gene. Con i miRNA l’mRNA è solamente
impedito dal legarsi con il ribosoma.
I siRNA prima erano degli strumenti di laboratorio, poi sono stati scoperti anche nelle cellule.
Questi fattori sono ben conosciuti infatti i siRNA vengono anche studiati per scopi terapeutici,
soprattutto quando hai un gene responsabile della malattia.
Quello che vi ho presentato oggi riguarda questi RNA non codificanti e quindi una parte che
riguarda molto la trascrizione, che è l’argomento principale parlando di macroarray e
sequenziamento parallelo.
Parlando di RNA abbiamo detto che la maggior parte dei trascritti nella cellula sono RNA non
codificanti, in termini di numero di tipi di RNA, in termini quantitativi di trascritti non assoluti, poiché
la maggior parte dell’RNA nella cellula è di tipo ribosomale. Qui con non codificanti si intende
un’altra cosa, non gli rRNA o i tRNA, ma degli RNA che regolano la trascrizione con un
meccanismo del tutto nuovo o comunque non atteso.
In genere questi RNA non codificanti sono molto di più degli mRNA ma a livello quantitativo sono
molto poco espressi, quindi in genere questi RNA non codificanti , che non sono rRNA o tRNA, a
livelli di espressione sono molto bassi.
Quindi RNA non codificanti come regolatori dell’espressione genica. I miRNA sono un esempio
abbastanza ben stabilito e definito perché il meccanismo e la biogenesi sono stati chiariti per bene,
tant’è che si stanno sviluppando per un approccio terapeutico come i siRNA.
Questi RNA sono correlati tra loro. In uno studio fatto tempo fa per RNA sia corti che lunghi, fu
dimostrato come questi RNA non codificanti potessero essere divisi in categorie, relativamente
alla lunghezza dell’RNA stesso e relativamente alla localizzazione cellulare (nucleare o
citoplasmatica). Ovviamente sono sintetizzati nel nucleo, quindi sono tutti nucleari in un certo
punto, ma di quelli piccoli una certa parte diventa anche citoplasmatica. Poi ci sono