vuoi
o PayPal
tutte le volte che vuoi
La coda CTD è fosforilata; la fosforilazione della coda CTD e la contemporanea
presenza del 5’ reclutano gli enzimi che modificano chimicamente il 5’, e voi sapete
che il 5’ degli RNA viene modificato soprattutto attraverso metilazione. Ci sono delle
metilazioni sia sull’anello carbonioso (lo zucchero), sia sugli anelli delle basi; diciamo
che comunque si può andare incontro ad una metilazione più o meno estesa a
seconda dei momenti o a seconda del tipo di geni che sono trascritti. Ma
fondamentalmente si ha una serie di reazioni chimiche che modificano il CAP…ma non
solo! A una metilazione più o meno estesa è associato il legame di un nucleotide al
contrario: cioè si forma una “struttura” in cui una G si attacca al contrario al primo
nucleotide trascritto (che è una A in larga maggioranza) attraverso un ponte trifosfato.
A questo 5’ è attaccato un gruppo fosfato con un altro gruppo fosfato, e questo
nucleotide non si attacca col suo 3’ a questo 5’, ma si attacca rovesciato. Quindi
abbiamo una catena che solo in questo punto è 5’-5’-e poi la giusta polarità. Quindi
abbiamo in realtà qui un 3’ libero che è quello di questa G che viene aggiunta, al quale
però non segue una giusta polarità della catena; le esonucleasi tendono a riconoscere
molto male questo tipo di conformazione.
Quindi il concetto è: a seguito del blocco della polimerasi e all’arrivo di fattori specifici
(reclutati dalla polimerasi) la catena di RNA nascente viene modificata chimicamente.
L’ultimo di questi enzimi che viene reclutato dalla polimerasi, che ha affinità per il DNA
metilato e per proteine specifiche che hanno effettuato questa modifica al 5’, in realtà
è una chinasi che fosforila sia la coda CTD che alcune delle proteine coinvolte in questi
processi. Questa iperfosforilazione provoca il distacco di questi fattori e a questo punto
la polimerasi è libera di scorrere di nuovo.
Esiste un controllo di stabilità e controllo del messaggero nei primissimi momenti di
trascrizione: a questo punto l’RNA viene fatto e cominciano a venir fuori tutte le
sequenze importanti per il processamento successivo che come sapete è quello dello
splicing.
Nel nostro genoma la gran parte delle sequenze presenti non sono codificanti; una
parte è composta da promotori (sequenze regolatrici della trascrizione), la grandissima
parte è costituita da introni. Che ci stanno a fare tutti questi introni? Sicuramente un
motivo è per lo splicing alternativo. Se andiamo a fare uno studio di omologia di
sequenza, vediamo che gli introni sono estremamente conservati fino ai batteri; a loro
volta, all’interno degli introni ci sono un sacco di geni, il che non sarebbe pensabile
visto il tasso di mutazione che c’è a ogni duplicazione del DNA. Questo perché
all’interno degli introni ci sono sia zone importanti per la trascrizione (abbiamo detto
che nel primo introne di solito c’è una sequenza enhancer per lo splicing), sia zone di
ancoraggio per altri fattori che fanno splicing o processamento post trascrizionale.
Evolutivamente avere DNA in più ci permette di avere mutazioni e per far sì che quella
parte di DNA non sia più un introne ma diventi parte di una proteina attraverso
splincing alternativo. In più c’è il fatto che ci servono sequenze da scambiare durante
la meiosi per permettere l’evoluzione attraverso il rimescolamento del DNA. Tuttavia,
tutti questi motivi non sono sufficienti per spiegare perché di introni ce ne sono così
tanti: se voi prendete un gene di lievito tipo Cerevisiae trovate circa 250 introni,
mentre già in lieviti più complessi dal punto di vista genomico praticamente tutti i geni
presentano introni.
Nei mammiferi questo potrebbe essere un gene tipo, dove l’mRNA di fronte a un
trascritto primario o di fronte a un gene è molto più piccolo.
Quest’altro gene presenta un’organizzazione tipo, dove oltre a un 5’ cappato c’è un
introne a monte del codone AUG: questa è una caratteristica di moltissimi geni, ossia
la presenza di una regione trascritta ma non tradotta. Questa parte a monte è il 5’
UTR, che di solito è di piccole dimensioni (un paio di centinaia di coppie di basi). Questi
sono gli esoni, qui c’è il codone di stop, e all’interno di questa zona esiste poi una
larga zona 3’ UTR che serve per la regolazione traduzionale del gene e che può essere
lunga anche parecchie migliaia di nucleotidi. A volte nei trascritti neuronali i 3’ UTR
sono estremamente lunghi perché c’è una regolazione traduzionale molto sviluppata,
addirittura più lunghi della parte codificante dell’mRNA.
Cioè quando voi avete uno splicing alternativo che dà 3’ UTR diversi, per esempio in
cellule muscolari, in cellule del sistema immunitario e in cellule neuronali (vi ricordo
che il DNA per tutti questi tipi di cellule è uguale) 90 volte su 100 lo splicing
alternativo che dà il 3’ UTR più lungo è quello dei neuroni. Quindi i neuroni tendono ad
avere, generalizzando statisticamente, i trascritti con un 3’ UTR più lungo di quelli che
codificano per la stessa proteina in cellule diverse. Questo perché ci permette una
regolazione traduzionale più sviluppata e sofisticata.
Gli introni vengono rimossi all’interno del nucleo; se prendete un introne tipo e lo
confrontate con lo stesso introne dello stesso gene in tante specie diverse, o lo
confrontate con sequenze di altri introni nello stesso organismo, trovate delle
omologie? Le estremità degli introni sono conservate, ma non solo: sono conservate
anche delle parti interne, che sono la consensus di conservazione che osservate
confrontando tanti introni diversi.
Vi ho raccontato la volta scorsa che le proteine che riconoscono gli acidi nucleici
tendono ad avere una box di riconoscimento lunga 8-12 bp. Quando voi fate questa
consensus qui in realtà ne trovate 7/8, e ci siamo, cioè le estremità 5’ dell’introne,
questo è l’esone e questo è l’introne, quindi questo è l’esone precedente all’introne e
questo è l’esone successivo e questa è la sequenza dell’introne. Quello che voi trovate
è una sequenza conservata a cavallo delle estremità 5’ e 3’. Se voi mettete a
confronto introni diversi, vedete che la G e la U sono in quantità invarianti, il che vuol
dire in pratica che il 100% degli introni ha come primi due nt G ed U, mentre gli ultimi
due sono A e D. Il significato di questo fatto sta che queste sequenze vengono
riconosciute da altri RNA, cioè il riconoscimento di una molecola di DNA è al 99%
mediato da proteine, quindi da atomi contenuti in domini proteici che stabiliscono
legami deboli con atomi presenti all’interno del DNA. Quanto prendete un RNA, al 60-
70% questo riconoscimento è mediato da altri RNA e questo è ovvio perché il DNA è a
doppia elica, e i legami H specifici che possono fare le basi sono impegnati con le basi
dell’elica complementare mentre un RNA è spesso a singola elica e i legami H che
fanno le basi sono liberi di interagire con un’altra elica complementare. I legami RNA-
RNA sono molto più stabili di quelli DNA-DNA. Quindi quando parlate di RNA e trovate
una consensus di sequenza, 60-70% delle volte lì interviene un altro RNA che ha il
compito di legare quella sequenza e magari di trasportare attraverso questo legame
specifico proteine che poi hanno un’attività enzimatica. Però il riconoscimento e il
trasporto di questi fattori sull’RNA avviene attraverso il riconoscimento di
complementarietà di basi fra molecole di RNA che agiscono in trans. Questo è il
motivo per cui delle volte bastano molte meno basi, perché magari in un complesso di
splicing ben giustapposto bastano due tre basi affinchè un RNA riconosca e stabilizzi
poi il complesso proteico che si deve legare in questa posizione.
Confrontando gli introni vengono fuori anche altre cose, le più evidenti sono una
sequenza di pirimidine, U o C, che è vicino al 3’ dell’introne e poi una A importante
contenuta all’interno di una box più o meno conservata (molto conservata negli
eucarioti semplici, molto meno ben conservata negli eucarioti complessi). La presenza
di questa A affinchè lo splicing possa avvenire è importante perché in un mammifero
(nel lievito c’è praticamente assenza di splicing alternativo) questo introne può servire
delle volte e altre no, se c’è un branch site molto forte quello determina il fatto che
deve sempre essere eliminato.
Quindi quando trovate delle sequenze di splicing molto buone e quindi perfettamente
aderenti alla consensus, vuol dire che quell’introne non andrà incontro a forti fenomeni
di splicing alternativo; se ho una sequenza “bruttina” il macchinario di splicing ci
metterà un po’ più di tempo a riconoscerla e magari questo tempo in più mi permette
di sfuggire e di andare avanti, perché ricordiamo che tutta questa storia avviene
insieme alla trascrizione: se questo introne viene rimosso subito noi non lo troveremo
mai, se questo introne che viene fatto prima ha delle sequenze brutte, i fattori che
devono legare queste sequenze si legheranno male e questo introne rimarrà qui.
Queste sequenze sono molto conservate nei mammiferi e si ritrovano praticamente in
tutti gli introni.
Quindi una consensus alla giunzione 5’ dell’introne, una alla 3’ dell’introne e delle
sequenze consensus all’interno, una box di pirimidine e una A contenuta anch’essa in
una box (sempre a 2/3 o ¾ dell’introne, rivolta verso il 3’).
Queste sequenze sono riconosciute da RNA, in particolare da particelle
ribonucleoproteiche (small nuclear RNP, intorno al centinaio di basi) composte da RNA
(U1, U2, U4, U5, U6) che hanno il compito di portare fattori proteici (10, 12, 15), alcuni
conservati alcuni specifici nel senso che la particella U1 avrà delle proteine in comune
con la particella U2 e altre tutte specifiche per se’. Queste particelle
ribonucleoproteiche arrivano sul pre mRNA attraverso un’interazione RNA-RNA
specifica; l’RNA U1 porta questa particella snRNP U1 sulla giunzione 5’ di splicing. Che
sequenza ha U1 in direzione 5’-3’? E’ una sequenza unica derivante dal gene che la
codifica e che devere riconoscere tutti i 5’, tutti diversi fra loro. Il 62% di 5’ all’interno
di una cellula ha una A in questa posizione; questo vuol