Trascrizione del DNA e sintesi delle proteine
La trascrizione è il processo mediante il quale le informazioni contenute nei geni di II tipo del DNA vengono trascritte enzimaticamente in una molecola complementare di mRNA, l'intermedio che porta alla sintesi delle proteine. Essa procede in direzione 5'-3'.
Sequenze promoter per la trascrizione
Il gene di II tipo che viene trascritto viene rappresentato per convenzione in direzione 5'-3'. A monte ed in prossimità dell'estremità 5' di tutti i geni di II tipo sono presenti delle sequenze fondamentali, chiamate sequenze promoter della trascrizione, anche se per molti geni l'esistenza di queste sequenze non è sufficiente per dare inizio alla trascrizione.
Una prima sequenza promoter è la sequenza TATA, detta anche TATA box; essa si trova a circa 20-30 nucleotidi a monte del primo nucleotide che deve essere trascritto, ed è presente in prossimità del DNA linker. Poiché a monte del primo nucleotide del gene i nucleotidi vengono numerati negativamente, la TATA box si trova a livello dei nucleotidi -20/-30. La sequenza TATA, però, non è rappresentata solo da questi 4 nucleotidi, ma è meglio rappresentabile come TATAAAT.
Essa è riconosciuta dalla proteina TBP (TATA binding protein), la quale agisce dal solco minore del DNA per via della sua particolare struttura a filamenti che si β-pieghettati, accomodano meglio in questo nel solco minore; tali filamenti sono ricchi in fenilalanina, aminoacidi che conferiscono maggiore plasticità alla sequenza aminoacidica. Il legame tra la TBP ed il DNA provoca una modifica strutturale dell'elica, che si piega di circa 100°, allargandone i solchi maggiori.
Altre sequenze promoter
Altra sequenza promoter è la sequenza BRE (elemento di risposta al fattore B), a monte della TATA box (-30/-40). Il legame della TBP con il DNA consente il riconoscimento del fattore TF II B che avviene prima del reclutamento dell'RNA polimerasi, ed anzi favorisce il suo reclutamento.
A valle della TATA sono presenti altre due sequenze promoter, la sequenza inr (sequenza di riconoscimento interno, -2/+4) e la sequenza DPE (elemento di legame del TF II D, +28/+32). La sequenza inr è riconosciuta e legata dal fattore TF II D, che lega il DNA con due domini di legame, il primo che si complementa con la sequenza inr, il secondo che si complementa con la sequenza DPE.
L'enzima RNA polimerasi
L'RNA polimerasi è l'enzima che catalizza un filamento di RNA. Condizione necessaria affinché la trascrizione di un gene sia corretta è l'inizio di questa a partire esattamente dal primo nucleotide. Le sequenze descritte precedentemente formano una piattaforma molecolare ad incastro per l'RNA polimerasi, che posiziona il suo sito catalitico in corrispondenza del primo nucleotide in 5' del gene da trascrivere.
L'mRNA sintetizzato dalla RNA polimerasi possiede caratteristiche particolari: la sequenza 5'-UTR, trascritta e mai tradotta, ma indispensabile; la presenza all'interno dell'mRNA della tripletta AUG, che dà il via alla traduzione; a seguire sequenze esoniche ed introniche, queste ultime trascritte ed eliminate; quindi un'altra sequenza esonica seguita da una tripletta di stop della traduzione (UGA, UAA o UAG); una lunga sequenza nucleotidica trascritta e non tradotta 3'-UTR, che termina con una sequenza di taglio e poliadenilazione AAUAAA, comune in tutti i geni di II tipo; dopo 3 o 4 nucleotidi il processo di trascrizione viene interrotto e l'mRNA clivato viene arricchito in adenina (circa 200).
Formazione del complesso proteico PIC
Successivamente al legame della proteina TBP alla TATA box, avviene il reclutamento di altre proteine, che intervengono sequenzialmente, formanti il complesso proteico PIC (complesso di pre-inizio), un complesso proteico di massa molecolare complessiva pari a 1 milione di Da; le proteine facenti parte del PIC sono le TF II, che legano la TBP e vengono reclutate nel tempo nel seguente ordine: TF II D, TF II A, TF II B, TF II F, TF II E e TF II H.
Funzioni dei fattori di trascrizione
- TF II D è uno dei fattori accessori della TATA, chiamati TAF; è costituito da 11-12 proteine; la maggior parte di esse lega la TPB, nonostante questa sia di piccole dimensioni; due proteine legano invece il DNA a livello del DTE. Il posizionamento a ferro di cavallo del TF II D sul punto di flesso del DNA consente il contatto sia con la DTE che con la TBP.
- TF II A si lega al TF II D dopo l'interazione di quest'ultimo con le proteine DTE e TBP, stabilizzandone il legame.
- TF II B, unico monomero di tutti fattori del PIC, modifica la sequenza a valle della TATA box, linearizzando tramite il proprio finger B (una struttura del TF II B) circa 11-14 nucleotidi posti a valle del nucleotide +1 del gene, ed inglobando al suo interno i 15 posti a valle della TATA box. Il finger B è il sito di legame anche per l'RNA polimerasi. Il TF II F lega il finger B; esso è costituito da 4 subunità, ed è sempre legato con l'RNA polimerasi (è il suo chaperone). L'RNA polimerasi si accomoda su un lungo tratto di DNA (circa 240 Å), che si estende sia a monte che a valle del sito di start (-11/+3). Il TF II F, legandosi al finger B, consente il corretto inserimento dell'RNA polimerasi sul nucleotide +1 del gene; a seguito di ciò, il TF II F viene rilasciato. A questo punto, l'RNA polimerasi è inserita correttamente, ma è ancora inattiva e quindi la trascrizione non può ancora iniziare.
- Le condizioni che consentono l'attivazione della RNA polimerasi richiedono il coinvolgimento del TF II E, del TF II H e del complesso del mediatore. Quest'ultimo è un complesso di 52 proteine, multifunzionale, che recluta le proteine che modificano la cromatina (come ad esempio le HAT o i complessi di rimodellamento) e comunica con le proteina che legano sequenze enhancer e fattori di inizio della trascrizione generale.
- TF II E è il fattore necessario per il riconoscimento della RNA polimerasi da parte del TF II H, il vero attivatore dell'enzima. Il TF II H è costituito da almeno 9 subunità ed è fondamentale per il processo di inizio della trascrizione, perché possiede almeno tre attività enzimatiche: attività elicasica, attività 3'-5' esonucleasica ed attività chinasica. Le elicasi sono proteine che in presenza di ATP aprono l'elica, rompendo i legami a idrogeno e separando i due filamenti, con conseguente formazione di superavvolgimenti (ad esse sono quindi associate anche le topoisomerasi). Le 3'-5' esonucleasi sono capaci di idrolizzare i legami sintetizzati dall'RNA polimerasi, ed hanno quindi attività proof reading, ovvero hanno lo scopo di correggere gli errori commessi dall'RNA polimerasi (1 nucleotide ogni 10000 circa).
Attivazione della RNA polimerasi
Per quanto riguarda l'attività chinasica del TF II H, bisogna premettere che la RNA polimerasi II degli eucarioti è un complesso multiproteico costituito da 12 proteine, 5 delle quali costituiscono il core catalitico dell'enzima; le 5 subunità in questione prendono il nome di RBP 1, RBP 2, RBP 3, RBP 6 (identica in tutte e tre tipologie di RNA polimerasi) e RBP 11; ad esse sono associate altre 7 proteine, chiamate proteine accessorie. Le 5 proteine del core catalitico sono necessarie ed essenziali; sono assemblate con forma a chela di granchio, con la parte interna della chela chiamata wall; la RBP 1 e la RBP 2 sono le proteine di dimensioni maggiori che costituiscono la prima e la seconda chela; il wall è costituito dall'interfaccia di queste 2 proteine; è proprio questa la zona in cui è posizionato il sito catalitico dell'enzima.
La subunità RBP 1, inoltre, possiede una lunga catena carbossiterminale costituita da una ripetizione per 52 volte di un eptapeptide formato, in ordine dagli aminoacidi tirosina, serina, prolina, treonina, serina, prolina e serina; la presenza di molte serine nella catena carbossiterminale della subunità RBP 1, associata all'attività chinasica del TF II H, determina un evento chiave nell'avviamento della trascrizione, ovvero la fosforilazione delle serine di questa catena; la fosforilazione delle serine determina, infatti, l'attivazione della RNA polimerasi.
Tale fosforilazione ha un codice ben preciso: la fosforilazione esclusiva delle serine 5 è un segnale di attivazione della RNA polimerasi e di reclutamento delle proteine di maturazione dell'mRNA; la fosforilazione esclusiva delle serine 2 rende attiva l'RNA polimerasi, ma è un segnale di reclutamento delle proteine di splicing; la fosforilazione di entrambe le serine rende inattiva la RNA polimerasi. Altra caratteristica importante di questo eptapeptide è la presenza della prolina; tale aminoacido va incontro a processo di isomerizzazione, un processo che costituisce un ulteriore linguaggio di comunicazione tra la RNA polimerasi e le proteine accessorie.
Inizialmente, quindi, il TF II H ha attività serina 5 chinasica; idrolizza rapidamente ATP ed aumenta il livello di fosforilazione delle serine 5; la RNA polimerasi subisce la variazione conformazione di attivazione in modo graduale, via via che le serine 5 vengono fosforilate. Con la fosforilazione graduale delle serine 5, l'RNA polimerasi inizia la sintesi di mRNA; il filamento crescente di mRNA viene inserito, man mano che la sintesi di mRNA procede, nel canale di uscita dell'mRNA presente nell'RNA polimerasi; questo canale è, però, inizialmente occupato da...