anatomia dei genomi eucariotici
Anteprima
ESTRATTO DOCUMENTO
Sta diventando sempre più evidente che le ripetizioni disperse in tutto il genoma
svolgono un ruolo determinante nell’imporre una maggiore o minore compattezza al
genoma.
Ne è un esempio lampante il genoma di mais, che con le sue 2500 Mb è relativamente
piccolo per una pianta a fiore.
Anche in questo caso consideriamo un segmento di 50 kb del genoma di mais che si
estende a entrambi i lati di un membro della famiglia di geni dell’enzima alcool
deidrogenasi. Questo è l’unico gene
presente nella regione di 50
kb. La caratteristica
dominante di questo
segmento genomico è il
numero di sequenze ripetute:
si tratta di elementi LTR che costituiscono pressoché tutta la regione non codificante
del segmento e si stima rappresentino circa il 50% del genoma di mais.
Per quanto riguarda il genoma umano, questo è formato da 3.000.000.000 di paia di
basi, ha un contenuto in DNA dei cromosomi medio di 130 Mb (59 Mb-236 Mb), ha
circa 35.000 geni.
Operando un rapporto tra la dimensione del genoma in bp e il numero di geni ottengo
la dimensione genica del genoma umano, pari a 1/80 kb:
9
3∙10 /35000 = 1 gene ogni 80 kb circa
In realtà vi sono regioni geniche molto dense, in particolare la regione HLA (6p21.3)
con un gene ogni 13 kb. Per contro, la regione genica più lassa, con il minor contenuto
in geni, è la regione Xp21 (gene della Distrofina) che contiene un solo gene in 2,4 Mb e
ben 79 introni.
Rappresenta un’altra eccezione alla densità media di 1 gene ogni 80 kb, il DNA
mitocondriale. Questo contiene esclusivamente DNA codificante e presenta una
caratteristica peculiare rappresentata dai “geni sovrapposti”: le subunità 6 e 8
dell’ATPasi condividono la stessa sequenza di genoma mitocondriale; ciò che li
differenzia è il sito d’inizio della trascrizione, per cui ATG che codifica per la Met è il
codone d’inizio della trascrizione e risultato spostato per quanto riguarda l’ATPasi 6.
Anche la regione HLA sul cromosoma 6, pur contenendo 70 geni in 0,9 Mb, presenta
geni sovrapposti, a livello dei quali trascrivendo al contrario, utilizzando i due filamenti
di DNA è possibile produrre segmenti differenti e, dunque, proteine differenti.
Un’ultima caratteristica in termini di compattezza di densità genica è la presenza di
“geni dentro altri geni”. Non si tratta di un fenomeno frequente nel genoma umano:
per esempio, a livello del gene NF1 l’introne 27 (40 kb), contiene tre piccoli geni,
rispettivamente di 2.2, 10 e 4 kb, che vengono trascritti dal filamento opposto.
Allo stesso modo il fattore VIII della coagulazione: a livello dell’introne 22, F8A e F8B
(due geni paraloghi) utilizzano la stessa isola CpG e, dunque, lo stesso promotore, ma
trascrivono in senso opposto.
I geni eucariotici presentano una grande varietà di strutture e dimensioni.
Ad esempio nel genoma umano:
- Il gene più grande è quello della Distrofina (2.4 Mb, la sua trascrizione richiede
circa 16h) GLU
- I geni più piccoli codificano per RNA transfer; il più piccolo codifica per il tRNA
(69 bp)
La variabilità si riflette anche nel contenuto in introni ed esoni. Il numero di esoni può
variare da 1 per i geni privi di introni ( per es. molti geni per ncRNA, interferoni, istoni,
ribonucleasi, HSP, GPCR, ecc.) sino a 363 (gene per la Titina).
Allo stesso modo, le dimensioni di esoni e introni sono estremamente variabili. A fronte
di esoni costituiti da pochi nucleotidi, l’esone più grande è presente nel gene per ApoB
(con una dimensione di 7.6 kb).
Infine, le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli
ormoni) sino a molte migliaia (per esempio la Titina, proteina del muscolo scheletrico,
è formata da 38.138 aa). C.elegans
I geni umani contengono introni mediamente più lunghi dei geni di o
Drosophila. Esiste una stretta correlazione tra espressione genica ed introni. D’altro
canto, un gene che deve essere molto espressivo ha bisogno di essere processato
rapidamente: conseguentemente, la dimensione degli introni deve essere ridotta. Gli
introni dei geni altamente espressi sono circa 14 volte più corti dei geni scarsamente
espressi.
Allo stesso modo, nonostante ci siano differenze tra i vari eucarioti, la conservazione
C. elegans
della dimensione degli esoni dall’uomo al suggerisce una sostanziale
conservazione dei componenti dell’apparato di splicing. Nel genoma
umano,
l’insieme degli
esoni, con 48
Mb,
costituisce
appena l’1,5%
del totale. Al
contrario il
44% del
genoma è
occupato dalle
ripetizioni
estese.
La porzione codificante del genoma eucariotico è divisa in
- geni codificanti per proteine, in copia singola
- geni codificanti per proteine, organizzati in famiglie geniche
- geni per rRNA, tRNA ed istoni, organizzati in unità ripetute in tandem
- geni per ncRNA (non coding RNA)
I geni organizzati in famiglie geniche sono tra loro omologhi, e derivano da un evento
di duplicazione genica o di retrotrasposizione mediata da RNA. I membri di una
famiglia genica all’interno di uno stesso genoma sono detti “paraloghi”, e
normalmente si specializzano acquisendo funzioni distinte. Sono normalmente
localizzati vicini tra loro, consentendo al genoma un controllo simultaneo mediante
un’unica locus control region. RNA non codificanti
ncRNA. I genomi eucariotici codificano per un gran numero di
proteine ncRNA
( ). Si tratta di piccoli RNA che non hanno una funzione legata alle
proteine. Appartengono a questo gruppo:
small nucleolar RNA.
- snoRNA, Si tratta di RNA contenuti all’interno del nucleolo che
aiutano a processare l’RNA ribosomale. Ve ne sono sll’incirca 200.
RNA transfer.
- tRNA, Si tratta di RNA che, pur facendo parte del macchinario
tradizionale, non sono codificanti. Se ne conoscono circa 500.
small nuclear RNA.
- snRNA, Sono localizzati all’interno della matrice; sono ricchi in U
e numerati U1, U2, U3, etc. Sono coinvolti nello splicing. Si contano circa 100 tipi.
micro RNA.
- miRNA, Sono molecole endogene di RNA di dimensioni ridotte (20-22
bp), a singolo filamento. Ve ne sono circa 700. La loro trascrizione può avvenire ad
opera di geni che non codificano proteine e dotati di un proprio locus; in
alternativa, possono trovarsi all’interno di introni ed essere trascritti. Svolgono una
funzione di regolazione: si legano a frammenti a loro complementari bloccando la
trascrizione del gene.
Ad oggi, i micro RNA risultano particolarmente interessanti per il loro impiego in
terapia genica: per es, blocco della funzione di un oncogene mediante miRNA
sintetizzati in laboratorio, a partire dalla sequenza del gene che si vuole silenziare.
RNA antisenso.
- Sono RNA regolatori che inibiscono la trascrizione; si riconoscono
più di 1500 tipi. Sono prodotti a seguito della trascrizione del filamento antisenso
del RNA: si produce un RNA complementare che agisce silenziando un gene con
sequenza ad esso complementare.
- rRNA, RNA ribosomiale. Gli RNA ribosomali sono i componenti dei ribosomi,
particelle deputate alla sintesi delle proteine. Il genoma umano contiene differenti
tipi di rRNA, che si differenziano per i coefficienti di sedimentazione: riconosciamo
rRNA 5S, 28S, 5.8S e 18S.
→ I geni codificanti per i tRNA sono presenti in copie multiple nel genoma. Nel genoma
umano vi sono 497 geni per tRNA, che rappresentano 49 specie di tRNA sulla base
dell’anticodone (21 isoaccettori).
I geni per tRNA non sono dispersi nel genoma ma organizzati in cluster: più del 50%
sono localizzati sul cromosoma 6 (140 geni in una regione di 4Mpb) e sul cromosoma
1. Altri cromosomi hanno meno di 10 geni per tRNA.
Il numero di geni per i tRNA risulta correlato con le dimensioni degli oociti. Le
dimensioni degli oociti sono, a loro volte, correlate con le dimensioni dell’organismo:
esiste, dunque, una sorta di costrizione evolutive a clusterizzare i geni per i tRNA e
correlarli con la dimensione finale dell’organismo.
→I geni codificanti gli rRNA 28S, 5,8S e 18S sono organizzati in un’unità trascrizionale
ripetuta in tandem. Nel genoma umano, le ripetizioni sono organizzate in 5 cluster di
circa 150-200 copie presenti sul braccio corto dei cromosomi 13,14,15, 21 e 22. I geni
l’rRNA 5S sono organizzati in unità ripetute che formano un cluster di circa 200-300
geni in prossimità dell’estremità telomerica del cromosoma 1.
Il genoma è dinamico. La dinamicità del genoma deriva dal fatto che, ogni qualvolta
esso si replica, è soggetto all’insorgenza di nuove mutazioni, eventi di delezione,
duplicazione, che hanno consentito al genoma di espandersi o accorciarsi (per es.
mtDNA). Allo stesso modo il genoma può acquisire nuovi geni mediante trasferimento
di elementi trasponibili.
L’organizzazione del genoma umano può essere meglio compresa dallo studio della
cinetica di denaturazione/rinaturazione del DNA. In particolare, è possibile osservare
come la curva di riassociazione del DNA umano sia costituita da una sigmoide a tre
plateu. Dal confronto di questa curva con quella di E. coli, fago λ e polyU, si osserva
che:
- la prima curva rappresenta una sequenza uniforme, costituita da poliyU:polyA. Il
filamento double straind
viene denaturato ad alta
temperatura; riducendo
progressivamente la
temperatura la sequenza
di polyU si riassocia a
quella di polyA. La
cinetica è semplice:
all’inizio, la riassoci
azione è veloce, per
rallentare
progressivamente.
- Molto simile è la curva di
riazzociazione del fago λ.
- Lo stesso tipo di
andamento si riscontra
anche in E. coli, seppur
più lento a seguito della maggiore complessità del genoma batterico.
- Il genoma umano ha una cinetica di riassociazione che può essere divisa in tre fasi.
La prima fase è lenta, in quanto il DNA è costituito da sequenze uniche, a singola
copia; segue la porzione intermedia; infine vi è quella veloce, che rinatura subito
perché altamente ripetitiva.
La cinetica di riassociazione del genoma è espressa mediante un parametro “C t”
0
(associazione x tempo), in cui C rappresenta la concentrazione 0, alla quale il 50% del
0
genoma è rinaturato.
Quando si effettua un esperimento di denaturazione: all’inizio della reazione tutto il
DNA è presente in singola copia;
man mano che il tempo scorre,
ogni sequenza cerca quella ad
essa complementare. Esiste un
punto nella sigmoide, in cui
C t=1, per il quale il 50% del
0
genoma sottoposto alla
reazione si è legato al proprio
complementare.
È chiaro che l’andamento della
curva riflette la composizione
del genoma umano:
- all’inizio rinaturano le
sequenze altamente
ripetute, che rappresentano circa il 10% del genoma;
- in un secondo momento rinaturano le sequenze moderatamente ripetute, che
costituiscono il 30% del genoma totale;
- infine rinaturano le sequenze uniche, che nel loro insieme formano il 60% del
genoma.
Se si osserva la distribuzione del DNA, è possibile osservare che:
- Il DNA moderatamente ripetuto rappresenta la porzione intermedia
- Il DNA altamente
ripetuto costituisce la
componente “fast”.
Questo include:
trasposoni inattivi,
copie geniche inattive,
ripetizioni di sequenze
semplici, sequenze
ripetute in tandem,
duplicazioni segmentali.
- Il DNA presente in
sequenze uniche
costituisce la porzione
lenta.
Il 25% del genoma si trova
nella componente fast;
questa ha un valore C0t 1/2
basso e ha una frequenza di ripetizioni molto elevate (500.000 bp).
Il 30% del genoma fa parte della componente intermedia: ha un valore di C0t di 1,9 e
1/2
una frequenza di ripetizioni di sole 350 bp.
Infine, il restante 45% del genoma rappresenta la componente slow: ha un valore di
C0t molto alto (630) e una frequenza di ripetizioni di 1 bp.
1/2 DNA ripetitivo codificante? famiglie
Esiste il Si. Questo è rappresentato dalle
multigeniche .
Due sequenze vengono definite come appartenenti alla stessa famiglia quando
presentano omologia di sequenza, anche in una regione ristretta della sequenza:
poiché le proteine sono caratterizzate da domini, l’esistenza di domini condivisi tra i
geni fa si che questi appartengano alla stessa sequenza.
L’omologia di sequenza indica una recente comune origine evolutiva, intendendo con
il termine “origine” duplicazioni successive da poche sequenze ancestrali. L’origine
evolutiva comune sottintende un’omologia di funzione.
A tal proposito, distinguiamo:
- Famiglie geniche con funzioni identiche. Queste comprendono, tra le altre, i geni
istonici. Hanno un numero di copie pari a 100. Sono raggruppati in pochi punti (per
es. 6 e 12q); particolarmente notevole è il raggruppamento composito in 1p21.
Sono privi di introni.
- Famiglie geniche con funzioni simili. Queste includono il raggruppamento dei geni
dei geni α-globinici. Tutto il sistema immunitario è organizzato in modo che le
proteine antigeniche abbiano la medesima struttura, costituita da porzioni variabili
e porzioni costanti unite da ponti di solfuro. Le immunoglobuline hanno, dunque,
una struttura condivisa che si riflette sul genoma. Il cluster dei geni α-globinici è
localizzato sul cromosoma 16p13.3 ed è organizzato in modo tale che vi siano
prima i geni della porzione costante seguiti da quelli della regione variabile: i
meccanismi dello splicing alternativo fanno si che le porzioni variabili e costanti si
uniscano tra di loro in modo da produrre proteine funzionali.
- Famiglie geniche con funzioni correlate. Appartengono a questa classe i geni delle
DEAD Box: DEAD vuol dire letteralmente Asp-Glu-Ala-Asp, ma può assumere anche
il significato di “morto”, trattandosi di geni coinvolti nel processo di apoptosi.
Uno degli esempi migliori di famiglia multigenica è rappresentato dai geni per le
globine nei mammiferi. Le globine sono proteine del sangue che si associano per
formare l’emoglobina, costituita da due globine di tipo α e due di tipo β.
Nell’uomo le globine di tipo α sono codificate da una piccola famiglia multi genica
presente sul cromosoma 16 e le globine di tipo β da una seconda famiglia sul
cromosoma 11. Questi geni sono stati fra i primi ad essere sequenziali alla fine degli
anni ’70.
Le sequenze avevano dimostrato che entrambi i raggruppamenti contengono geni che
sono espressi in stadi diversi dello sviluppo e ciascuno contiene almeno uno
pseudogene: è da notare che lo pseudo gene θ è espresso, ma il suo prodotto proteico
è inattivo; nessuno degli altri pseudo geni è espresso.
I geni globinici si sono evoluti da un ancestore comune, il quale, nel corso
dell’evoluzione, è andato incontro a diversi fenomeni.
Dallo studio della conservazione di sequenza è emerso che il primo fenomeno
nell’origine dei geni globinici è
rappresentato dalla duplicazione
genica: si sono, così, formati due
geni che hanno poi subito fenomeni
di divergenza, consistenti
nell’accumulo di mutazioni. I
progenitori dei geni α e β hanno poi
subito una traslocazione
cromosomica, essendo oggi
localizzati su cromosomi differenti.
Infine, a livello dei singoli
cromosomi, si sono verificati altri
eventi di duplicazione e di
divergenza, che hanno portato alle
differenze esistenti all’interno di
ciascun cluster.
Esiste una stretta correlazione tra le differenze a livello del genoma e le differenze
funzionali. Anzitutto, l’esistenza dei cluster è subordinata controllo operato dalla Locus
Control Region (LCR).
Le LCR si trovano a monte dei raggruppamenti e la loro funzione sarebbe quella di
organizzare il raggruppamento in un dominio di cromatina attiva, agendo da enhancer.
La regolazione dell’espressione geni globinici è funzionale al fatto che l’ espressione
modulata nel corso dello sviluppo produce forme di emoglobina differenti nei diversi
stadi: embrione, feto, adulto. La differenza è legata alla diversa affinità per l’ossigeno
necessaria nei diversi periodi di sviluppo. Si instaura perciò l’alternanza delle
emoglobine.
A livello molecolare, l’alternanza delle emoglobine dipende da fenomeni di
competizione dei geni per interagire con le LCR, ed intervento di silenziatori gene-
specifici, modulati durante lo sviluppo.
Le LCR sono state scoperte la prima volta durante uno studio dei geni umani per la β-
globina. La LCR della globina è
contenuta in un tratto di DNA di circa
12 kb di lunghezza, posizionato a
monte dei geni, nel dominio funzionale
di 60 kb della β-globina. Studi più
dettagliati hanno mostrato che la LCR
β-globinica contiene cinque diversi siti
ipersensibili alla DNAasi, brevi regioni di
DNA che vengono tagliate dalla DNAasi
I più facilmente di altre regioni del
dominio funzionale.
una serie di siti ipersensibili sono localizzati nel tratto di DNA di 20 kb a monte del
cluster dei geni per la β-globina umana. Questi siti segnano la posizione della regione
di controllo del locus.
Ulteriori siti ipersensibili sono localizzati immediatamente a monte di ciascun gene,
nelle posizioni in cui l’RNA polimerasi si lega al DNA. Questi siti ipersensensibili sono
specifici per i diversi stadi di sviluppo e sono evidenziabili solo durante la fase di
sviluppo in cui il gene adiacente è attivo.
La LCR funge da enhancer. Affinché ciascun gene possa codificare il proprio prodotto, il
promotore deve poter avvicinarsi alla LCR.
Per fare ciò, il DNA si piega a formare un’ansa, in modo che la LCR vada a trovarsi così
vicina da riuscire a legarsi sia al
gene da esprimere che alla RNA
polimerasi. Man mano che l’affinità
cambia, la LCR si sposta in
corrispondenza della regione da
esprimere, seguita dal complesso
trascrizionale, mentre la PYR,
proteina ricca di pirimidine, inibisce
tutto ciò che si trova a valle.
Circa il 44% del genoma umano è occupato dalle ripetizioni estese. Una buona
pseudogeni
porzione di questa percentuale è rappresentata dagli , definite come
copie funzionali di un gene o parte di un gene. Gli pseudogeni sono una sorta di relitti
evolutivi i quali dimostrano che il genoma umano è continuamente soggetto a
cambiamenti. Originano, infatti, in seguito a duplicazione genica e progressivo
accumulo di mutazioni.
Esistono due tipi principali di pseduogeni, a seconda che l’evento di duplicazione
genica sia seguito da una lenta o da una rapida diversificazione.
Quest’ultima dipende dal numero di mutazioni che si verificano all’interno della
sequenza: - una sola
mutazione può avere un
effetto minimo sull’attività
di un gene, originando un
gene un gene polimorfico
ma con “funzione
originale”; - all’aumentare
del numero delle
mutazioni aumenta la
diversificazione genica,
per cui si possono formare
geni con “funzione
correlata” o geni con
“nessuna funzione”.
In genomica, si è soliti distinguere gli pseudo geni in due grandi classi:
Pseudogeni non processati.
1. Sono copie di un DNA genomico ma non sono
funzionali. La natura non funzionale può essere riconosciuta, a livello di sequenza
da:
- Presenza di codoni di stipo nella porzione codificante, a seguito di mutazioni;
- Presenza di un elevato numero di mutazioni ognuna delle quali darebbe origine
a una molecola mutante.
Contengono esoni, introni e spesso sequenze fiancheggianti.
La famiglia dei geni HLA di classe I è un classico esempio di raggruppamento
genico caratterizzato da pseudogeni.
(B) Sono stati identificati 17 membri di una famiglia raggruppati in circa 2 Mb e
comprendenti: sei geni
espressi (rettangoli neri),
quattro pseudo non
processati a lunghezza
piena (ψ, psi) e numerose
copie geniche parziali
(rettangoli piccoli e vuoti).
(A) L’mRNA a lunghezza
piena contiene una
sequenza che codifica un
polipeptide. I rettangoli
rappresentano i diversi
domini: L , la sequenza
guida o leader; α α α , i
1 2 3
domini extracellulari; TM,
la sequenza transmembrana; CIT, la coda citoplasmatica; una sequenza non
tradotta in 3’ (3’-UTR).
Pseudogeni processati.
2. Si tratta di copie geniche difettive che contengono
sequenze corrispondenti agli esoni di un gene funzionale (ma non gli introni) e di
solito ad un’estremità contengono una sequenza di oligo(dA)/(dT). Tali pseudo geni
processati sono copiati a livello di cDNA per retrotrasposizione. Derivano, dunque,
da mRNA codificante polipeptidi e, quindi, da geni trascritti dalla RNApol-II. Le
trascrittasi inverse cellulari trascrivono l’mRNA in un cDNA naturale che può
integrarsi nel DNA cromosomico. La figura
mostra un
modello per
l’integrazione,
che
rappresenta
solo una delle
diverse
possibilità. Tale
modello
considera
l’integrazione in punti di rottura sfalsati (indicati dalle frecce serpeggianti) in
sequenze ricche di A. Se la sezione ricca in A viene inclusa in una sporgenza in 5’,
potrebbe formare un ibrido con l’estremità distale poli(T) del cDNA, facilitando la
sintesi del secondo filamento. E1-E3 rappresentano gli esoni; P il promotore.
Le copie trasposte non hanno un promotore, per cui solitamente non vengono
espresse ed hanno il modo di acquisire mutazioni deleterie (pseudogeni
processati ).
Benché gli pseudogeni processati solitamente non vengono espressi (perché sono
privi di una sequenza promotoriale), si conoscono alcuni esempi di geni processati
espressi. In questi casi, il cDNA naturale è stato integrato in un sito di DNA
cromosomico, il quale casualmente si trova a essere adiacente a un promotore, che
può guidarne l’espressione.
La sequenza del genoma umano ha mostrato che circa il 62% è costituito da “regioni
intergeniche”, parti del genoma che si trovano tra i geni e la cui funzione è
sconosciuta. Queste sequenze venivano chiamate DNA spazzatura (junk DNA); ma il
termine è oggi caduto in disuso.
Nella maggior parte degli organismi il DNA intergenico è rappresentato per lo più da
sequenze ripetute di un tipo o di un altro. Il DNA ripetitivo può essere diviso in due
categorie:
1. DNA ripetuto in tandem, le cui unità ripetute sono localizzate una a fianco all’altra.
La localizzazione è varia, per cui i blocchi possono mappare su più cromosomi. A
seconda delle dimensioni medie delle unita si suddivide in:
- DNA satellite
- DNA minisatellite
- DNA microsatellite
Ripetizioni intersperse
2. o
disperse in tutto il genoma, che
sono distribuite in maniera
apparentemente casuale lungo
tutto il genoma. Hanno, in realtà
una localizzazione preferenziale
in alcune bande cromosomiche.
Contengono sequenze che
possono essere retrotrasposte attraverso un intermedio di RNA.
DNA satellite,
Il DNA ripetuto in tandem è anche chiamato perché i frammenti di DNA
che contengono tali ripetizioni formano bande “satelliti” quando il DNA genomico
viene frazionato mediante centrifugazione in gradiente di densità.
IL DNA umano ha un contenuto medio di CG del 40,3%
-3
e una densità di galleggiamento di 1,701 g cm . I
frammenti che comprendono per lo più DNA a singola
elica hanno un contenuto in CG vicino a questa media e
sono localizzati nella banda principale nel gradiente di
densità. -3
Le bande satelliti a 1.687, 1.693 e 1.697 g cm sono
costituite da frammenti che contengono DNA ripetitivo,
il cui contenuto in CG dipende dal tipo di sequenze
ripetute e quindi può essere diverso da quello medio
del genoma. Questi frammenti hanno, quindi, densità
diverse dal DNA a singola copia e migrano in posizioni
diverse nel gradiente di densità.
Il DNA ripetuto origina primariamente
da un evento di amplificazione del
genoma e in particolar modo da uno
shift del segmento antisenso, durante
la replicazione. L’amplificazione è,
poi, seguita da divergenza tra le
unità ripetute. Infine, ogni volta che
si replica il DNA si verificaro delle
amplificazioni secondarie, per cui
aumenta l’unità base del repeat.
Si pensa che le unità corte ripetute in
tandem siano soggette
all’appaiamento errato causato da
slittamento di un filamento, ad esempio, l’appaiamento errato dei filamenti
complementari di un DNA a doppia elica.
Gli esempi mostrano come l’errato appaiamento del filamento slittato possa verificarsi
durante la replicazione,
con il filamento inferiore
che rappresenta un
filamento di DNA
parentale e il filamento
superiore che
rappresenta il filamento
complementare neo
sintetizzato.
In questi casi lo
slittamento coinvolge una
regionde id non
appaiamento
(rappresentata come una
bolla), che contiene una o
più unità ripetute del
filamento neo-
sintetizzato (slittamento
all’indietro) o del
filamento parentale (slittamento in avanti), causando rispettivamente l’inserzione o la
delezione sul filamento neo-sintetizzato.
La sequenza di triplette può espandersi sia durante la meiosi che durante la mitosi,
determinando nell’ultimo caso mosaicismo cellulare, ossia un numero di ripetizioni
diverso tra i tessuti.
Talvolta, le corte ripetizioni in tandem che si trovano all’interno o nelle immediate
vicinanze di un gene possono andare incontro a notevoli espansioni della loro
lunghezza e influire sull’espressione del gene con conseguenze patologiche. Difatti, la
ripetizione espansa è instabile, cioè tende a variare di dimensione nel corso di
generazioni successive, aumentando il potenziale patogeno. Quando si parla di
espansioni di triplette, è bene precisare che esiste una dimensione soglia delle
espansioni, sotto la quale la ripetizione non è patogena e sopra la quale è invece
causa di malattia.
L’espansione di triplette è un evento così perturbante a livello genomico, da rendere
ovvio il suo coinvolgimento in varie patologie.
Il genoma possiede differenti meccanismi di controllo, per cui per ogni tripletta esiste
una “soglia molecolare” al di sotto della quale un certo numero di ripetizione (circa 50)
è tollerabile, in quanto il macchinario replicativo è in grado di mantenere la fedeltà
della replicazione. Allo stesso modo, esiste una “soglia fenotipica” per la quale un
numero di ripetizioni superiore a 200 causa un fenotipo malato, a seguito del
verificarsi di fenomeni come la metilazione di sequenza o il blocco della trascrizione.
Per esempio, nella Sindrome dell’X-fragile, le espansioni molto ampie causano perdita
di funzione della proteina o abolizione della trascrizione del gene. In questo caso, man
mano che le espansioni aumentano, il nucleosoma aperto, trascrizionalmente attivo e
con una singola CGG repeat, diventa un closed nucleosome, trascrizionalmente
inattivo: ciò è dovuto all’ accumulo di metilazioni, per cui tali proteine metilate
avvolgono maggiormente il nucleo soma impedendo la trascrizione.
Esiste un secondo meccanismo patogeno, come nel caso della Corea di Huntington,
per il quale le ripetizioni CAG codificano tratti di poliGLU nel prodotto genico, che si
aggregano nelle cellule inducendo tossicità. Nella Corea di Huntington il potenziale
patogeno è legato alla precipitazione dei tratti poliglutamminici insolubili. La
precipitazione impedisce il riconoscimento da parte del meccanismo deputato alla loro
degradazione. Normalmente si assiste al reclutamento del proteasoma che, attraverso
l’ubiquitina, induce la degradazione della proteina mal funzionante.
La formazione dei tratti poliGlu non solo impedisce il reclutamento proteasoma ma
causa anche l’induzione dell’apoptosi da parte della Caspasi III. Ciò che ne consegue è
la morte neuronale prematura, in particolare riferita ai gangli basali.
Quasi tutto il DNA ripetitivo non codificante distribuito nel genoma umano deriva da
trasposoni,
“elementi trasponibili”, detti anche sequenze di DNA mediamente ripetuto
che possono localizzarsi in regioni diverse del genoma. Quasi il 45% del genoma è
assegnabile a questa classe, alla quale appartengono 350.000 copie di diversi tipi.
Le sequenze ripetute disperse si sono originate da eventi di duplicazione e successiva
trasposizione, per cui il risultato è stato una copia di un’unità ripetuta in una posizione
nel genoma distante da quella della sequenza originaria.
Nell’uomo e negli altri mammiferi esistono quattro classi principali di trasposoni,
distinti in due gruppi, a seconda del metodo di trasposizione:
“retrotrasposoni”.
1. I In questo caso il meccanismo di copia utilizza una trascrittasi
inversa per produrre copie di cDNA da trascritti di RNA. La trasposizione re plicativa
(o per copia) assicura che venga fatta una copia di una sequenza esistente,
I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Fredo88 di informazioni apprese con la frequenza delle lezioni di Genomica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Calabria - Unical o del prof Dato Serena.
Acquista con carta o conto PayPal
Scarica il file tutte le volte che vuoi
Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato