Che materia stai cercando?

anatomia dei genomi eucariotici Appunti scolastici Premium

Lunghezza del genoma; contenuto di DNA; paradosso del valore C; numero di geni e di cromosomi; densità genica; isole CpG; isocore; RNA codificante e non codificante; denaturazione/rinaturazione; famiglie multigeniche; pseudogeni; DNA intergenico (DNA satellite, trasposoni e retrotrasposoni); genoma di Drosophila; DNA mitocondriale.

Esame di Genomica docente Prof. S. Dato

Anteprima

ESTRATTO DOCUMENTO

Sta diventando sempre più evidente che le ripetizioni disperse in tutto il genoma

svolgono un ruolo determinante nell’imporre una maggiore o minore compattezza al

genoma.

Ne è un esempio lampante il genoma di mais, che con le sue 2500 Mb è relativamente

piccolo per una pianta a fiore.

Anche in questo caso consideriamo un segmento di 50 kb del genoma di mais che si

estende a entrambi i lati di un membro della famiglia di geni dell’enzima alcool

deidrogenasi. Questo è l’unico gene

presente nella regione di 50

kb. La caratteristica

dominante di questo

segmento genomico è il

numero di sequenze ripetute:

si tratta di elementi LTR che costituiscono pressoché tutta la regione non codificante

del segmento e si stima rappresentino circa il 50% del genoma di mais.

Per quanto riguarda il genoma umano, questo è formato da 3.000.000.000 di paia di

basi, ha un contenuto in DNA dei cromosomi medio di 130 Mb (59 Mb-236 Mb), ha

circa 35.000 geni.

Operando un rapporto tra la dimensione del genoma in bp e il numero di geni ottengo

la dimensione genica del genoma umano, pari a 1/80 kb:

9

3∙10 /35000 = 1 gene ogni 80 kb circa

In realtà vi sono regioni geniche molto dense, in particolare la regione HLA (6p21.3)

con un gene ogni 13 kb. Per contro, la regione genica più lassa, con il minor contenuto

in geni, è la regione Xp21 (gene della Distrofina) che contiene un solo gene in 2,4 Mb e

ben 79 introni.

Rappresenta un’altra eccezione alla densità media di 1 gene ogni 80 kb, il DNA

mitocondriale. Questo contiene esclusivamente DNA codificante e presenta una

caratteristica peculiare rappresentata dai “geni sovrapposti”: le subunità 6 e 8

dell’ATPasi condividono la stessa sequenza di genoma mitocondriale; ciò che li

differenzia è il sito d’inizio della trascrizione, per cui ATG che codifica per la Met è il

codone d’inizio della trascrizione e risultato spostato per quanto riguarda l’ATPasi 6.

Anche la regione HLA sul cromosoma 6, pur contenendo 70 geni in 0,9 Mb, presenta

geni sovrapposti, a livello dei quali trascrivendo al contrario, utilizzando i due filamenti

di DNA è possibile produrre segmenti differenti e, dunque, proteine differenti.

Un’ultima caratteristica in termini di compattezza di densità genica è la presenza di

“geni dentro altri geni”. Non si tratta di un fenomeno frequente nel genoma umano:

per esempio, a livello del gene NF1 l’introne 27 (40 kb), contiene tre piccoli geni,

rispettivamente di 2.2, 10 e 4 kb, che vengono trascritti dal filamento opposto.

Allo stesso modo il fattore VIII della coagulazione: a livello dell’introne 22, F8A e F8B

(due geni paraloghi) utilizzano la stessa isola CpG e, dunque, lo stesso promotore, ma

trascrivono in senso opposto.

I geni eucariotici presentano una grande varietà di strutture e dimensioni.

Ad esempio nel genoma umano:

- Il gene più grande è quello della Distrofina (2.4 Mb, la sua trascrizione richiede

circa 16h) GLU

- I geni più piccoli codificano per RNA transfer; il più piccolo codifica per il tRNA

(69 bp)

La variabilità si riflette anche nel contenuto in introni ed esoni. Il numero di esoni può

variare da 1 per i geni privi di introni ( per es. molti geni per ncRNA, interferoni, istoni,

ribonucleasi, HSP, GPCR, ecc.) sino a 363 (gene per la Titina).

Allo stesso modo, le dimensioni di esoni e introni sono estremamente variabili. A fronte

di esoni costituiti da pochi nucleotidi, l’esone più grande è presente nel gene per ApoB

(con una dimensione di 7.6 kb).

Infine, le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli

ormoni) sino a molte migliaia (per esempio la Titina, proteina del muscolo scheletrico,

è formata da 38.138 aa). C.elegans

I geni umani contengono introni mediamente più lunghi dei geni di o

Drosophila. Esiste una stretta correlazione tra espressione genica ed introni. D’altro

canto, un gene che deve essere molto espressivo ha bisogno di essere processato

rapidamente: conseguentemente, la dimensione degli introni deve essere ridotta. Gli

introni dei geni altamente espressi sono circa 14 volte più corti dei geni scarsamente

espressi.

Allo stesso modo, nonostante ci siano differenze tra i vari eucarioti, la conservazione

C. elegans

della dimensione degli esoni dall’uomo al suggerisce una sostanziale

conservazione dei componenti dell’apparato di splicing. Nel genoma

umano,

l’insieme degli

esoni, con 48

Mb,

costituisce

appena l’1,5%

del totale. Al

contrario il

44% del

genoma è

occupato dalle

ripetizioni

estese.

La porzione codificante del genoma eucariotico è divisa in

- geni codificanti per proteine, in copia singola

- geni codificanti per proteine, organizzati in famiglie geniche

- geni per rRNA, tRNA ed istoni, organizzati in unità ripetute in tandem

- geni per ncRNA (non coding RNA)

I geni organizzati in famiglie geniche sono tra loro omologhi, e derivano da un evento

di duplicazione genica o di retrotrasposizione mediata da RNA. I membri di una

famiglia genica all’interno di uno stesso genoma sono detti “paraloghi”, e

normalmente si specializzano acquisendo funzioni distinte. Sono normalmente

localizzati vicini tra loro, consentendo al genoma un controllo simultaneo mediante

un’unica locus control region. RNA non codificanti

ncRNA. I genomi eucariotici codificano per un gran numero di

proteine ncRNA

( ). Si tratta di piccoli RNA che non hanno una funzione legata alle

proteine. Appartengono a questo gruppo:

small nucleolar RNA.

- snoRNA, Si tratta di RNA contenuti all’interno del nucleolo che

aiutano a processare l’RNA ribosomale. Ve ne sono sll’incirca 200.

RNA transfer.

- tRNA, Si tratta di RNA che, pur facendo parte del macchinario

tradizionale, non sono codificanti. Se ne conoscono circa 500.

small nuclear RNA.

- snRNA, Sono localizzati all’interno della matrice; sono ricchi in U

e numerati U1, U2, U3, etc. Sono coinvolti nello splicing. Si contano circa 100 tipi.

micro RNA.

- miRNA, Sono molecole endogene di RNA di dimensioni ridotte (20-22

bp), a singolo filamento. Ve ne sono circa 700. La loro trascrizione può avvenire ad

opera di geni che non codificano proteine e dotati di un proprio locus; in

alternativa, possono trovarsi all’interno di introni ed essere trascritti. Svolgono una

funzione di regolazione: si legano a frammenti a loro complementari bloccando la

trascrizione del gene.

Ad oggi, i micro RNA risultano particolarmente interessanti per il loro impiego in

terapia genica: per es, blocco della funzione di un oncogene mediante miRNA

sintetizzati in laboratorio, a partire dalla sequenza del gene che si vuole silenziare.

RNA antisenso.

- Sono RNA regolatori che inibiscono la trascrizione; si riconoscono

più di 1500 tipi. Sono prodotti a seguito della trascrizione del filamento antisenso

del RNA: si produce un RNA complementare che agisce silenziando un gene con

sequenza ad esso complementare.

- rRNA, RNA ribosomiale. Gli RNA ribosomali sono i componenti dei ribosomi,

particelle deputate alla sintesi delle proteine. Il genoma umano contiene differenti

tipi di rRNA, che si differenziano per i coefficienti di sedimentazione: riconosciamo

rRNA 5S, 28S, 5.8S e 18S.

→ I geni codificanti per i tRNA sono presenti in copie multiple nel genoma. Nel genoma

umano vi sono 497 geni per tRNA, che rappresentano 49 specie di tRNA sulla base

dell’anticodone (21 isoaccettori).

I geni per tRNA non sono dispersi nel genoma ma organizzati in cluster: più del 50%

sono localizzati sul cromosoma 6 (140 geni in una regione di 4Mpb) e sul cromosoma

1. Altri cromosomi hanno meno di 10 geni per tRNA.

Il numero di geni per i tRNA risulta correlato con le dimensioni degli oociti. Le

dimensioni degli oociti sono, a loro volte, correlate con le dimensioni dell’organismo:

esiste, dunque, una sorta di costrizione evolutive a clusterizzare i geni per i tRNA e

correlarli con la dimensione finale dell’organismo.

→I geni codificanti gli rRNA 28S, 5,8S e 18S sono organizzati in un’unità trascrizionale

ripetuta in tandem. Nel genoma umano, le ripetizioni sono organizzate in 5 cluster di

circa 150-200 copie presenti sul braccio corto dei cromosomi 13,14,15, 21 e 22. I geni

l’rRNA 5S sono organizzati in unità ripetute che formano un cluster di circa 200-300

geni in prossimità dell’estremità telomerica del cromosoma 1.

Il genoma è dinamico. La dinamicità del genoma deriva dal fatto che, ogni qualvolta

esso si replica, è soggetto all’insorgenza di nuove mutazioni, eventi di delezione,

duplicazione, che hanno consentito al genoma di espandersi o accorciarsi (per es.

mtDNA). Allo stesso modo il genoma può acquisire nuovi geni mediante trasferimento

di elementi trasponibili.

L’organizzazione del genoma umano può essere meglio compresa dallo studio della

cinetica di denaturazione/rinaturazione del DNA. In particolare, è possibile osservare

come la curva di riassociazione del DNA umano sia costituita da una sigmoide a tre

plateu. Dal confronto di questa curva con quella di E. coli, fago λ e polyU, si osserva

che:

- la prima curva rappresenta una sequenza uniforme, costituita da poliyU:polyA. Il

filamento double straind

viene denaturato ad alta

temperatura; riducendo

progressivamente la

temperatura la sequenza

di polyU si riassocia a

quella di polyA. La

cinetica è semplice:

all’inizio, la riassoci

azione è veloce, per

rallentare

progressivamente.

- Molto simile è la curva di

riazzociazione del fago λ.

- Lo stesso tipo di

andamento si riscontra

anche in E. coli, seppur

più lento a seguito della maggiore complessità del genoma batterico.

- Il genoma umano ha una cinetica di riassociazione che può essere divisa in tre fasi.

La prima fase è lenta, in quanto il DNA è costituito da sequenze uniche, a singola

copia; segue la porzione intermedia; infine vi è quella veloce, che rinatura subito

perché altamente ripetitiva.

La cinetica di riassociazione del genoma è espressa mediante un parametro “C t”

0

(associazione x tempo), in cui C rappresenta la concentrazione 0, alla quale il 50% del

0

genoma è rinaturato.

Quando si effettua un esperimento di denaturazione: all’inizio della reazione tutto il

DNA è presente in singola copia;

man mano che il tempo scorre,

ogni sequenza cerca quella ad

essa complementare. Esiste un

punto nella sigmoide, in cui

C t=1, per il quale il 50% del

0

genoma sottoposto alla

reazione si è legato al proprio

complementare.

È chiaro che l’andamento della

curva riflette la composizione

del genoma umano:

- all’inizio rinaturano le

sequenze altamente

ripetute, che rappresentano circa il 10% del genoma;

- in un secondo momento rinaturano le sequenze moderatamente ripetute, che

costituiscono il 30% del genoma totale;

- infine rinaturano le sequenze uniche, che nel loro insieme formano il 60% del

genoma.

Se si osserva la distribuzione del DNA, è possibile osservare che:

- Il DNA moderatamente ripetuto rappresenta la porzione intermedia

- Il DNA altamente

ripetuto costituisce la

componente “fast”.

Questo include:

trasposoni inattivi,

copie geniche inattive,

ripetizioni di sequenze

semplici, sequenze

ripetute in tandem,

duplicazioni segmentali.

- Il DNA presente in

sequenze uniche

costituisce la porzione

lenta.

Il 25% del genoma si trova

nella componente fast;

questa ha un valore C0t 1/2

basso e ha una frequenza di ripetizioni molto elevate (500.000 bp).

Il 30% del genoma fa parte della componente intermedia: ha un valore di C0t di 1,9 e

1/2

una frequenza di ripetizioni di sole 350 bp.

Infine, il restante 45% del genoma rappresenta la componente slow: ha un valore di

C0t molto alto (630) e una frequenza di ripetizioni di 1 bp.

1/2 DNA ripetitivo codificante? famiglie

Esiste il Si. Questo è rappresentato dalle

multigeniche .

Due sequenze vengono definite come appartenenti alla stessa famiglia quando

presentano omologia di sequenza, anche in una regione ristretta della sequenza:

poiché le proteine sono caratterizzate da domini, l’esistenza di domini condivisi tra i

geni fa si che questi appartengano alla stessa sequenza.

L’omologia di sequenza indica una recente comune origine evolutiva, intendendo con

il termine “origine” duplicazioni successive da poche sequenze ancestrali. L’origine

evolutiva comune sottintende un’omologia di funzione.

A tal proposito, distinguiamo:

- Famiglie geniche con funzioni identiche. Queste comprendono, tra le altre, i geni

istonici. Hanno un numero di copie pari a 100. Sono raggruppati in pochi punti (per

es. 6 e 12q); particolarmente notevole è il raggruppamento composito in 1p21.

Sono privi di introni.

- Famiglie geniche con funzioni simili. Queste includono il raggruppamento dei geni

dei geni α-globinici. Tutto il sistema immunitario è organizzato in modo che le

proteine antigeniche abbiano la medesima struttura, costituita da porzioni variabili

e porzioni costanti unite da ponti di solfuro. Le immunoglobuline hanno, dunque,

una struttura condivisa che si riflette sul genoma. Il cluster dei geni α-globinici è

localizzato sul cromosoma 16p13.3 ed è organizzato in modo tale che vi siano

prima i geni della porzione costante seguiti da quelli della regione variabile: i

meccanismi dello splicing alternativo fanno si che le porzioni variabili e costanti si

uniscano tra di loro in modo da produrre proteine funzionali.

- Famiglie geniche con funzioni correlate. Appartengono a questa classe i geni delle

DEAD Box: DEAD vuol dire letteralmente Asp-Glu-Ala-Asp, ma può assumere anche

il significato di “morto”, trattandosi di geni coinvolti nel processo di apoptosi.

Uno degli esempi migliori di famiglia multigenica è rappresentato dai geni per le

globine nei mammiferi. Le globine sono proteine del sangue che si associano per

formare l’emoglobina, costituita da due globine di tipo α e due di tipo β.

Nell’uomo le globine di tipo α sono codificate da una piccola famiglia multi genica

presente sul cromosoma 16 e le globine di tipo β da una seconda famiglia sul

cromosoma 11. Questi geni sono stati fra i primi ad essere sequenziali alla fine degli

anni ’70.

Le sequenze avevano dimostrato che entrambi i raggruppamenti contengono geni che

sono espressi in stadi diversi dello sviluppo e ciascuno contiene almeno uno

pseudogene: è da notare che lo pseudo gene θ è espresso, ma il suo prodotto proteico

è inattivo; nessuno degli altri pseudo geni è espresso.

I geni globinici si sono evoluti da un ancestore comune, il quale, nel corso

dell’evoluzione, è andato incontro a diversi fenomeni.

Dallo studio della conservazione di sequenza è emerso che il primo fenomeno

nell’origine dei geni globinici è

rappresentato dalla duplicazione

genica: si sono, così, formati due

geni che hanno poi subito fenomeni

di divergenza, consistenti

nell’accumulo di mutazioni. I

progenitori dei geni α e β hanno poi

subito una traslocazione

cromosomica, essendo oggi

localizzati su cromosomi differenti.

Infine, a livello dei singoli

cromosomi, si sono verificati altri

eventi di duplicazione e di

divergenza, che hanno portato alle

differenze esistenti all’interno di

ciascun cluster.

Esiste una stretta correlazione tra le differenze a livello del genoma e le differenze

funzionali. Anzitutto, l’esistenza dei cluster è subordinata controllo operato dalla Locus

Control Region (LCR).

Le LCR si trovano a monte dei raggruppamenti e la loro funzione sarebbe quella di

organizzare il raggruppamento in un dominio di cromatina attiva, agendo da enhancer.

La regolazione dell’espressione geni globinici è funzionale al fatto che l’ espressione

modulata nel corso dello sviluppo produce forme di emoglobina differenti nei diversi

stadi: embrione, feto, adulto. La differenza è legata alla diversa affinità per l’ossigeno

necessaria nei diversi periodi di sviluppo. Si instaura perciò l’alternanza delle

emoglobine.

A livello molecolare, l’alternanza delle emoglobine dipende da fenomeni di

competizione dei geni per interagire con le LCR, ed intervento di silenziatori gene-

specifici, modulati durante lo sviluppo.

Le LCR sono state scoperte la prima volta durante uno studio dei geni umani per la β-

globina. La LCR della globina è

contenuta in un tratto di DNA di circa

12 kb di lunghezza, posizionato a

monte dei geni, nel dominio funzionale

di 60 kb della β-globina. Studi più

dettagliati hanno mostrato che la LCR

β-globinica contiene cinque diversi siti

ipersensibili alla DNAasi, brevi regioni di

DNA che vengono tagliate dalla DNAasi

I più facilmente di altre regioni del

dominio funzionale.

una serie di siti ipersensibili sono localizzati nel tratto di DNA di 20 kb a monte del

cluster dei geni per la β-globina umana. Questi siti segnano la posizione della regione

di controllo del locus.

Ulteriori siti ipersensibili sono localizzati immediatamente a monte di ciascun gene,

nelle posizioni in cui l’RNA polimerasi si lega al DNA. Questi siti ipersensensibili sono

specifici per i diversi stadi di sviluppo e sono evidenziabili solo durante la fase di

sviluppo in cui il gene adiacente è attivo.

La LCR funge da enhancer. Affinché ciascun gene possa codificare il proprio prodotto, il

promotore deve poter avvicinarsi alla LCR.

Per fare ciò, il DNA si piega a formare un’ansa, in modo che la LCR vada a trovarsi così

vicina da riuscire a legarsi sia al

gene da esprimere che alla RNA

polimerasi. Man mano che l’affinità

cambia, la LCR si sposta in

corrispondenza della regione da

esprimere, seguita dal complesso

trascrizionale, mentre la PYR,

proteina ricca di pirimidine, inibisce

tutto ciò che si trova a valle.

Circa il 44% del genoma umano è occupato dalle ripetizioni estese. Una buona

pseudogeni

porzione di questa percentuale è rappresentata dagli , definite come

copie funzionali di un gene o parte di un gene. Gli pseudogeni sono una sorta di relitti

evolutivi i quali dimostrano che il genoma umano è continuamente soggetto a

cambiamenti. Originano, infatti, in seguito a duplicazione genica e progressivo

accumulo di mutazioni.

Esistono due tipi principali di pseduogeni, a seconda che l’evento di duplicazione

genica sia seguito da una lenta o da una rapida diversificazione.

Quest’ultima dipende dal numero di mutazioni che si verificano all’interno della

sequenza: - una sola

mutazione può avere un

effetto minimo sull’attività

di un gene, originando un

gene un gene polimorfico

ma con “funzione

originale”; - all’aumentare

del numero delle

mutazioni aumenta la

diversificazione genica,

per cui si possono formare

geni con “funzione

correlata” o geni con

“nessuna funzione”.

In genomica, si è soliti distinguere gli pseudo geni in due grandi classi:

Pseudogeni non processati.

1. Sono copie di un DNA genomico ma non sono

funzionali. La natura non funzionale può essere riconosciuta, a livello di sequenza

da:

- Presenza di codoni di stipo nella porzione codificante, a seguito di mutazioni;

- Presenza di un elevato numero di mutazioni ognuna delle quali darebbe origine

a una molecola mutante.

Contengono esoni, introni e spesso sequenze fiancheggianti.

La famiglia dei geni HLA di classe I è un classico esempio di raggruppamento

genico caratterizzato da pseudogeni.

(B) Sono stati identificati 17 membri di una famiglia raggruppati in circa 2 Mb e

comprendenti: sei geni

espressi (rettangoli neri),

quattro pseudo non

processati a lunghezza

piena (ψ, psi) e numerose

copie geniche parziali

(rettangoli piccoli e vuoti).

(A) L’mRNA a lunghezza

piena contiene una

sequenza che codifica un

polipeptide. I rettangoli

rappresentano i diversi

domini: L , la sequenza

guida o leader; α α α , i

1 2 3

domini extracellulari; TM,

la sequenza transmembrana; CIT, la coda citoplasmatica; una sequenza non

tradotta in 3’ (3’-UTR).

Pseudogeni processati.

2. Si tratta di copie geniche difettive che contengono

sequenze corrispondenti agli esoni di un gene funzionale (ma non gli introni) e di

solito ad un’estremità contengono una sequenza di oligo(dA)/(dT). Tali pseudo geni

processati sono copiati a livello di cDNA per retrotrasposizione. Derivano, dunque,

da mRNA codificante polipeptidi e, quindi, da geni trascritti dalla RNApol-II. Le

trascrittasi inverse cellulari trascrivono l’mRNA in un cDNA naturale che può

integrarsi nel DNA cromosomico. La figura

mostra un

modello per

l’integrazione,

che

rappresenta

solo una delle

diverse

possibilità. Tale

modello

considera

l’integrazione in punti di rottura sfalsati (indicati dalle frecce serpeggianti) in

sequenze ricche di A. Se la sezione ricca in A viene inclusa in una sporgenza in 5’,

potrebbe formare un ibrido con l’estremità distale poli(T) del cDNA, facilitando la

sintesi del secondo filamento. E1-E3 rappresentano gli esoni; P il promotore.

Le copie trasposte non hanno un promotore, per cui solitamente non vengono

espresse ed hanno il modo di acquisire mutazioni deleterie (pseudogeni

processati ).

Benché gli pseudogeni processati solitamente non vengono espressi (perché sono

privi di una sequenza promotoriale), si conoscono alcuni esempi di geni processati

espressi. In questi casi, il cDNA naturale è stato integrato in un sito di DNA

cromosomico, il quale casualmente si trova a essere adiacente a un promotore, che

può guidarne l’espressione.

La sequenza del genoma umano ha mostrato che circa il 62% è costituito da “regioni

intergeniche”, parti del genoma che si trovano tra i geni e la cui funzione è

sconosciuta. Queste sequenze venivano chiamate DNA spazzatura (junk DNA); ma il

termine è oggi caduto in disuso.

Nella maggior parte degli organismi il DNA intergenico è rappresentato per lo più da

sequenze ripetute di un tipo o di un altro. Il DNA ripetitivo può essere diviso in due

categorie:

1. DNA ripetuto in tandem, le cui unità ripetute sono localizzate una a fianco all’altra.

La localizzazione è varia, per cui i blocchi possono mappare su più cromosomi. A

seconda delle dimensioni medie delle unita si suddivide in:

- DNA satellite

- DNA minisatellite

- DNA microsatellite

Ripetizioni intersperse

2. o

disperse in tutto il genoma, che

sono distribuite in maniera

apparentemente casuale lungo

tutto il genoma. Hanno, in realtà

una localizzazione preferenziale

in alcune bande cromosomiche.

Contengono sequenze che

possono essere retrotrasposte attraverso un intermedio di RNA.

DNA satellite,

Il DNA ripetuto in tandem è anche chiamato perché i frammenti di DNA

che contengono tali ripetizioni formano bande “satelliti” quando il DNA genomico

viene frazionato mediante centrifugazione in gradiente di densità.

IL DNA umano ha un contenuto medio di CG del 40,3%

-3

e una densità di galleggiamento di 1,701 g cm . I

frammenti che comprendono per lo più DNA a singola

elica hanno un contenuto in CG vicino a questa media e

sono localizzati nella banda principale nel gradiente di

densità. -3

Le bande satelliti a 1.687, 1.693 e 1.697 g cm sono

costituite da frammenti che contengono DNA ripetitivo,

il cui contenuto in CG dipende dal tipo di sequenze

ripetute e quindi può essere diverso da quello medio

del genoma. Questi frammenti hanno, quindi, densità

diverse dal DNA a singola copia e migrano in posizioni

diverse nel gradiente di densità.

Il DNA ripetuto origina primariamente

da un evento di amplificazione del

genoma e in particolar modo da uno

shift del segmento antisenso, durante

la replicazione. L’amplificazione è,

poi, seguita da divergenza tra le

unità ripetute. Infine, ogni volta che

si replica il DNA si verificaro delle

amplificazioni secondarie, per cui

aumenta l’unità base del repeat.

Si pensa che le unità corte ripetute in

tandem siano soggette

all’appaiamento errato causato da

slittamento di un filamento, ad esempio, l’appaiamento errato dei filamenti

complementari di un DNA a doppia elica.

Gli esempi mostrano come l’errato appaiamento del filamento slittato possa verificarsi

durante la replicazione,

con il filamento inferiore

che rappresenta un

filamento di DNA

parentale e il filamento

superiore che

rappresenta il filamento

complementare neo

sintetizzato.

In questi casi lo

slittamento coinvolge una

regionde id non

appaiamento

(rappresentata come una

bolla), che contiene una o

più unità ripetute del

filamento neo-

sintetizzato (slittamento

all’indietro) o del

filamento parentale (slittamento in avanti), causando rispettivamente l’inserzione o la

delezione sul filamento neo-sintetizzato.

La sequenza di triplette può espandersi sia durante la meiosi che durante la mitosi,

determinando nell’ultimo caso mosaicismo cellulare, ossia un numero di ripetizioni

diverso tra i tessuti.

Talvolta, le corte ripetizioni in tandem che si trovano all’interno o nelle immediate

vicinanze di un gene possono andare incontro a notevoli espansioni della loro

lunghezza e influire sull’espressione del gene con conseguenze patologiche. Difatti, la

ripetizione espansa è instabile, cioè tende a variare di dimensione nel corso di

generazioni successive, aumentando il potenziale patogeno. Quando si parla di

espansioni di triplette, è bene precisare che esiste una dimensione soglia delle

espansioni, sotto la quale la ripetizione non è patogena e sopra la quale è invece

causa di malattia.

L’espansione di triplette è un evento così perturbante a livello genomico, da rendere

ovvio il suo coinvolgimento in varie patologie.

Il genoma possiede differenti meccanismi di controllo, per cui per ogni tripletta esiste

una “soglia molecolare” al di sotto della quale un certo numero di ripetizione (circa 50)

è tollerabile, in quanto il macchinario replicativo è in grado di mantenere la fedeltà

della replicazione. Allo stesso modo, esiste una “soglia fenotipica” per la quale un

numero di ripetizioni superiore a 200 causa un fenotipo malato, a seguito del

verificarsi di fenomeni come la metilazione di sequenza o il blocco della trascrizione.

Per esempio, nella Sindrome dell’X-fragile, le espansioni molto ampie causano perdita

di funzione della proteina o abolizione della trascrizione del gene. In questo caso, man

mano che le espansioni aumentano, il nucleosoma aperto, trascrizionalmente attivo e

con una singola CGG repeat, diventa un closed nucleosome, trascrizionalmente

inattivo: ciò è dovuto all’ accumulo di metilazioni, per cui tali proteine metilate

avvolgono maggiormente il nucleo soma impedendo la trascrizione.

Esiste un secondo meccanismo patogeno, come nel caso della Corea di Huntington,

per il quale le ripetizioni CAG codificano tratti di poliGLU nel prodotto genico, che si

aggregano nelle cellule inducendo tossicità. Nella Corea di Huntington il potenziale

patogeno è legato alla precipitazione dei tratti poliglutamminici insolubili. La

precipitazione impedisce il riconoscimento da parte del meccanismo deputato alla loro

degradazione. Normalmente si assiste al reclutamento del proteasoma che, attraverso

l’ubiquitina, induce la degradazione della proteina mal funzionante.

La formazione dei tratti poliGlu non solo impedisce il reclutamento proteasoma ma

causa anche l’induzione dell’apoptosi da parte della Caspasi III. Ciò che ne consegue è

la morte neuronale prematura, in particolare riferita ai gangli basali.

Quasi tutto il DNA ripetitivo non codificante distribuito nel genoma umano deriva da

trasposoni,

“elementi trasponibili”, detti anche sequenze di DNA mediamente ripetuto

che possono localizzarsi in regioni diverse del genoma. Quasi il 45% del genoma è

assegnabile a questa classe, alla quale appartengono 350.000 copie di diversi tipi.

Le sequenze ripetute disperse si sono originate da eventi di duplicazione e successiva

trasposizione, per cui il risultato è stato una copia di un’unità ripetuta in una posizione

nel genoma distante da quella della sequenza originaria.

Nell’uomo e negli altri mammiferi esistono quattro classi principali di trasposoni,

distinti in due gruppi, a seconda del metodo di trasposizione:

“retrotrasposoni”.

1. I In questo caso il meccanismo di copia utilizza una trascrittasi

inversa per produrre copie di cDNA da trascritti di RNA. La trasposizione re plicativa

(o per copia) assicura che venga fatta una copia di una sequenza esistente,


PAGINE

25

PESO

1.28 MB

AUTORE

Fredo88

PUBBLICATO

7 mesi fa


DETTAGLI
Esame: Genomica
Corso di laurea: Corso di laurea magistrale in biologia
SSD:
Docente: Dato Serena
Università: Calabria - Unical
A.A.: 2015-2016

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Fredo88 di informazioni apprese con la frequenza delle lezioni di Genomica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Calabria - Unical o del prof Dato Serena.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Genomica

Sequenziamento del genoma
Appunto
Enzimologia - cinetica enzimatica
Appunto
Sequenziamento del genoma
Appunto
Enzimologia - funzioni di particolari proteine e cinetica enzimatica
Appunto