Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Sono, inoltre, associate a differenze
funzionali: H3 è il meno abbondante,
costituendo appena il 3-5% del genoma
umano, ma contiene circa l’80% dei geni
housekeeping.
L1 e L2 costituiscono nel loro insieme il
66% del genoma umano, comprendendo
l’85% dei geni specifici dei tessuti.
La maggior parte del genoma è
costituita da isocore leggere (L1, L2). Al contrario la maggior parte dei geni è
localizzata nelle isocore pesanti (H1, H2 e H3).
Nel genome core costituito dalle isocore H2 e H3 (12% del genoma) la densità dei geni
è molto alta (un gene per 5-15kb), mentre nel cosiddetto empty space formato dalle
isocore di tipo L e H1 (88% del genoma) la densità genica è molto bassa (un gene per
50-150kb).
I genomi eucariotici non sono molto compatti a differenza di quelli procariotici.
S. cerevisiae, D. melanogaster H. sapiens
Paragonando i genomi di e ci si accorge di
come la densità vari nel numero di geni.
I genomi degli eucarioti hanno una densità genica molto ridotta. In media, i geni
codificanti per proteine occupano solo il 2-4% dell’intero genoma.
Saccharomices,
Ciò non è vero per il quale presenta una densità genica media di 479
Drosophila
per ogni Mb. La ha, invece, una densità genica di 79 per ogni Mb; mentre
l’uomo presenta solo 11 geni per Mb. Drosophila
Per quanto riguarda gli introni: l’uomo contiene 9 introni per gene, per
Saccharomices
gene, mentre appena 0,04 (la maggior parte dei geni sono
monocistronici senza introni).
Nell’H. sapiens aumenta il numero di introni, allo stesso modo della percentuale di
genoma occupato da repeat: l’uomo ha il 44% del genoma occupato da ripetizioni
Saccharomices.
intersperse, rispetto al 3% di
Nei genomi degli organismi meno complessi si risparmia spazio in quanto i geni sono
S. cerevisiae
più vicini tra loro. Il genoma di illustra questo caso, dove , il segmento di
50 kb del cromosoma 12 umano (A) è paragonato ad un segmento di uguale misura
del genoma di lievito.
Nello specifico, il segmento di 50 kb comprende il locus del recettore β delle cellule T,
e contiene 4 geni. Il segmento del genoma di lievito deriva dal cromosoma III e ha le
seguenti caratteristiche:
- Contiene più geni del
segmento umano.
Questa regione del
cromosoma III contiene
26 geni che si pensa
codifichino proteine e 2
che codificano tRNA
- Relativamente pochi
geni di lievito sono
discontinui. In questo
segmento del cromosoma III nessuno dei geni è discontinuo. Nell’intero genoma del
lievito ci sono 230 introni, rispetto agli oltre 30.000 del genoma umano.
- Vi sono meno sequenze ripetute disperse in tutto il genoma. Questa parte del
cromosoma III contiene cinque ripetizioni estese a tutto il genoma che occupano il
13,5% del segmento di 50 kb. Se si considerano tutti i 16 cromosomi, l’ammontare
totale di sequenza occupato da ripetizioni disperse in tutto il genoma è solo il 3,4%
del totale.
Il quadro che emerge è che l’organizzazione del genoma di lievito è molto più
economica di quella del genoma umano. I geni stessi sono più compatti, hanno meno
introni e lo spazio tra di loro è relativamente piccolo; molto meno spazio è occupato da
ripetizioni disperse in tutto il genoma e da altre sequenze non codificanti.
L’ipotesi secondo cui gli organismi più complessi hanno genomi meno compatti è
valida anche quando si esaminano altre specie. Consideriamo un segmento di 50 kb
del genoma del moscerino della frutta. Tale segmento contiene 11
geni, che sono un numero
maggiore di quelli presenti nel
segmento umano e un numero
minore di quelli presenti nella
sequenza di lievito.
Tutti questi geni sono discontinui, ma sette contengono un solo introne.
La densità genica nel genoma del moscerino della frutta è intermedia tra quella di
lievito e quella umana.
Le differenze tra i genomi di lievito, del moscerino della frutta e dell’uomo sono
confermate dal confronto tra le ripetizioni disperse in tutto il genoma. Queste rendono
conto del 3,4% del genoma di lievito, di circa il 12% del genoma di Drosophila e del
44% del genoma umano.
Sta diventando sempre più evidente che le ripetizioni disperse in tutto il genoma
svolgono un ruolo determinante nell’imporre una maggiore o minore compattezza al
genoma.
Ne è un esempio lampante il genoma di mais, che con le sue 2500 Mb è relativamente
piccolo per una pianta a fiore.
Anche in questo caso consideriamo un segmento di 50 kb del genoma di mais che si
estende a entrambi i lati di un membro della famiglia di geni dell’enzima alcool
deidrogenasi. Questo è l’unico gene
presente nella regione di 50
kb. La caratteristica
dominante di questo
segmento genomico è il
numero di sequenze ripetute:
si tratta di elementi LTR che costituiscono pressoché tutta la regione non codificante
del segmento e si stima rappresentino circa il 50% del genoma di mais.
Per quanto riguarda il genoma umano, questo è formato da 3.000.000.000 di paia di
basi, ha un contenuto in DNA dei cromosomi medio di 130 Mb (59 Mb-236 Mb), ha
circa 35.000 geni.
Operando un rapporto tra la dimensione del genoma in bp e il numero di geni ottengo
la dimensione genica del genoma umano, pari a 1/80 kb:
9
3∙10 /35000 = 1 gene ogni 80 kb circa
In realtà vi sono regioni geniche molto dense, in particolare la regione HLA (6p21.3)
con un gene ogni 13 kb. Per contro, la regione genica più lassa, con il minor contenuto
in geni, è la regione Xp21 (gene della Distrofina) che contiene un solo gene in 2,4 Mb e
ben 79 introni.
Rappresenta un’altra eccezione alla densità media di 1 gene ogni 80 kb, il DNA
mitocondriale. Questo contiene esclusivamente DNA codificante e presenta una
caratteristica peculiare rappresentata dai “geni sovrapposti”: le subunità 6 e 8
dell’ATPasi condividono la stessa sequenza di genoma mitocondriale; ciò che li
differenzia è il sito d’inizio della trascrizione, per cui ATG che codifica per la Met è il
codone d’inizio della trascrizione e risultato spostato per quanto riguarda l’ATPasi 6.
Anche la regione HLA sul cromosoma 6, pur contenendo 70 geni in 0,9 Mb, presenta
geni sovrapposti, a livello dei quali trascrivendo al contrario, utilizzando i due filamenti
di DNA è possibile produrre segmenti differenti e, dunque, proteine differenti.
Un’ultima caratteristica in termini di compattezza di densità genica è la presenza di
“geni dentro altri geni”. Non si tratta di un fenomeno frequente nel genoma umano:
per esempio, a livello del gene NF1 l’introne 27 (40 kb), contiene tre piccoli geni,
rispettivamente di 2.2, 10 e 4 kb, che vengono trascritti dal filamento opposto.
Allo stesso modo il fattore VIII della coagulazione: a livello dell’introne 22, F8A e F8B
(due geni paraloghi) utilizzano la stessa isola CpG e, dunque, lo stesso promotore, ma
trascrivono in senso opposto.
I geni eucariotici presentano una grande varietà di strutture e dimensioni.
Ad esempio nel genoma umano:
- Il gene più grande è quello della Distrofina (2.4 Mb, la sua trascrizione richiede
circa 16h) GLU
- I geni più piccoli codificano per RNA transfer; il più piccolo codifica per il tRNA
(69 bp)
La variabilità si riflette anche nel contenuto in introni ed esoni. Il numero di esoni può
variare da 1 per i geni privi di introni ( per es. molti geni per ncRNA, interferoni, istoni,
ribonucleasi, HSP, GPCR, ecc.) sino a 363 (gene per la Titina).
Allo stesso modo, le dimensioni di esoni e introni sono estremamente variabili. A fronte
di esoni costituiti da pochi nucleotidi, l’esone più grande è presente nel gene per ApoB
(con una dimensione di 7.6 kb).
Infine, le proteine codificate possono variare nelle dimensioni da pochi residui (piccoli
ormoni) sino a molte migliaia (per esempio la Titina, proteina del muscolo scheletrico,
è formata da 38.138 aa). C.elegans
I geni umani contengono introni mediamente più lunghi dei geni di o
Drosophila. Esiste una stretta correlazione tra espressione genica ed introni. D’altro
canto, un gene che deve essere molto espressivo ha bisogno di essere processato
rapidamente: conseguentemente, la dimensione degli introni deve essere ridotta. Gli
introni dei geni altamente espressi sono circa 14 volte più corti dei geni scarsamente
espressi.
Allo stesso modo, nonostante ci siano differenze tra i vari eucarioti, la conservazione
C. elegans
della dimensione degli esoni dall’uomo al suggerisce una sostanziale
conservazione dei componenti dell’apparato di splicing. Nel genoma
umano,
l’insieme degli
esoni, con 48
Mb,
costituisce
appena l’1,5%
del totale. Al
contrario il
44% del
genoma è
occupato dalle
ripetizioni
estese.
La porzione codificante del genoma eucariotico è divisa in
- geni codificanti per proteine, in copia singola
- geni codificanti per proteine, organizzati in famiglie geniche
- geni per rRNA, tRNA ed istoni, organizzati in unità ripetute in tandem
- geni per ncRNA (non coding RNA)
I geni organizzati in famiglie geniche sono tra loro omologhi, e derivano da un evento
di duplicazione genica o di retrotrasposizione mediata da RNA. I membri di una
famiglia genica all’interno di uno stesso genoma sono detti “paraloghi”, e
normalmente si specializzano acquisendo funzioni distinte. Sono normalmente
localizzati vicini tra loro, consentendo al genoma un controllo simultaneo mediante
un’unica locus control region. RNA non codificanti
ncRNA. I genomi eucariotici codificano per un gran numero di
proteine ncRNA
( ). Si tratta di piccoli RNA che non hanno una funzione legata alle
proteine. Appartengono a questo gruppo:
small nucleolar RNA.
- snoRNA, Si tratta di RNA contenuti all’interno del nucleolo che
aiutano a processare l’RNA ribosomale. Ve ne sono sll’incirca 200.
RNA transfer.
- tRNA, Si tratta di RNA che, pur facendo parte del macchinario
tradizionale, non sono codificanti. Se ne conoscono circa 500.
small nuclear RNA.
- snRNA, Sono localizzati all’interno della matrice; sono ricchi in U
e numerati U1, U2, U3, etc. Sono coinvolti nello splicing. Si contano circa 100 tipi.
micro RNA.
- miRNA, Sono molecole endogene di RNA di dimensioni ridotte (20-22
bp), a singolo filamento. Ve ne sono circa 700. La loro trascrizione può avvenire ad
opera di geni che non codificano proteine e dotati di un proprio locus; in
alternativa, possono trovarsi all’interno di introni ed essere trascritti. Svolgono una
funz