Biologia molecolare vegetale 2
Programma del corso
Anatomia dei genomi: come sono fatti i genomi, come sono fatti i geni, contenuti dei geni e genomi degli organelli. Parte che riguarda trascrittoma e proteoma; assetto genoma correlato alla struttura del genoma. Poi la trascrizione con regolazione genica, sintesi e regolazione del genoma.
Schematizzazione del genoma
Il DNA è contenuto nel nucleo, si avvolge su degli istoni che hanno una struttura a perla e si avvolge su se stessa a formare una fibra da 30 nanometri. Questa è poi collegata a una impalcatura proteica che ha questa fibra con questi loops dai 10 a 90 kb e questi poi si impaccano a formare gli istoni cromosomici. Dalla struttura del DNA dipende la possibilità che esista, per esempio, che un gene venga più o meno trascritto. Le zone più trascritte sono quelle a forma di 30 nanometri e questi loops; quando sono più impaccati, invece, l'accessibilità è minore e di conseguenza vengono trascritti molto meno.
Sequenziamento e analisi dei genomi
Negli ultimi anni sono stati sequenziali diversi genomi, cioè si prendono interi genomi di organismi e si sequenziano tutti. I genomi completi sequenziati sono Arabidopsis thaliana, un verme, drosophila, uomo, alcuni batteri, alcuni funghi, topo, riso. Poi orzo e pomodoro verranno fatti. Nelle piante le cose sono molto più complicate perché il genoma è molto più grande rispetto agli altri organismi, proprio perché hanno molto DNA ripetuto che non codifica per proteine e spesso le piante sono poliploidi, cioè hanno più assetti cromosomici. Se si va a vedere l'espressione genica da un 2n a un 4n, le cose cambiano: si hanno più copie di geni in un 4n e quello che può essere la ricerca di una mutazione o un silenziamento genico è molto più difficile da studiare.
Banche dati e EST
È per questo che sono state sviluppate soprattutto nelle piante delle banche dati come la TIGR, in cui sono riportate le sequenze espresse, le cosiddette EST. Praticamente si prende un tessuto di una pianta, si fa l'estrazione dell'RNA messaggero, si fa la retrotrascrizione a cDNA in modo da renderlo stabile e poi si va a fare una libreria del cDNA. Si fa una foto di tutto quello che è il trascrittoma in quel momento da quel tipo di tessuto. Dico tipo di tessuto perché si può prendere la pianta intera, ma si possono prendere tessuti più specifici; ovviamente cambierà il set di RNA.
Sequenze di estremità e trascrittoma
Quindi banche dati EST vengono fatte, ma si deve sempre riportare da quale tessuto. In queste banche dati EST, tutta la libreria di cDNA ottenuta dall'RNA non viene sequenziata completamente, non si hanno le sequenze di tutti i geni, ma si hanno delle sequenze parziali, solo all'estremità. Questo perché il sequenziamento fino ad ora viene fatto con metodi tradizionali, con sequenziatori automatici che permettono di sequenziare le prime 600-800 paia di basi che corrispondono alle estremità 3’5’. Oltre non riesce e la parte interna non viene sequenziata. Per le parti interne si dovrebbe disegnare dei primer di sequenziamento e pian piano camminare sulle parti interne; lo scopo è quello di dare almeno le sequenze di estremità.
Genoma, trascrittoma e proteoma
Queste banche dati EST permettono di avere delle sequenze parziali che è quello che è tutto il set di geni di una pianta o di un organismo. Abbiamo quello di orzo, riso, sorgo, frumento, mais, arabidopsis, soia, pomodoro, erba medica. Ovviamente queste banche dati si arricchiscono sempre di più, diventando sempre più informative dal punto di vista dell'espressione genica. Quindi da una parte il sequenziamento di genomi e dall'altra l'analisi dei geni espressi, anche se come abbiamo detto la sequenza non è completa, ma costituisce un ottimo aiuto. Discorso generale: da DNA si passa all'RNA (trascrittoma) e poi proteina (proteoma). Tutto quello che riguarda il DNA è indicato come genoma, cioè una visione complessiva della struttura del DNA, come sono strutturati i geni, disposti nel genoma, quanto DNA è presente, in che modo viene espresso e l'accessibilità al DNA.
Trascrittoma e proteoma
Trascrittoma: cioè tutto il set di RNA messaggeri presenti all'interno della cellula, il quale è funzione del genoma e dal quale dipende poi il proteoma, cioè quali proteine sono presenti in quel determinato momento nella cellula. Il genoma dipende sostanzialmente dalla specie e dalla varietà, il trascrittoma e proteoma dipendono dall'espressione genica. L'espressione genica è quella del trascrittoma, la trascrizione e la traduzione in proteine e poi anche la modificazione delle proteine, modificazioni tradizionali, post-traduzionali e degradazione delle stesse. Sono questi tutti i fattori che intervengono a valle del genoma.
Sequenziazione del genoma umano
Nel 2001 è stata pubblicata la sequenza del genoma umano, successivamente di lievito, C. elegans (un verme molto semplice che rappresenta gli animali), poi abbiamo Arabidopsis thaliana e per i batteri Escherichia coli. Nel nucleo possiamo vedere la quantità di DNA presente nei diversi organismi in questo caso n quindi aploide. Abbiamo che ad esempio nei micoplasmi e batteri gram negativi come Escherichia coli hanno un genoma di circa 2x106, quindi 2.000.000 di nucleotidi. Man mano che si sale nei regni degli esseri viventi aumenta la complessità dell'organismo e aumenta anche la dimensione del genoma. Vediamo ad esempio che nei funghi si arriva a 1.7x107, quindi circa 10 volte più grande di E. coli. Si arriva poi al nematode C. elegans che arriva a 8x107 e via via si sale fino ad arrivare alle piante che sono quelle che hanno un contenuto maggiore di DNA.
C paradox
Fin dai primi studi di genetica hanno notato che c'è una correlazione tra la quantità di DNA e complessità dell'organismo che lo contiene. La quantità di DNA viene indicata con cis content, che è la quantità di DNA del genoma aploide e si indica con C. Il C paradox consiste nel fatto che molto spesso non si ha una correlazione esattamente lineare tra la quantità di DNA e la complessità dell'organismo. In linea generale sì, però non è sempre vero. Ad esempio, vediamo che gli anfibi hanno una quantità molto maggiore di un mammifero, quindi la quantità non corrisponde sempre alla complessità. Questo perché? Essenzialmente perché ad esempio in E. coli non ci sono spazi tra un gene e l'altro, non ci sono introni, tutto quello che c'è serve per codificare delle proteine. Arrivando alle piante, che è il sistema più eclatante in cui si trova molto DNA ripetuto, ci sono un sacco di elementi trasponibili o di retro-trasposoni o sequenze che si sono inserite o duplicate che non codificano per nessuna proteina.
Genoma delle piante
Questa è la visione generale; le piante hanno un genoma tendenzialmente più ampio rispetto agli altri organismi perché principalmente c'è un DNA ripetuto, però come numero di geni ne hanno di più dei mammiferi perché sono statiche e fanno fotosintesi. Mentre gli altri organismi si possono muovere se l'ambiente non è consono alle loro necessità, quindi tutto quello che è il metabolismo secondario è molto più importante nelle piante rispetto agli animali. Poi in secondo luogo per la fotosintesi, per cui molti geni deputati a tale funzione hanno una affinata regolazione. Possibile anche calcolare la lunghezza in cm del genoma, in base al numero di paia di basi e poi in base alla struttura del DNA, ogni base è spaziata dall'altra di 3 Ångström, facendo i conti si calcola che in Arabidopsis è qualche cm, l'essere umano è 96 cm, nelle piante si arriva a 100 m nel giglio, ci si rende conto meglio delle dimensioni parlando in lunghezza.
Confronto tra genomi
Entriamo nel dettaglio andando a confrontare i vari genomi. Vediamo la differenza tra procarioti ed eucarioti. I procarioti non hanno compartimentazione interna, DNA e RNA sono all'interno del citoplasma, i batteri abbiamo i gram negativi in particolare i coli; il genoma dei procarioti è diverso, è in genere sotto forma di DNA lineare o circolare, presente in un solo filamento anche ripetuto più volte. Negli eucarioti sono presenti i cromosomi, che sono sequenze lineari impaccate come abbiamo visto, abbiamo DNA anche nei mitocondri e nei cloroplasti. Le dimensioni anche negli eucarioti sono molto variabili dalle 10 megabasi, quindi 10.000.000 di basi, alle 100.000 megabasi, questo rispecchia la complessità dell'organismo anche se non in modo assoluto. C paradox perché in molti organismi il genoma è interrotto da sequenze che non codificano.
Confronto tra organismi
È stato fatto un lavoro di confronto partendo da 50 kilobasi in diversi organismi, hanno preso 50 kilobasi e sono andati a vedere come sono strutturati i geni in questo tratto di DNA. Partiamo da E. coli e vediamo che sono praticamente tutte codificanti, abbiamo pochissimo DNA ripetuto, la cosa cambia se si va in mais in cui succede esattamente il contrario perché abbiamo un solo gene. In drosophila la situazione è intermedia, Saccharomyces più vicino al coli. Essere umano ci sono geni codificanti, ma sono presenti anche pseudo-geni che sono quasi uguali ai geni codificanti, però in forma non funzionale dovuta a mutazioni nella regione trascritta nella regione di controllo della trascrizione a livello del promotore, non sono attivi questi geni, ci sono però non sono espressi. Coli organismo abbastanza semplice, tutto il DNA è codificante, man mano che si aumenta la complessità aumenta la quantità di DNA non codificante, in effetti la distribuzione dei geni rispecchia il C. paradox.
Genomi dei virus
Aumentando la complessità dell'organismo, paradossalmente diminuiscono i geni codificanti. I genomi dei virus sono esattamente l'opposto degli organismi superiori, ancora più complessi di coli. Il numero dei geni è ancora più ridotto però ci sono diverse situazioni di lettura dei geni, per cui ci sono proteine diverse a seconda di come vengono lette, se vengono lette in un senso o nell'altro, lo stesso DNA circolare può essere letto su ogni filamento dando origine a proteine diverse, può essere letto anche a cavallo tra un gene e l'altro. Spesso si ha un frameshift, se mi sposto anche solo di una base cambia il codice di lettura perché cambiano i codoni e si hanno proteine diverse.
Genoma umano vs lievito
Comparando il genoma umano e il genoma di lievito, vediamo che il genoma di lievito contiene 26 geni con 2 geni per l'RNA transfer. Quindi 26 geni strutturali che danno proteine e 2 geni che danno altri RNA, quindi 26+2 di transfer. Questi geni ci sono di più e sono più compatti, pochi introni, l'intero genoma di lievito ha solo 239 introni che sono pochissimi. In umano ce ne sono di più di 300.000, circa 1.200 volte di più. Sequenze ripetute: come abbiamo visto in lievito ci sono 5 tipi di DNA ripetuto che fanno circa il 13%. In questo caso PI2, che è un elemento retro-trasponibile, non codifica, ma è un DNA ripetitivo. In umano si arriva anche al 50% o anche di più, in umano si arriva al 44%, circa 10 volte di più del lievito (3-4%) DNA ripetuto che non va a dare proteine strutturali.
Funzione del DNA ripetuto
Questo DNA cosa potrebbe servire? In piccola parte per variabilità, ma pensate ad esempio al DNA spaziatore, se una mutazione avviene ogni 50 kilobasi se avviene in coli sicuramente colpisce un gene e quindi lo altera. Se avviene in umano la probabilità è estremamente bassa che vada a colpire un gene funzionale; introni e pseudo-geni hanno funzioni molto più definite. Sembra banale ma le mutazioni sono frequenti, se vanno a colpire un menoma con molti spazi tra i geni, mi ripara da eventuali danni. Ripetiamo: lievito 239 introni, umano 300.000 quindi 1.200 volte di più, aumenta la quantità di DNA e aumenta la quantità di DNA non codificante, in lievito il DNA ripetuto è circa il 3.4% negli umani il 44%, quindi 40 cm del nostro genoma è DNA ripetuto, non sono geni strutturali e di cui non si conosce bene la funzione; gli elementi trasponibili sono tipici di ogni specie e in umano contribuiscono a dare questo 44%, si ritrovano in alcune specie e non in altre.
Drosophila e dimensioni del genoma
Drosophila 11 geni, ha una complessità intermedia tra il lievito e l'umano e questo viene rispecchiato dalla densità dei geni presenti nel genoma. Anche in drosophila abbiamo sequenze ripetute, elementi trasponibili e retro-trasposoni, però abbiamo anche molti geni interrotti da introni, molto più del lievito e molto meno che in umano, quindi c'è una correlazione che serve per spiegare questo C. paradox; elementi trasponibili: LTR, TS, long terminal repeat. Introni se ne riconoscono di diverse dimensioni, a volte sono maggiori dei geni stessi, la maggior parte degli introni hanno lunghezze superiori alle 100 kb, quindi gli introni aumentano la quantità di DNA non codificante e sono presenti in numero elevato.
Distribuzione dei geni
La distribuzione dei geni e le dimensioni negli organismi più semplici come in lievito, ci sono geni di dimensioni più contenuti rispetto a una drosophila, questo perché sono presenti meno introni e la parte di DNA codificante è più compatta. All'interno degli introni stessi potrebbero esserci elementi trasponibili, retro-trasposoni quindi del DNA ripetitivo che ne aumenta la lunghezza. Gli esoni sono abbastanza corti, la lunghezza degli esoni è la lunghezza della proteina codificata, la maggior parte è concentrata su dimensione contenute ed è per la maggior parte simile in tutti gli organismi. (gli esoni per definizione sono quelli che vengono trascritti).
Splicing e variabilità proteica
Il processo di rimozione degli introni è detto splicing, il DNA viene trascritto a RNA dall'RNA polimerasi, poi viene effettuato il processo di splicing togliendo gli introni che ci sono, questo dà origine al messaggero maturo privato di tutti gli introni. Però ci può essere anche un processo di splicing alternativo, ovvero vengono tolti alcuni introni ma non tutti, ci sono diversi esempi. La proteina che si ottiene in questo caso è diversa, ma non è detto che questo sia un errore, può essere una cosa voluta dalla cellula per produrre una proteina leggermente diversa.
Gene slow e immunoglobuline
L'esempio più paradossale è quello del gene slow che troviamo nelle cellule cigliate nell'orecchio, questo gene produce una proteina implicata nella percezione del segnale, questo lo fa perché fa uno splicing alternativo, ha al suo interno 30 introni, 8 di questi 30 però vengono tagliati in modo differenziale, le combinazioni sono otto fattoriale con 30.000 combinazioni diverse, anche se non vengono prodotte tutte perché non servono; quindi gli introni hanno anche una loro funzione. Una cosa molto bella sono anche i geni per l'immunoglobulina, anche in questo caso vengono prodotti dagli stessi geni una grandissima varietà di proteine, all'interno delle cellule diversi esoni vengono tagliarti e congiunti in modo diverso tra di loro, e anche in questo caso c'è uno splicing alternativo, non solo vengono tolti gli introni, ma anche qualche esone.
Procarioti e operoni
Nei genomi procarioti le cose sono molto più semplici, ad esempio in coli che ha un genoma di 4.000 kb, relativamente piccolo, 4.700 geni. Sappiamo già che in questo caso gli introni sono molto rari, il DNA è presente come singola molecola circolare, possono essercene più case, in un certo senso è poliploide. Possono esserci anche dei geni addizionali portati dentro da altri organismi molto più piccoli. Molto spesso questi conferiscono al batterio una capacità in più di sopravvivenza, riuscendo ad usare determinate sostanze nutritive o resistenza ad antibiotici (molto frequente). Sono molecole di DNA non fondamentale per la vita di un organismo, anche perché quelli vitali sono all'interno del DNA circolare; però sono quelli che conferiscono vantaggi. La colonia manterrà il gene stesso, se non è più presente l'agente selettivo tende a essere perso, il batterio lo mantiene se gli serve.
Struttura del genoma
Nei procarioti si hanno spesso operoni, ovvero un promotore che regola diversi geni uno in fila all'altro che vengono trascritti insieme e poi tradotti a dare delle proteine singole. In questo caso non c'è quasi spazio tra uno o l'altro e questo porta a una ulteriore compattazione del genoma. Normalmente questi sono geni che sono coinvolti dalla stessa via metabolica, anche la regolazione negli organismi inferiori è molto più semplice. Nei procarioti c'è qualche eccezione, qualche batterio possiede introni però in numero molto limitato, inoltre ci sono molte meno sequenze ripetute.
Dettagli sulla struttura del genoma
Struttura del genoma: DNA doppia elica dimensione circa 2 nm. Il DNA poi di avvolge in proteine istoniche a una struttura di 11 nm, gli istoni sono composti da proteine basiche, è uno ottametro costituito da: H2A, H2B, H3, H4 (H sta per histone) e poi sono interrotti da un altro istone in genere H1. Queste a loro volta si avvolgono a formare le fibre da 30 nm, le quali vanno a formare un’ansa che forma fibre da 300 nm da 10-90 kb e queste sono le zone più trascritte del genoma per questioni di accessibilità, quelle che stanno alla base non le meno trascritte, poi queste vanno a formare fibre da 700 nm e poi la cromatina dei cromosomi. Il cromosoma è formato da 2 cromatidi fratelli uniti da un centromero che ha delle sequenze ben specifiche.
Anatomia del genoma
Si parla di anatomia del genoma: come è fatto il genoma, è costituito da cromosomi, che sono presenti in numero variabile negli organismi, 5 cromosomi in Arabidopsis, soia 6, drosophila 5, lievito 16 (ne ha molti di più di Arabidopsis pur essendo meno complesso), 7 avena/orzo, essere umano 23, topo 21 etc. Il DNA umano è circa di 96 cm, l’impaccamento del DNA ha effetto sull’espressione di geni. I primi esperimenti furono fatti negli anni '70 usando microscopi elettronici e si guardava il DNA e hanno visto che il filamento più semplice è quello a perle che sono gli istoni, sono stati poi studiati a livello molecolare.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.