L1 - 7 marzo
Obiettivi del corso
Quello che dovrete sapere alla fine di questo corso sono:
- I meccanismi globali di regolazione della trascrizione
- Le applicazioni dei macroarray (tecniche di macroarray e tecniche di sequenziamento parallelo, la tecnologia che si affianca ai macroarray)
- Utilizzo di banche dati per informazioni. Questo è un aspetto importante perché ormai ci sono, con il sequenziamento dei genomi, moltissime informazioni che prima erano nel DNA della cellula (quindi il problema era sperimentare e andare a vedere questa informazione) adesso sono nei computer e cioè una grande quantità, quindi il problema è diventato andare lì e vedere qual è quest’informazione. Quindi bisogna accedere, reperire queste informazioni dalle banche dati ed avere la capacità di analizzarle.
- Aspetto di genomica comparativa e di struttura dei genomi in relazione all’evoluzione. Quindi alla fine dovreste anche conoscere le banche dati generiche principali, essere capaci di fare allineamenti di sequenza e valutare l’omologia tra le sequenze biologiche. Ricostruire alberi filogenetici e naturalmente impiegare i genome browsers.
Progetto ENCODE
Progetto ENCODE: un progetto in cui si vuole determinare tutti gli aspetti di struttura della cromatina: presenza di metilazione e presenza di trascritti in tutto il genoma in tutti i tipi cellulari. È un progetto molto grande che ha prodotto i primi risultati che sono stati di recente pubblicati nel Settembre 2012. In questo progetto si è utilizzato ChIP-Seq, macroarray, ecc., tutti gli approcci che si basano sui sequenziamenti paralleli.
La trascrizione e la biologia post genomica
In questo corso parleremo molto di trascrizione e vedrete come sia pervasiva per tutto il genoma. Gli RNA non codificanti per proteine sono la gran parte rispetto a quello che si pensava. Infatti questi stanno rivoluzionando la biologia post genomica, perché hanno cambiato completamente tutto il paradigma della biologia e della genetica molecolare.
Paradosso del valore c
La complessità degli organismi non corrisponde al loro contenuto di DNA. Questo era noto come il paradosso del valore c: c sta per "contenuto di DNA". Ora lo si può tradurre nel paradosso del numero di geni codificanti per proteina: se andate a vedere il numero di geni codificanti per proteina (le proteine sono gli esecutori del fenotipo. Es. Geni mutati → malattia), corrisponde allo stesso contenuto in un riccio di mare, di un nematode e di un microrganismo, anzi, rispetto a quest’ultimo forse ne abbiamo di meno. Quindi apparentemente non c’è relazione tra complessità fenotipica e complessità genotipica.
Uno può dire che il fenomeno di splicing alternativo nell’uomo è maggiore rispetto ad un nematode o ad un microrganismo, dove il numero di introni è minore e quindi il numero di proteine è minore rispetto all’uomo, ma la complessità fenotipica dell’uomo non è determinata dal numero di geni codificanti proteine.
Genoma umano e pseudo geni
Dal penultimo release (numero 37) del genoma umano, appare evidente il numero di paia di basi in un genoma aploide che è 3,279,005,676. Di queste, circa l’1% è codificante per proteine. Il numero di geni invece è intorno ai 21mila. Queste sono statistiche pubblicate dal consorzio per il sequenziamento del genoma umano (GRC). In questo release abbiamo anche 615 geni nuovi, che sono stati scoperti. Dopo cominciano le sorprese, per così dire, che in qualche modo potrebbero spiegare il paradosso del valore c da cui ero partito.
Innanzitutto c’è questo dato: ci sono più della metà, rispetto ai geni codificanti per proteine, di pseudo geni. Quasi 13.400 di geni che non sono funzionanti, quindi pseudo geni. Questi sono pezzi di gene o geni interi che si sono duplicati ma hanno accumulato un tasso di mutazioni così elevato da non essere più funzionanti. Quindi sono dei relitti che sono presenti all’interno del genoma e non si capisce perché ci sono, ma se hanno resistito alla selezione evolutiva vuol dire che hanno una funzione altrimenti si sarebbero persi. E il fatto notevole è che circa della metà di questi sono esistenti.