I DUE CONTENDENTI
Alla fine si è deciso di sequenziare l'intero genoma.
Il Progetto Genoma Umano ha visto due contendenti:
Craig Venter: presidente della Celera Genomics
• Francis Collins: direttore del National Human Genome Reasearch Institute
•
SHOTGUN GERARCHICO
La strategia che è stata utilizzata per sequenziare il genoma umano (nel progetto Genoma Umano) è
la strategia dello shotgun gerarchico.
Lo shutgun gerarchico, definito anche come approccio “clone by clone”, è infatti il metodo
convenzionale per determinare la sequenza di un genoma eucariotico ovvero di un genoma di
grandi dimensioni.
Come funziona?
Si è estratto il DNA di numerosi soggetti che è stato successivamente frammentato in frammenti di
dimensioni abbastanza grandi parzialmente sovrapposti; in seguito, si è costruita una libreria
genomica ovvero si sono inseriti suddetti segmenti all'interno di vettori BAC (che contengono
frammenti di dimensioni elevate).
Successivamente alla formazione della libreria di BAC, si è generata una mappa fisica del genoma;
ovvero, prima di sequenziare, si è cercato di ordinare la libreria di BAC ovvero conoscere già
quale fosse la sequenza di suddetti frammenti a livello delle differenti regioni cromosomiche.
La costruzione di questa mappa è stata la base per il sequenziamento successivo.
Per ciascun cromosoma, quindi, si è cercato di conoscere la posizione di suddetti frammenti che si
sovrapponevano parzialmente, in modo da ottenere una mappa fisica del genoma.
Dopo aver ordinato questi cloni sovrapposti, si è proceduto con la selezione del numero minimo di
frammenti da sequenziare per ottenere la sequenza completa della regione cromosomica; si è cioè
ottenuto il minimal tiling path.
Infatti, dalla frammentazione casuale si ottengono più frammenti che rappresentano la stessa
regione cromosomica; quindi si è cercato di selezionare il numero minimo di cloni che
rappresentano una data regione cromosomica. Ovvero, sequenziando solamente quei cloni
selezionati, è possibile ricostruire l'intera sequenza cromosomica.
Quindi la mappa fisica ha permesso sia di ordinare i cloni sia di ridurre il numero di cloni da
sequenziare necessario per ottenere l'intera sequenza cromosomica.
Una volta ottenuta questa mappa fisica, si è proceduto con il sequenziamento vero e proprio dei
cloni ottenuti.
Ciascun clone, nello specifico, è stato ulteriormente frammentato e ciascuno di questi segmenti è
stato successivamente sequenziato. Le diverse sequenze dei frammenti sono state assemblate in
modo da ottenere la sequenza completa di ciascuno di questi cloni.
Ricorda!
Il progetto genoma umano ha sequenziato il genoma di numerosi individui provenienti anche da
popolazioni (etnie) diverse; questo ha consentito di identificare immediatamente i polimorfismi
(varianti di sequenza) presenti nel genoma umano.
Da Omiche
Fasi dello shotgun gerarchico
Dal momento che i genomi di grandi dimensioni sono, nella maggior parte dei casi, formati da
cromosomi, il primo step dello shotgun gerarchico consiste nel separare i singoli cromosomi.
Ciascuno di questi cromosomi, quindi, viene successivamente frammentato in modo da ottenere
frammenti di circa 150mila bp.
Tali frammenti vengono quindi clonati all'interno di appositi vettori BAC che vengono utilizzati per
trasformare batteri; in questo modo, si origina la libreria primaria di cloni BAC (che è una libreria
genomica).
La libreria primaria di cloni BAC è costituita, però, da cloni BAC che contengono frammenti
clonati che sono molto sovrapposti tra di loro. Dal momento che il sequenziamento completo di
questa libreria è molto dispendioso, si cerca di ridurre al minimo il numero di cloni BAC che
devono essere sequenziati.
Quindi, dopo aver costruito questa libreria, inizialmente si ordinano i diversi cloni BAC ottenuti in
modo da capire come essi sono sovrapposti tra di loro; per ordinare tali cloni, si costruisce una
mappa fisica dei singoli BAC.
Attraverso questo processo di allineamento, si ordinano i singoli frammenti che si sono originati dal
DNA cromosomico in tanti frammenti sovrapposti.
Una volta che i cloni BAC sono ordinati, si definisce il minimal tiling path ovvero si seleziona il
numero minimo di cloni che, sovrapposti tra di loro, sono in grado di ricostruire la sequenza
genomica completa.
Una volta selezionati questi cloni BAC, si procede con la frammentazione degli stessi (l'inserto di
150mila basi è frammentato in frammenti sovrapposti di 1000-2000 bp) in modo da formare, per
ciascuno di essi, una libreria plasmidica secondaria.
Ogni libreria plasmidica secondaria corrisponde ad un BAC di partenza.
I frammenti dei plasmidi vengono quindi sequenziati (attraverso il metodo shotgun) e si procede
con il loro allineamento; l'allineamento di questi frammenti porta alla formazione della sequenza
consensus del singolo BAC di partenza.
Una volta ottenute le sequenze consensus di ogni BAC appartenente al minimal tiling path, vengono
allineate per originare la sequenza completa del cromosoma.
Mappa fisica
Un punto importante preliminare al sequenziamento del genoma umano è stata la costruzione di una
mappa fisica ad alta risoluzione per ognuno dei cromosomi umani.
Per completare una mappa fisica di 3 miliardi di basi è necessario disporre di librerie genomiche
comprensive di tutto il genoma suddiviso in frammenti parzialmente sovrapposti tra di loro e clonati
in appositi vettori.
Una delle caratteristiche di queste libraries genomiche è che devono essere costituite da grossi
5
frammenti di DNA, nell'ordine di 100-300 kb, in modo che con 2-5 x 10 cloni indipendenti è
possibile avere la completa rappresentazione del genoma.
Le mappe di contigui di cloni costituiscono veri e propri blocchi di partenza per il sequenziameno
del DNA.
Si ricordi che una mappa fisica è una mappa che localizza i marcatori sui cromosomi, dando una
posizione espressa con misure fisiche reali, cioè il numero di paia di basi (bp).
Esistono due tipi di mappaggio fisico che si distinguono per la distanza che riusciamo a definire tra
due marcatori:
mappa fisica a bassa risoluzione
• mappa fisica ad alta risoluzione: è ottenuta mediante mappaggio con enzimi di restrizione
• o FISH (uso sonde direttamente sui cromosomi)
Minore è la distanza definita tra due marcatori, più alta è la risoluzione della mappa
Ordinamento di una libreria genomica di cloni BAC
Dopo aver ottenuto una libreria primaria di cloni BAC, è necessario ordinare i cloni BAC ottenuti.
Solo dopo averli ordinati è possibile selezionare il Minimal Tiling Path, ovvero la collezione di
frammenti genomici in grado di coprire la regione cromosomica con il minor grado di
sovrapposizione.
Si ricordi che la somma delle sequenze consensus dei singoli cloni BAC selezionati permette di
ottenere l'intera sequenza del cromosoma di partenza.
Da Omiche:
Lo step più complicato è sicuramente quello di ordinare i cloni BAC.
Mettere in ordine i cloni BAC significa organizzare dei cloni genomici in una mappa fisica, cioè in
un set ordinato di frammenti di DNA su una regione cromosomica.
E' essenziale che la mappa fisica prodotta sia accurata poiché errori a questo livello portano alla
formazione di sequenze cromosomiche chimeriche.
Gli approcci che possono essere utilizzati per ordinare i cloni BAC sono differenti:
chromosome walking: camminare sul cromosoma.
• Questa strategia consiste nello scegliere un clone di una genoteca ed identificare
successivamente un secondo clone il cui inserto si sovrappone a quello del primo. Poi, si
identifica un terzo clone il cui inserto si sovrappone al secondo ecc e così via.
Il chromosome walking può essere di diverso tipo:
1. utilizzo l'inserto del DNA del clone di partenza come sonda di ibridazione per saggiare tutti
gli altri cloni della libreria
2. chromosome walking mediante PCR: si sequenzia per ogni BAC un piccolo frammento al
5' o al 3'. Successivamente si sono disegnano delle coppie di primer per i singoli BAC; con
una coppia di primer si amplifica il DNA di tutti i BAC della libreria. Dov'è presente il
segnale, allora c'è sovrapposizione
fingerprinting dei cloni: le informazioni sulla struttura fisica di un frammento di DNA
• clonato vengono confrontate con le informazioni di altri cloni.
In questo modo è possibile osservare la presenza di somiglianze tra cloni che sono indicative
di sovrapposizione dei frammenti contenuti nei cloni stessi.
Il fingerprinting può essere:
1. per mappa di frammenti di restrizione: sono confrontati i profili di digestione (ottenuti
mediante l'utilizzo di enzimi di restrizione) di cloni BAC.
I cloni BAC che originano il maggior numero di dimensioni uguali sono BAC concatenati
(sovrapposti)
2. del contenuto di sequence-tagged sites (STS): si valuta il contenuto di queste brevi
sequenze uniche, lunghe da 200 a 500 bp, nei cloni BAC
Attraverso l'ordinamento dei BAC, si passa da una libreria altamente ridondante, a un numero di
cloni BAC ridotto che ha il minimo grado di sovrapposizione.
Il numero minimo di cloni è opportuno per ridurre al minimo il lavoro di sequenziamento che deve
essere svolto.
Librerie plasmidiche secondarie
Per ogni BAC selezionato (per ogni BAC che costituisce il minimal tiling path) viene formata una
libreria secondaria plasmidica.
Infatti, il frammento di circa 150mila bp contenuto nel BAC viene frammentato in frammenti di
circa 500-2000 bp che sono clonati all'interno di vettori plasmidici.
Ogni plasmide verrà sequenziato.
Alla fine le diverse sequenze si assemblano a formare contig. L'obiettivo è quello di ottenere, dopo
sequenziamento di ogni singola libreria plasmidica, un unico contig per ogni BAC.
Alla fine i singoli BAC si allineano tra di loro per formare la sequenza cromosomica completa.
Fasi schematiche dello shotgun gerarchico
Le principali fasi della strategia shotgun gerarchico di sequenziamento sono:
1. costruzione di una libreria genomica con inserti cromosomici di grandi dimensioni
2. costruzione di una mappa fisica del genoma e selezione del numero minimo di cloni per
coprire il genoma (minimal tiling path)
3. frammentazione casuale e sequenziamento shotgun dei cloni
4. assemblaggio delle sequenze
LIBRERIE DI cDNA
Perché sequenziare tutto subito se la maggior parte di ciò che interessa sono le sequenze
codificanti?
Venter iniziò quindi la produzione di librerie di cDNA tessuto-specifiche e il sequenziamento di
corte sequenze dette EST (Expressed Sequence Tags); egli quindi pensa di partire dal
sequenziamento delle sequenze codificanti per ricostruire la sequenza del genoma umano (i gap
sarebbero poi stati riempiti).