23 NOVEMBRE
Progetto ENCODE: lo scopo è stato quello di dare un significato funzionale al genoma umano.
2° progetto: progetto di sequenziamento di 1.000 genomi umani.
NEXT GENERATION SEQUENCING
Prima: metodo di Sanger. Inizialmente si pensava di riordinare i cloni. Strategia vincente: metodo shot-
gun.
Cloni lunghi per fare scaffold per sequenziare regioni poco rappresentate e/o ripetute. Le stremità dei clo-
ni lunghi possono mappare in 2 contig diversi e so così che sono vicini ottengo lo scaffold.
Voglio sequenziare un genoma che non è stato ancora sequenziato:
- Devo isolare il genoma: prelievo di tessuto;
- Estraggo il DNA;
- Frammento il DNA e lo cloniamo;
- di una molecola (con plasmidi e batteriofagi);
Per clonare intendiamo avere popolazioni omogenee
- Ogni clone contiene una molecola di DNA;
- È una frammentazione casuale perché devono avere dei pezzi di sovrapposizione.
- Ogni clone viene messo in un sequenziatore automatico. Conosciamo la sequenza del vettore.
Con Sanger abbiamo 1.000 bp continue di DNA. Il vantaggio di Sanger è avere una sequenza lunga con
un buon livello di accuratezza. Percentuale di errore: 1% che sono però tantissime basi.
1 errore su 100: n° di errori > n° di SNP risolvo risequenziando.
- Variabilità dei nostri cromosomi paterni-materni: 1 base ogni 1.000 basi diverse.
- Per correggere gli errori della sequenza, risequenziamo. Avere tante volte sequenziato un pezzo di
DNA, ci permette di correggere il DNA.
Coverage = copertura della sequenza.
Coverage di 1X : ottengo 3 miliardi di basi (grandezza del nostro genoma) ma avrò dei copioni e dei bu-
non
chi ho sequenziato tutto il genoma con shotgun! 1X quindi non mi basta.
circa
Venter usò 6X 18 miliardi di basi. Così posso correggere gli errori (avrò la stessa sequenza più
volte).
Con gli algoritmi di allineamento, assemblo poi le sequenze del genoma partendo dai vari pezzetti.
- Facciamo un allineamento multiplo. Ottengo una sequenza consensus.
- Gli scostamenti dalla sequenza consensus non sono tutti errori ma ci sono anche dei polimorfismi (an-
che all’interno dello stesso individuo se è eterozigote). Confrontando i pezzi, filtro gli errori e verifico
i polimorfismi. Gli errori hanno frequenza bassa; i polimorfismi più alta.
Più alto è il coverage, più è accurata l’operazione di filtraggio degli errori.
-
È importante avere frammenti lunghi e corti (cloni di lunghezza diversa) per ottenere un contiguo. Se ho
buco devo
una sequenza difficile da clonare e sequenziare (scaffold) avere quindi cloni più lunghi
per collegare due contig.
Nel tumore, non abbiamo solo cells tumorali ma anche lo stroma. Qui abbiamo delle mutazioni. È più dif-
ficile capire se è un errore o un polimorfismo.
Ho quindi bisogno di aumentare il coverage.
Con le tecniche di 1° generazione, aumentare il coverage era molto costoso.
2007: acceleramento evidente.
Oggi costa quanto fare una risonanza magnetica nucleare.
TECNICHE DI 2° GENERAZIONE
È cambiato il ricorso ai cloni.
Il clonaggio è stato eliminato.
Metodi basati sulla PCR. 1
3° generazione: tecnologie che possono dare la sequenza della singola molecola di DNA non mi serve
amplificare.
Ora possiamo fare un ri-sequenziamento del genoma umano perché partiamo da un genoma già sequen-
ziato.
Il costo principale era dato dai cloni. Si iniziarono a costruire le library.
454 (Roche) = pirosequenziamento.
Illumina: stessa ditta che aveva sviluppato gli array. È la più simile a Sanger. Le altre usano principi mol-
to diversi.
Pyrosequencing
- Non serve clonare né piccare le colonie.
- A ogni giro del sequenziatore ottengo informazioni grandi terabyte. 300-800
1) Frammento il genoma in pezzi da circa 100 bp. Qui si usa N ad alta pressione bp. [da qui
avrei fatto i cloni]
2) Da questi frammenti devo generare una library ma non con plasmidi/batteriofagi. Modifico le estremi-
tà dei frammenti. Vengono aggiunti degli adattatori (sequenze sintetiche che conosciamo).
L’adattatore B ha anche una molecola di A e B sono lunghi 44 basi. In mezzo c’è 300-800
3) biotina. bp
di sequenza.
Nelle 44 basi c’è una sequenza più esterna
4) di 20 bp per la PCR e una più interna di 20 bp usata per il
sequenziamento.
5) Denaturo e purifico.
6) Si passa a molecole a singolo filamento.
Molecole con solo B non contribuiscono in modo significativo: fa 2 sequenze sovrapposte e non la capi-
sco. purifico con la biglia che contiene streptavidina che lega la bioti-
Molecole solo A non le purifico perché
na. Leggerei 2 sequenze sovrapposte usando lo stesso primer.
7) La biglia con strettalidina conterrà tante specie molecolari diverse [selezioniamo solo per B].
La molecola non è amplificata! Ogni molecola è diversa dall’altra.
Le 4 basi chiave dell’adattatore legano biglie che hanno oligo complementari sulla superficie.
Rapporto DNA/biglie tale per cui ho 1 molecola di DNA per biglia. Compromesso per non avere biglie
vuote ma neanche biglie con più molecole.
Per togliere molecole B-B, selezione per le 4 bp di A.
Faccio legare la miscela di molecole ad un’altra biglia in base alla sequenza. C’è una chiave (in A e B)
- fatta da 4 basi che riconosce sequenze complementari sulla 2° biglia che ha degli oligonucleotidi.
- Ogni biglia deve catturare 1 sola molecola di DNA.
- Se vogliamo selezionare molecole con A e B, le sequenze della 2° biglia saranno complementari ad A
ho escluso le molecole con 2A e 2B.
Tutte le biglie sono in soluzione acquosa. Le biglie, per poter legare una sola molecola di DNA, devono
essere in eccesso rispetto alle sequenze.
goccioline d’acqua con dentro le biglie nano camere per PCR
In ogni biglia rimangono molecole uguali tra di loro e bloccate sul supporto.
Library fatto da sferette con molecole legate.
- Emulsione con olio minerale (in eccesso) e la soluzione contenente le sferette.
e trattiene l’acqua. Ci saranno
- La biglia è idrofilica anche primer, basi, polimerasi (stessi reagenti di
avrò,
una PCR) attaccate alla stessa biglia, più molecole tutte uguali tra loro.
- Le sferette vengono messe in dei pozzetti che fanno entrare una sola sferetta.
- Il primer è nella sequenza degli adattatori.
abbiamo generato dei
- Nell’amplificazione doppi filamenti! Possiamo sequenziare bi-direzionalmente.
- La lettura della sequenza si base sulla rivelazione della luminescenza. La luciferasi emette luce. Viene
rilevato la presenza di pirofosfato. Una sintesi di DNA, normalmente produce PPi. 2
liberazione
- Qui non ci sono terminatori ma nucleotidi normali vengono incorporati di PPi che vie-
ne misurata. La sulfurilasi converte PPi in ATP. La luciferasi trasforma poi la luciferina ed emette lu-
ce . Tutti questi componenti vanno messi nella miscela di reazione. Metto i desossinucleotidi.
L’ATP
- non è un problema per la polimerasi che usa dATP.
- Si fa passare il reattivo a cicli; ad ogni ciclo si da un desossi diverso. Ogni volta leggo la luce emessa
dalla cella e dopo ogni passaggio lavo.
emissione L’emissione di
- Due GG consecutive più intensa della cella. luce è direttamente propor-
zionale al n° di basi inserita dalla polimerasi.
Devo normalizzare i pozzetti: in alcune biglie potrei avere più molecole ed in altre meno.
È il metodo che, dopo Sanger, ci permette di avere le sequenze più lunghe. Ha una % di errore
abbastanza elevato però.
Nella miscela dobbiamo aggiungere anche AMP per ottenere luciferina.
Quindi, all’inizio, il DNA da sequenziare a singola elica viene amplificato con PCR e incubato con gli
DNA Polimerasi, ATP Solforilasi, Luciferasi, Apirasi e con i substrati Adenosina 5’ FosfoSolfato
enzimi e luciferina.
(APS)
Il DNA genomico viene isolato, frammentato con la nebulizzazione, legato ad adattatori e separato in sin-
gole eliche. dal rilascio di pirofosfato (PPi) in quantità equimolare a
Ogni evento di incorporazione è accompagnato
quella del nucleotide incorporato.
–
Ion Torrent (torrente di ioni) sequenziamento mediante semiconduttori
[vedi video nella slide per capire meglio]
Il PPi acidifica il mezzo perché vengono prodotti protoni nella soluzione.
Sotto il sistema di pozzetti, c’è uno strato sensibile agli ioni e un sensore di ioni. Si legge quanti protoni ci
sono nel pozzetto (la variazione di pH). 3
454 Life sciences, 2005
Nel 2005 la 454 Life sciences (Roche) ha inventato un sistema di pirosequenziamento parallelo su larga scala che
non richiede elettroforesi: 454 sequencing. Utilizza la PCR in emulsione per amplificare il DNA e un substrato
in fibre ottiche con micropozzetti larghi 44 µm e profondi 55 µm per sequenziare il DNA con un protocollo di
pirosequenziamento ottimizzato per il supporto solido e i volumi nell’ordine dei picolitri.
È in grado di sequenziare 25 milioni bp/run (con il 99% di accuratezza) quindi con un aumento di 100 volte
rispetto al sequenziamento di Sanger con elettroforesi capillare. Consiste in 3 fasi:
1. Preparazione della libreria di DNA: il DNA genomico viene isolato, frammentato con la nebulizzazione,
legato ad adattatori e separato in singole eliche: 4
2. PCR in emulsione: i frammenti vengono legati a beads in condizioni che favoriscono un frammento per
bead. I beads in emulsione e i reagenti per la PCR vengono "catturati" da goccioline di acqua in olio. In
ognuna delle goccioline, che funzionano da microreattori, i frammenti vengono amplificati, con il
risultato che ad ogni bead saranno legati decine di milioni di copie dello stesso frammento:
3. Sequenziamento: l’olio viene eliminato dall’emulsione e le eliche di DNA vengono denaturate; i beads
1 bead
con legati i frammenti a singola elica vengono deposti nei micropozzetti del PicoTiter Plate device:
per ogni micropozzetto. Beads più piccoli con immobilizzati gli enzimi richiesti per il
pirosequenziamento sono deposti in ogni micropozzetto:
Ad ogni ciclo vengono aggiunti i 4 nucleotidi TACG 1 per volta in sequenza; quando un nucleotide
complementare allo stampo viene aggiunto la DNA Polimerasi lo incorpora rilasciando pirofosfato che
l’ATP Solforilasi converte ad ATP permettendo alla Luciferasi la conversione di luciferina ad
ossiluciferina con produzione di un segnale luminoso che viene registrato dalla camera CCD.
Dopo ogni ciclo i micropozzetti del PicoTiter Plate device vengono lavati con un buffer contenente
Apirasi, che degrada i dNTPs non incorporati e l’ATP in eccesso. 5
24-11-15 METODO ‘ILLUMINA’: bridge PCR e terminatori reversibili
https://www.youtube.com/watch?v=77r5p8IBwJk
https://www.youtube.com/watch?v=womKfikWlxM
https://www.youtube.com/watch?v=HMyCqWhwB8E
Affrontiamo uno dei metodi maggiormente usati tutt’ora: il metodo ILLUMINA.
Si parte anche qui da una frammentazione della molecola di DNA (qui vengono usati gli ultrasuoni,
per ottenere molecole dal peso molecolare corretto).
Successivamente vengono legati degli adattatori e poi, su questo gel, viene fatta una selezione dei fram-
menti in questa miscela; in questo modo decidiamo noi la misura dei frammenti da sequenziare.
Questo non è obbligatorio, soprattutto se abbiamo poco materiale. Aumenta la resa.
Gli adattatori contengono 2 sequenze: P5 e P7 che vengono usati per fare una prima amplificazione.
Abbiamo un primer che ha una parte complementare agli adattatori e che viene usato per estendere la mo-
lecola.
Produciamo una popolazione omogenea di molecole che occupano uno spazio limitato sulle quali possia-
mo poi fare dell’imaging. Per l’amplificazione viene usato il sistema
bridge-PCR.
Le molecole vengono quindi tutte modificate
in modo da avere sia P5 che P7.
P5 e P7 legano la cella a flusso laminare.
Gli adattatori sono essenziali per potere lega-
re le altre sequenze.
Sarebbe possibile, in teoria, legare inizial-
mente i due primer. Tuttavia avremmo il pro-
blema di selezionare molecole che hanno un
primer da una parte e uno dall’altra parte.
Gli adattatori che vengono legati nella prima
reazione ligasica non sono diversi ma sono la
stessa sequenza.
avendo la stessa sequenza, poi voglio met-
tere due estremità diverse. Solo le molecole
con estremità diverse potranno infatti essere
sequenziate in entrambe le direzioni.
Userò due primer specifici per queste due se-
quenze.
Nel singolo filamento ho quindi le due se-
alle estremità; ho però un 5’ e u
quenze uguali
3’.
Prima si fa appaiare un primer alla sequenza
che ho legato. Questo primer contiene P7 e una sequenza complementare all’adattatore che è stato utiliz-
zato. Se ho un’estensione di questo frammento, arrivo fino all’altra estremità.
Alla seconda estremità si lega l’altra molecola.
C’è un sistema che ci permette di selezionare i frammenti della prima reazione. Questi inizieranno tutti
con P7 e saranno complementari all’altra. l’altro primer.
Sul nuovo filamento sintetizzato possiamo attaccare
Alla fine vogliamo una molecola a doppio filamento. 6
Nella reazione successiva, le molecole vengono denaturate e poi fatte appaiare con la superficie della cel-
lula.
C’è un “prato” di oligont legati covalentem. alla cellula.
Il 3’ di questi oligont sporge e va ad ibridizzare con gli adattatori che abbiamo alle estremità.
A questo punto faccio una reazione di estensione. Viene esteso il primer legato al supporto solido e viene
così prodotta una molecola che è complementare a quella utilizzata ma che è vincolata al supporto solido.
Su questa molecola procediamo.
Su questo “prato” avremo una sequenza complementare a P5 e una a P7.
Se l’ibridazione iniziale fosse avvenuta per ibridazione con P5, all’altra estremità del filamento avrò P7.
Su questa cell avrò una miscela di amplificazione.
Per una PCR ci serve uno stampo (che abbiamo).
P5 e P7, i nostri primer, sono legati al supporto solido.
Mettiamo la polimerasi nella miscela, i nucleotidi e la Taq polimerasi.
il singolo filamento. Lo stampo originale se n’è andato e non ce
Denaturazione; a 90° otteniamo
l’abbiamo più. Abbiamo solo una molecola copia attaccata in maniera irreversibile alla superficie solida.
L’estremità 3’ sintetizzata va ad ibridizzare con uno degli altri primer.
l’estensione produrremo un doppio filamento.
Durante
Procedendo così, aumenterà il n° di molecole e saranno molto vicine perché vincolate al supporto.
Bridge quindi perché le molecole singolo filamento fanno un ponte con gli oligont che permette
l’estensione.
questo modo arriviamo ad avere un’altissima densità di molecole.
In
Queste però non sono marcate (abbiamo usato nucleotidi normali).
Ora posso sequenziare.
Per legge le molecole ho bisogno di sintetizzare del DNA; questa metodica è la più vicina a Sanger.
Ho quindi bisogno di un primer che non può essere quello ancorato.
Scelgo quindi una sequenza più interna.
P5 e P7, in parte ibridizzano con gli oligont legati alla superficie e hanno una parte più interna che non
viena usata nel bridge. Questa parte viene usata per il sequenziamento; quella di P5 e diversa da quella di
posso
P7 fare 2 reazioni di sequenziamento.
Se ne faccio una con primer P5, userei metà delle molecole per stampo.
In questo modo ottengo la sequenza delle due estremità.
La sintesi procede utilizzando dei terminatori reversibili fluorescenti; è un gruppo che ha un fluoro-
cromo attaccato. Questo può essere incorporato dalla polimerasi. Si sono ingegnerizzate delle molecole
tali per cui posso idrolizzare questo legame. Posso quindi fare una reazione in cui il nt viene incorporato
blocca la reazione e leggo il fluorocromo che è attaccato. Faccio una reazione in cui metto tutte e 4 le
basi bloccate al 3’ con un terminatore reversibile con colori diversi.
Qual è la prima base dopo il primer?
Metto la miscela con tutti e 4 e vedo cosa succede. Ho dei cicli di lettura. Ad ogni ciclo metto tutte e 4 le
basi. Ogni spot avrà un colore (fluorescenza) diverso che dipende dalla prima base dopo il primer.
Faccio ora idrolisi. Tolgo il gruppo e avrò una base+OH+primer.
Faccio il 2° ciclo con tutti e 4 i terminatori reversibili.
In ogni ciclo aggiungo una base alla volta su tutti gli spot.
Quindi tra un ciclo e l’altro c’è la rimozione del terminatore ed una nuova reazione.
imaging idrolisi imaging idrolisi….
Reazione reazione
Limite: possiamo leggere 100 bp dopo il primer x 2 = le 2 estremità! 7
Le molecole sintetizzate che si allungano non sono legate covalentemente alle molecole legate alla cell.
METODO ABI SOLID
È il metodo più complesso. Produce sequenze più corte di tutte ma più accurate.
Come negli altri sistemi dob-
biamo amplificare il DNA ma
nel sequenziamento SOLID
l’enzima chiave non è la poli-
merasi ma la DNA ligasi. So-
no reazioni ligasi.
Il substrato sono delle beats
(biglie) con delle molecole di
di cui conosciamo un’estremità.
DNA attaccate
Hanno un adattatore: P1 adapter.
La cosa importante è generare una popolazione di molecole legate ad un supporto solido delle quali cono-
sciamo una estremità, il frammento P1.
Siamo in una camera che fa delle foto dei colori delle palline. Qui abbiamo un rapporto tra le basi e colori
non univoco.
Non parliamo più di una singola base ma di coppie di basi. Ad ogni coppia corrisponde sempre lo stesso
colore. Ma ad un colore possono corrispondere coppie diverse.
Abbiamo dei probes che hanno il fluorocrom e che finiscono con delle
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Biologia molecolare prof.re Di Cunto
-
Biologia molecolare - organismi transgenici
-
Biologia molecolare
-
Biologia Molecolare