Estratto del documento

Analizzare i geni e comprendere la loro funzione

Sequenziamento del DNA

Il sequenziamento del DNA non consente solo l'analisi dei geni, ma anche la loro posizione e le sequenze delle regioni regolatorie. I primi metodi di sequenziamento sono stati sviluppati alla fine degli anni '70: metodo Sanger (enzimatico) e Maxam-Gilbert (degradazione chimica). Quello di Sanger è stato il metodo di elezione fino a circa gli anni 2000; durante gli anni '90 iniziano a svilupparsi i sistemi automatizzati di sequenziamento che permettono la generazione di più sequenze in parallelo e l'estensione della lunghezza del DNA sequenziato (800-900 pb). Con questa tecnica è stato possibile sequenziare i primi genomi.

Classi di metodi di sequenziamento

  • Metodo di Sanger: basato sulla sintesi mediata da primer e DNA polimerasi.
  • Metodo di Gilbert: la molecola di DNA viene marcata e frammentata, viene staccata una base preferenziale.
  • Next Generation Sequencing (NGS): sintesi di DNA mediante incorporazione di nucleotidi.

Metodo di Sanger

Si basa sulla sintesi in vitro di un filamento complementare a quello del quale si vuole conoscere la sequenza. Miscela di: DNA stampo denaturato a singolo filamento + DNA polimerasi + ddNTPs e dNTPs. I ddNTPs sono chain terminating, privi del gruppo -OH necessario per formare il legame fosfodiesterico, quindi la catena si arresta dopo la loro incorporazione. I ddNTPs si trovano in rapporto 1:10 rispetto ai nucleotidi. Si formano dei frammenti che coprono tutte le posizioni, presenti frammenti arrestati in diverse posizioni dello stampo.

Vengono utilizzati degli oligonucleotidi lunghi 15-30 nucleotidi. La DNA polimerasi utilizzata è di solito ingegnerizzata perché deve essere termostabile e priva dell'attività proofreading (il frammento di Klenow è la porzione della DNA polimerasi che non ha attività proofreading) ed essere altamente processiva e incorporare efficientemente i ddNTPs. I ddNTPs sono coniugati a fluorofori di colore diverso a seconda della base azotata, visualizzando la fluorescenza utilizzando luce UV. La reazione di sintesi avviene a 30°C.

Tradizionalmente, il DNA veniva marcato con un isotopo radioattivo al 5’ che imprimeva la lastra radiografica visualizzata in seguito a separazione su gel di poliacrilammide (ha la risoluzione di un nucleotide); in questo modo era possibile la ricostruzione della sequenza sintetizzata, complementare a quella stampo. La lettura sulla lastra della sequenza del filamento complementare avveniva dal basso verso l'alto (ha anche polarità inversa rispetto al filamento di interesse).

Visualizzazione dei frammenti

  • Marcatura dei primer con 32P.
  • Marcatura con 35S o 32P dei dNTPs che devono essere incorporati.
  • ddNTPs marcati con fluorocromi (molecola eccitata da una certa lunghezza d'onda che ritorna allo stato basale emettendo energia sotto forma di fluorescenza).

Le reazioni vengono fatte avvenire tutte insieme, non vengono utilizzate 4 provette diverse: ottenuto un profilo di picchi che rappresentano la rilevazione delle bande (elettroferogramma). L'altezza del picco indica l'abbondanza del frammento. Nel macchinario viene effettuata un'elettroforesi capillare, il laser eccita e il detector rileva la lunghezza d'onda di emissione, che corrisponde al fluorocromo associato alle basi azotate.

Vantaggi e svantaggi del metodo Sanger

  • Vantaggi:
    • Produce delle sequenze precise e relativamente lunghe.
    • Utilizza la DNA polimerasi di Klenow, la quale ha una buona processività (fino a 600-700 pb).
  • Svantaggi:
    • Tempo.
    • Analisi di poche sequenze alla volta.

Next Generation Sequencing (NGS)

I metodi NGS, a differenza di quello di Sanger, tendono a produrre delle sequenze più brevi (30-100 pb). Producono tantissime sequenze, ma molto corte e con molti errori. Nel metodo di Sanger avviene la sequenza di una molecola di DNA alla volta, nell’NGS vengono sequenziati tantissimi frammenti di DNA in parallelo, ma più brevi. Avviene la frammentazione del DNA genomico con varie tecniche (enzimatiche o meccaniche) in modo da generare una libreria che verrà sequenziata. L'output del sequenziamento sono delle reads (piccoli frammenti) che poi vengono allineati/assemblati a livello bioinformatico al fine di ottenere la molecola di DNA di partenza. Servono tante reads che coprono la stessa regione (coverage).

Utilizzi del NGS

  • SNP
  • Mappatura delle copy number variation dei geni
  • Metilazione
  • Siti di binding proteici (Chip-seq)
  • Studi di espressione genica, mRNA, microRNA

Avviene la generazione di terabyte di dati che poi devono essere analizzati. Questa tecnica processa milioni di sequenze in parallelo, ma con un’altissima frequenza di errore (anche del 15%). Analisi di sequenze già in parte conosciute, l’NGS non viene utilizzato per il sequenziamento de novo di genomi mai sequenziati. Questa tecnologia deriva dal metodo Sanger, ma sono state sviluppate delle modifiche a seconda della piattaforma utilizzata. Le piattaforme hanno degli approcci in comune: tutte richiedono la generazione di una library di frammenti (preparazione del templato), sequenziamento, rilevazione delle sequenze, analisi dei dati (alignment o assemblaggio delle reads in frammenti di lunghezza maggiore).

La preparazione del templato si basa sull’estrazione del DNA e la sua frammentazione mediante enzimi di restrizione o rottura meccanica (sonicazione). Avviene il legame di adattatori a sequenza nota (linker) a entrambe le estremità dei frammenti, generazione di una library. Questi linker consentono l’amplificazione dei frammenti mediante PCR e la successiva immobilizzazione dei frammenti a livello della piastra di sequenziamento, dove avverrà il sequenziamento delle singole molecole di DNA. L’amplificazione mediante PCR può introdurre dei bias/artefatti che possono fare sì che il DNA non venga amplificato con la stessa frequenza. Sequenziamento di ogni molecola di templato in parallelo. Il frammento viene sequenziato solo in una parte della sua frazione, non tutto in quanto l’assemblaggio avviene elettronicamente.

Cosa si può fare con l'NGS?

  • Deep whole genome sequencing: sequenziamento completo e accurato di un genoma. Profondità = numero di reads che coprono una certa regione. Tante più reads coprono una regione, tanto più il sequenziamento è accurato. Metodo costoso e che produce un’elevatissima mole di dati.
  • Low coverage whole genome sequencing: ha una copertura meno profonda, fornisce meno informazioni (rilevazione solo delle variazioni più macroscopiche), ha un prezzo inferiore.
  • Exome capture and targeted region sequencing: analizza solo porzioni esoniche (molto preciso), ha un’elevata coverage. Molto utilizzato per la ricerca di SNP associati alle patologie.

Esistono varie piattaforme commerciali per il sequenziamento NGS: SOLiD (molto complesso e costoso), Illumina Solexa, Roche 454, ognuna ha delle sue caratteristiche. Tutti i metodi prevedono una reazione di sequenziamento che varia in base alla piattaforma utilizzata:

  • Sequenziamento per ligazione di brevi sequenze oligonucleotidiche complementari allo stampo.
  • Sequenziamento per sintesi.

Sequenziamento per ligazione

Si basa sull’incorporazione di corti frammenti di DNA generati in modo random che hanno sequenza complementare al filamento stampo. Si utilizzano dei primer che forniscono il 5’ fosfato per consentire la ligazione delle sonde. Queste sonde vengono via via incorporate e sono provviste di una molecola fluorescente. Viene aggiunta una ligasi che liga il frammento complementare. Si ha emissione di fluorescenza e poi si ha uno step che rimuove il fluoroforo all’estremità 5P, dove entra un nuovo oligonucleotide marcato. Avviene la generazione di un pattern di colorazione specifico che viene tradotto in sequenza da un software.

Piattaforma SOLiD

Sistema ormai obsoleto, lento (5 giorni ca) e complicato. Lettura di sequenze di circa 25-35 paia di basi.

Sequenziamento per sintesi

  • Illumina Solexa: il sequenziamento avviene perché la sintesi prevede l’incorporazione di un nucleotide chain terminator marcato con un fluoroforo. Il DNA viene frammentato e denaturato, avviene il legame di oligonucleotidi; un’estremità è complementare agli oligonucleotidi presenti sulla flow cell (immobilizzazione), mentre l’altra serve per l’appaiamento dei primer necessari per la reazione di amplificazione. La reazione di sequenziamento avviene grazie a una miscela che contiene didesossinucleotidi coniugati a fluorofori di colore diverso che, quando vengono incorporati, rilasciano fluorescenza. I nucleotidi vengono modificati chimicamente in modo da rimuovere il blocco a livello del 3’-OH, ossia il fluoroforo, consentendo il legame del nucleotide successivo.
  • Bridge amplification: una tecnica utilizzata per amplificare i frammenti di DNA.
  • Pyrosequencing (Roche 454): quando un nucleotide viene incorporato, viene rilevata l’emissione della fluorescenza data dal rilascio di pirofosfato. Il PPi rilasciato dopo l’incorporazione di un nucleotide, viene convertito in ATP per opera della ATP sulfuridasi; l’ATP viene utilizzato dalla luciferasi per produrre un segnale luminescente. Noi conosciamo quale nucleotide viene fornito alla reazione (se è stato incorporato, avviene la reazione luminosa), in questo modo è possibile ricavare la sequenza. Queste reazioni avvengono a livello di beads che contengono degli oligonucleotidi complementari agli adattatori che hanno legato i frammenti di DNA; emulsion PCR, goccioline lipidiche che hanno tutto il necessario per far avvenire uno step di PCR. Dà delle reads lunghe: circa 200 paia di basi.

Lo step finale consente nell’analisi dei dati. Dopo la generazione delle reads (30-400 pb), queste possono essere allineate a una sequenza di riferimento oppure assemblate de novo. Per le sequenze di riferimento vengono utilizzati i database dell’NCBI. Problema: se le reads coprono brevi tratti di DNA, ne servono tantissimi per ridurre gli eventuali mismatch che possono avvenire durante il sequenziamento. Una volta allineate le sequenze, bisogna ricavare le informazioni (ad esempio: identificazione dei geni protein-coding, individuazione delle ORF e delle regioni intergeniche, …). Il pirosequenziamento di solito introduce come errori inserzioni e delezioni. Il sequenziamento Solexa introduce sostituzione di basi.

La scelta della tecnologia dipende dall’obiettivo: se bisogna fare chip-seq, basta una sequenza relativamente breve per identificare dove si lega il fattore di trascrizione. Se si vuole identificare delle sequenze di splicing e quindi si deve sequenziare il cDNA, si utilizza Roche 454.

Sequenziamento di III generazione

I problemi del sequenziamento di II generazione sono legati all’amplificazione mediante PCR, che può creare dei bias, e le reads sono corte. Viene sequenziata la singola molecola ottenendo delle sequenze il più lunghe possibile.

  • Sistema PacBio RS: viene sequenziato il singolo frammento di DNA senza passare per uno step di amplificazione in PCR. Il frammento di DNA viene ligato con degli oligonucleotidi che hanno delle regioni hairpin (SMRT bell) che presentano delle regioni a singolo filamento alle estremità dove avviene il legame dei primer. Il sequenziamento avviene mediante sintesi, i nucleotidi sono marcati con fluorofori diversi. Ciascuna reazione di sequenziamento avviene all’interno di micropozzetti che contengono un unico templato. È un sistema molto sensibile.

NanoPore

IV generazione

A differenza delle altre piattaforme, il NanoPore non monitora l’incorporazione o l’ibridazione di nucleotidi guidata da un filamento di DNA stampo. Avviene la detection diretta della composizione in DNA di molecole a singolo filamento. Il DNA passa attraverso un core proteico, attraverso il quale passa anche della corrente. Viene sequenziata una singola molecola di DNA con dei risultati parecchio affidabili (fino ai 10.000 nucleotidi). Importante per le tipizzazioni di varianti virali.

Post-genomica

A. Identificare i geni dalla sequenza

Esistono due approcci:

  • Approccio computazionale (ab initio): le nuove sequenze di DNA vengono analizzate per identificare le potenziali ORF, quindi sequenze che possono generare le proteine. Ogni sequenza di DNA e proteica può essere comparata ad altre sequenze presenti nel database (NCBI) per vedere se ci sono delle similarità. Per studiare la funzione di un gene, questo viene comparato a dei geni che sono stati caratterizzati precedentemente: sequenze geniche che hanno un’elevata similarità di solito hanno funzioni simili. BLAST: ricerca di omologie tra sequenze biologiche, compara la sequenza di interesse con le sequenze presenti nel database e calcola la significatività statistica. L’analisi delle ORFs permette lo studio dei codoni di inizio e di terminazione, necessari per lo studio di: codon bias specie-specifici, confini tra esoni e introni, CpG islands, regioni di controllo a monte.
  • Approccio sperimentale: metodi di tipo genetico (studi di mutagenesi) e metodi di tipo biochimico (purificazione del prodotto proteico e caratterizzazione in vitro).

B. Fare profilo dell’espressione genica dei geni

Quindi analizzare l'RNA e le proteine.

C. Fare studi di attività genica

Utilizzo della PCR come tecnica semi-quantitativa. Range di cicli basso se si vuole quantificare (meno bias e maggiore funzionalità dell’enzima). Si utilizza per amplificare specifiche sequenze di DNA quando sono note le sue sequenze alle estremità. I primers vengono aggiunti in grande eccesso.

  1. Denaturazione
  2. Annealing dei primers
  3. Estensione grazie alla DNA polimerasi

Reagenti: templato, buffer, Taq polimerasi, Mg2+, desossinucleotidi, primers. Di solito vengono effettuati 25-35 cicli. 18S viene utilizzato come housekeeping. Nella milza, la banda si vede dopo più cicli rispetto al testicolo/ovaio. Possiamo dire se solo se è più o meno espresso, ma non quanto.

Real time qPCR

Metodo quantitativo e sensibile per la detection e la quantificazione dei livelli di acidi nucleici in base alla fluorescenza emessa da una molecola reporter. La detection avviene durante l’accumulo del prodotto di PCR durante i cicli di amplificazione.

Strategie

  • Sonde di DNA marcate con fluorofori (TaqMan, Molecular Beacons).
  • Primer di DNA marcati con fluorofori.
  • Molecole fluorescenti che si intercalano nel DNA a doppio filamento, ossia quello amplificato (SYBR Green).

TaqMan

Sonde consistono in un fluoroforo legato covalentemente all’estremità 5’ e un quencher al 3’ di un oligonucleotide. Sono complementari a una regione della porzione di DNA che viene amplificata, quando si appaiano (quindi quando avviene l’amplificazione durante la reazione di PCR) avviene l’emissione di fluorescenza perché il quencher si stacca.

Molecular Beacon

Sonde sono delle molecole con struttura ad hairpin che presentano il fluoroforo al 5’ e un quencher al 3’. Nel loop della forcina si trova una sequenza complementare alla sequenza target che viene amplificata; quando avviene l’amplificazione, la struttura a forcina si disgrega e avviene l’appaiamento tra le sequenze, in questo modo il fluoroforo si allontana dal quencher e avviene emissione di fluorescenza.

Green

SYBER è un intercalante fluorescente che si inserisce nel DNA a doppio filamento man mano che avviene l’amplificazione. L’intensità di fluorescenza correla con la quantità di DNA che è stato amplificato. Non è sequenza-specifico, ma struttura-specifico (ossia DNA a doppio filamento). Contro: se i primer si ibridano con sequenze non target, si ha fluorescenza aspecifica. L’analisi della curva di melting permette di studiare la specificità dei primer. La presenza di un picco più piccolo indica la presenza di un altro amplificato. Nell’esempio: secondo picco che si forma a una temperatura di melting più bassa, prodotto aspecifico.

Gold standard è l’elettroforesi dei prodotti di PCR e l’analisi del gel (vedere se ci sono due bande o una). L’intercalante fluorescente si lega al DNA a doppio filamento, alla fine del programma di PCR il termociclatore viene impostato a una determinata temperatura (di solito intorno alla Tm dei primer, circa 65°C) e avviene la misura dell’emissione di fluorescenza. Viene aumentata la temperatura gradualmente mentre lo strumento continua a misurare la fluorescenza. Aumentando la T, il DNA inizia a denaturarsi e decresce la fluorescenza (curva di dissociazione). È possibile fare una multiplex PCR, strategia che consente di visualizzare più amplificati diversi nella stessa reazione. Vengono utilizzate delle sonde marcate con fluorocromi di diversi colori (esistono varie molecole con chimiche tali che se eccitate a una certa lunghezza d’onda emettono a una lunghezza d’onda che sta nello spettro del visibile).

Criteri per disegnare dei primer

  • Temperatura di melting deve essere simile, di solito è intorno ai 60-62°C.
  • Lunghezza di 18-30 basi (lunghezza per avere una sequenza unica nel genoma).
  • Contenuto in GC di circa il 35-60%.
  • Devono essere evitate sequenze che possono creare delle strutture secondarie o dei dimeri.
  • Lunghezza dell’amplificazione di circa 80-200 pb.

Fare sempre una ricerca su BLAST per verificare la specificità del primer.

Value

Dato informativo che serve per quantificare: numero di cicli richiesti affinché la quantità di amplificato superi un certo valore soglia, ciclo soglia, ciclo a partire dal quale l’amplificazione diventa esponenziale. Tanto più è abbondante il materiale di partenza, tanto prima esce il ciclo soglia. Il valore Ct dà informazioni sulla quantità di materiale stampo presente.

Anteprima
Vedrai una selezione di 10 pagine su 51
Biologia molecolare degli eucarioti Pag. 1 Biologia molecolare degli eucarioti Pag. 2
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 6
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 11
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 16
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 21
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 26
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 31
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 36
Anteprima di 10 pagg. su 51.
Scarica il documento per vederlo tutto.
Biologia molecolare degli eucarioti Pag. 41
1 su 51
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze biologiche BIO/11 Biologia molecolare

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Tireoglobulina di informazioni apprese con la frequenza delle lezioni di Biologia molecolare degli eucarioti e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Barabino Silvia.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community