Molecolari: analisi del DNA per la classificazione delle specie
Si utilizzano le macromolecole presenti nel DNA per identificare le specie, usandole come marcatori, avendo la possibilità di effettuare analisi a livello interspecifico o sopra il livello tassonomico della specie, oppure attraverso altri tipi di analisi più fini addirittura arrivando a livelli intraspecifico quindi sotto il livello di specie.
Approccio interspecifico e filogenesi molecolare
Un approccio interspecifico molto utilizzato è quello dell’analisi di sequenza e di conseguenza l’utilizzo di tali sequenze nucleotidiche serve per ricostruire una filogenesi molecolare; questo è necessario per riuscire a classificare il campione che si fa nell’ambito forense.
Tipologie di DNA utilizzate per la classificazione
Ci sono degli aspetti da valutare, come la tipologia della regione o delle regioni di DNA che possono essere utilizzate per la classificazione: in ambito vegetale le principali regioni che vengono prese in esame provengono dal DNA plastidiale e in particolare dal DNA del cloroplasto oppure da quello nucleare; c’è anche la possibilità di utilizzare il DNA mitocondriale.
Vantaggi dell'approccio molecolare
I vantaggi rispetto ad un approccio morfologico (che non deve per forza essere escluso ma magari integrato) sono diversi come quello che riguarda la descrizione dei caratteri che non è ambigua: la sequenza nucleotidica è oggettiva e non può cambiare. Inoltre, viene escluso anche il problema dell’evoluzione convergente dove si hanno fenotipi simili ma genotipi differenti e di conseguenza di nuovo si potrebbero avere delle relazioni ambigue di riconoscimento tra organismi che il DNA va a superare.
Analisi di regioni di DNA differenti
Analizzando fino a quattro regioni di DNA differenti di circa 1000 paia di basi ciascuna, si considera che ognuna di quelle basi nucleotidiche è un singolo carattere, quindi si stanno analizzando 4mila caratteri diversi, il che è impensabile se si utilizzasse un approccio di tipo morfologico. Questo è molto importante e discriminante da un punto di vista evolutivo e della classificazione delle varie specie poiché si studiano in massa i dati dei campioni.
Modelli statistici e filogenesi
È possibile utilizzare modelli statistici rigorosi che permettono una standardizzazione della tecnica di analisi quindi utilizzando determinate regioni è possibile risalire alla topologia dell’albero filogenetico ottenuto e proposto prima da altre persone e che rappresenta ad alti livelli quello che si osserva.
Analisi del DNA non codificante
Oltre alle regioni codificanti che sono maggiormente conservate, si possono analizzare regioni di DNA non codificanti e che potenzialmente accumulano una maggiore percentuale di variabilità e ciò permette di massimizzare l’efficienza dell’analisi fatta.
Problemi di paralogia
Nell’analisi molecolare può esserci il problema della paralogia perché è possibile trovarsi di fronte a quelli che sono dei geni paraloghi o delle regioni di DNA paraloghi, ossia che da un punto di vista evolutivo, quella regione di DNA che si sta analizzando, per qualche motivo ha subito una duplicazione genica. Quando si vanno ad analizzare due organismi che fanno parte della stessa popolazione o della specie e che presentano questa condizione (a insaputa dell’operatore) si mette in evidenza un’evoluzione dei geni che però non interessa in questo ambito di studio.
Problemi di evoluzione indipendente
Evoluzione indipendente tra DNA dei cloroplasti e DNA nucleare: si ha una non congruenza degli alberi filogenetici il che è un potenziale problema perché si ottengono due filogenesi differenti ossia non congruenti e ciò non permette l’analisi di regioni di DNA che provengono sia dal cloroplasto che dal nucleo e non le si può concatenare.
Massimizzare il potere di risoluzione
Per massimizzare il potere di risoluzione dell’analisi che si sta svolgendo, potenzialmente si possono prendere tanti frammenti di DNA del cloroplasto e del nucleo, si possono concatenare formando un’unica lunga sequenza che poi si può analizzare confrontandola con quella di altri organismi. In questo modo si aumenta il numero di caratteri analizzabili rendendo la filogenesi statisticamente sempre più sostenuta.
Analisi di sequenza
Si procede con le sequenze ottenute in laboratorio da DNA estratto da un frammento vegetale ben conservato di una specie X usando due marcatori molecolari differenti chiamati Internal transcribed spacer (con le tre regioni di un totale di 700 paia di basi ITS1-5.8s-ITS2 di cui il primo e il terzo sono due spaziatori intergenici mentre il secondo è una regione codificante per l’RNA ribosomiale) e spaziatore trnL-trnF (regione di DNA che si trova tra l’RNA transfer per la leucina e per la fenilalanina).
Processo laboratoriale e analisi di sequenze
Dopo aver ottenuto il campione in laboratorio ed essere stato catalogato, si deve estrarre il DNA dal frammento vegetale e si deve amplificare in quelle due regioni selezionando i primer specifici per quelle due regioni e tramite la reazione a catena della polimerasi si ottengono dei prodotti PCR da purificare e mandare al sequenziatore Sander che restituisce gli elettroferogrammi.
- Dal marcatore molecolare nrDNA - Internal transcribed spacer (ITS1-5.8s-ITS2) si ottengono due sequenze chiamate Fwr e Rev.
- Per marcatore molecolare: cpDNA - spaziatore trnL-trnF si ottengono due sequenze chiamate Fwr e Rev.
In laboratorio si procede col fare più sequenze dello stesso campione di riferimento ma già avere quelle due sequenze è un controllo preciso di ciò che si deve andare a studiare.
Utilizzo di BLAST per l'analisi delle sequenze
Si hanno allora quattro sequenze nucleotidiche, si prende la prima, la si copia e si copia su "BLAST" (sito internet che permette di importare sequenze nucleotidiche o proteiche e in maniera automatizzata fare un multi allineamento con tutte le sequenze nucleotidiche che vi si sono state depositate all’interno). Si incolla la sequenza all’interno della finestra apposita, dopodiché si specifica che tipo di database interrogare quindi se è standard o di altro tipo, e si può anche indicare il tipo di organismo anche se è meglio rimanere sul generale.
In questo modo il sistema restituisce tutta una lista di organismi più similari a quello che possiede la sequenza nucleotidica che è stata inserita dall’operatore; il valore che interessa maggiormente è il "query cover" ossia quanta percentuale della sequenza depositata è coperta da quella dell’organismo che la possiede simile, e l’altro valore è la "percentuale d’identità".
Importanza dei marcatori e dei valori di query cover e identità
Un aspetto molto importante è anche che specifica il tipo di marcatore che è stato utilizzato dal momento che se si va ad analizzare un campione vegetale e il database produce dei risultati con dei marcatori umani/animali, significa che l’operatore ha commesso degli errori o c’è un inquinamento delle prove; lo stesso discorso si pone nel caso dei primer.
I riferimenti "query cover" e della "percentuale d’identità" sono importantissimi perché così si ha certezza di una determinata percentuale che la sequenza caricata è identica a quella di un organismo trovato e conosciuto. Si può anche cliccare poi su un codice a destra che riporta la pagina relativa del campione con ulteriori informazioni e tutta la sequenza nucleotidica dell’organismo: questo funziona come riferimento per l’identificazione del campione ignoto che si ha in laboratorio per ricostruire una filogenesi.
Analisi delle sequenze Fwr e Rev
Analizzando le sequenze Fwr e Rev derivanti da entrambi i marcatori si nota come una non è conforme alle altre: si tratta di un fungo infestante la pianta a cui appartengono le altre tre sequenze. Per questo motivo è importante attuare questo tipo di analisi più volte e soprattutto analizzare il DNA del cloroplasto dal momento che i funghi non li possiedono mentre quello del nucleo lo possiedono tutti.
Preparazione del file FASTA e utilizzo nel multiallineamento
Dopo aver fatto questo passo, si possono recuperare le sequenze nucleotidiche che serviranno per l’analisi filogenetica così da inserire il campione ignoto. Per iniziare ciò si deve preparare un file in formato FASTA (formato che molti software leggono per fare multi allineamento prima e ricostruzione delle relazioni evolutive dopo) recuperando la maggior parte di sequenze nucleotidiche di riferimento di specie che sono potenzialmente affini.
Per trovare le specie che risultano affini basta controllare i risultati di BLAST in cui ci sono molte specie che possiedono percentuali molto alte di affinità. Per preparare un nuovo formato FASTA si deve fare un nuovo file di testo con:
- >specieX (in cui X sarebbe ignoto) e la sequenza nucleotidica nel rigo sotto
- Nelle righe sotto si aggiungono le sequenze nucleotidiche delle specie più vicine ottenute da BLAST: per prima cosa va messo il codice GenBank (si trova in alto ed è identificato con "Locus", è univoco del campione depositato):
- >codice GenBank specie e sequenza nucleotidica
Così via per tutte le altre specie affini. Dalle diverse specie affini si ottengono le loro accezioni e insieme alla specie X il tutto compone delle sequenze nucleotidiche grezze: il passo successivo (il secondo) è eseguire un allineamento di queste sequenze.
Allineamento delle sequenze e individuazione di variazioni
Tali sequenze vengono messe a confronto tra di loro e si individuano delle regioni comuni ed eventuali locus che sarebbero dei punti di variabilità ossia delle mutazioni puntiformi o delle ripetizioni; possono anche essere presenti delle delezioni o delle inserzioni. L’ultima sequenza che si ha nel caso del multiallineamento è data dal programma e si tratta di una sequenza di consenso che mette in evidenza la sequenza che trova il maggior consenso cioè quella zona che trova la maggiore "consistenza" e la minore "variabilità".
Controllo con l'elettroferogramma
La sequenza di consenso serve per fare un controllo con l’elettroferogramma e vedere se esistono effettivamente quelle mutazioni perché da un punto di vista pratico gli elettroferogrammi possono presentare degli errori legati a come il sistema ottico della macchina legge i picchi di fluorescenza dei frammenti al momento dell’arrivo.
Tutti i programmi di multiallineamento funzionano allo stesso modo più o meno: si prendono in considerazione vari aspetti delle sequenze per stabilire accurate relazioni evolutive.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.