Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MOLECOLARI
Si utilizzano le macromolecole presenti nel DNA per identificare le specie
usandole come marcatori, avendo la possibilità di effettuare analisi a
livello interspecifico o sopra il livello tassonomico della specie, oppure
attraverso altri tipi di analisi più fini addirittura arrivando a livelli
intraspecifico quindi sotto il livello di specie.
Un approccio interspecifico molto utilizzato è quello dell’analisi di
sequenza e di conseguenza l’utilizzo di tali sequenze nucleotidiche serve
per ricostruire una filogenesi molecolare; questo è necessario per riuscire
a classificare il campione che si fa nell’ambito forense.
Ci sono degli aspetti da valutare, come la tipologia della regione o delle
regioni di DNA che possono essere utilizzate per la classificazione: in
ambito vegetale le principali regioni che vengono prese in esame
provengono dal DNA plastidiale e in particolare dal DNA del cloroplasto
oppure da quello nucleare; c’è anche la possibilità di utilizzare il DNA
mitocondriale.
I vantaggi rispetto ad un approccio morfologico (che non deve per forza
escluso ma magari integrato) sono diversi come quello che riguarda la
descrizione dei caratteri che non è ambigua: la sequenza nucleotidica è
oggettiva e non può cambiare.
Inoltre viene escluso anche il problema dell’evoluzione convergente dove
si hanno fenotipi simili ma genotipi differenti e di conseguenza di nuovo
si potrebbero avere delle relazioni ambigue di riconoscimento tra
organismi che il DNA va a superare.
Analizzando fino a quattro regioni di DNA differenti di circa 1000 paia di
basi ciascuna, si considera che ognuna di quelle basi nucleotidiche è un
singolo carattere, quindi si stanno analizzando 4mila caratteri diversi, il
che è impensabile se si utilizzasse un approccio di tipo morfologico.
Questo è molto importante e discriminante da un punto di vista evolutivo
e della classificazione delle varie specie poiché si studiano in massa i dati
dei campioni.
È possibile utilizzare modelli statistici rigorosi che permettono una
standardizzazione della tecnica di analisi quindi utilizzando determinate
23
regioni è possibile risalire alla topologia dell’albero filogenetico ottenuto
e proposto prima da altre persone e che rappresenta ad alti livelli quello
che si osserva. Analisi del DNA non codificante: oltre alle regioni
codificanti che sono maggiormente conservate, si possono analizzare
regioni di DNA non codificanti e che potenzialmente accumulano una
maggiore percentuale di variabilità e ciò permette di massimizzare
l’efficienza dell’analisi fatta.
Nell’analisi molecolare può
esserci il problema della
paralogia perché è possibile
trovarsi di fronte a quelli che
sono dei geni paraloghi o delle
regioni di DNA parologhi ossia
che da un punto di vista evolutivo, quella regione di DNA che si sta
analizzando, per qualche motivo ha subito una duplicazione genica.
Quando si vanno ad analizzare due organismi che fanno parte della
stessa popolazione o della specie e che presentano questa condizione (a
insaputa dell’operatore) si mette in evidenza un’evoluzione dei geni che
però non interessa in questo ambito di studio. Questi casi si hanno nelle
specie che presentano diversi citotipi quindi gruppi di individui che fanno
parte della stessa specie ma che si separano da un punto di vista del
numero cromosomico; di conseguenza questo fenomeno è frequente nei
marcatori che provengono dal DNA nucleare.
Evoluzione indipendente tra DNA dei cloroplasti e DNA nucleare: si ha
una non congruenza degli alberi filogenetici il che è un potenziale
problema perché si ottengono due filogenesi differenti ossia non
congruenti e ciò non permette l’analisi di regioni di DNA che provengono
sia dal cloroplasto che dal nucleo e non le si può concatenare.
Per massimizzare il potere di risoluzione dell’analisi che si sta svolgendo,
potenzialmente si possono prendere tanti frammenti di DNA del
cloroplasto e del nucleo, si possono concatenare formando un’unica
lunga sequenza che poi si può analizzare confrontandola con quella di
altri organismi. In questo modo si aumenta il numero di caratteri
analizzabili rendendo la filogenesi statisticamente sempre più sostenuta.
Usando questo metodo si deve stare attenti alla congruenza della
topologia tra gli alberi filogenetici ottenuti tra i due DNA se no non si
possono concatenare i due marcatori che hanno origini differenti.
24
Analisi di sequenza
Si procede con le sequenze ottenute in laboratorio da DNA estratto da un
frammento vegetale ben conservato di una specie X usando due
marcatori molecolari differenti chiamati Internal transcribed spacer (con
le tre regioni di un totale di 700 paia di basi ITS1-5.8s-ITS2 di cui il primo
e il terzo sono due spaziatori intergenici mentre il secondo è una regione
codificante per l’RNA ribosomiale) e spaziatore trnL-trnF (regione di DNA
che si trova tra l’RNA transfer per la leucina e per la fenilalanina.
Dopo aver ottenuto il campione in laboratorio ed essere stato catalogato,
si deve estrarre il DNA dal frammento vegetale e si deve amplificare in
quelle due regioni selezionando i primer specifici per quelle due regioni e
tramite la reazione a catena della polimerasi si ottengono dei prodotti
PCR da purificare e mandare al sequenziatore Sander che restituisce gli
elettroferogrammi.
Dagli elettroferogrammi si ottengono:
1. dal marcatore molecolare nrDNA - Internal transcribed spacer (ITS1-
5.8s-ITS2) si ottengono due sequenze chiamate Fwr e Rev;
2. per marcatore molecolare: cpDNA - spaziatore trnL-trnF si
ottengono due sequenze chiamate Fwr e Rev.
In laboratorio si procede col fare più sequenze dello stesso campione di
riferimento ma già avere quelle due sequenze è un controllo preciso di
ciò che si deve andare a studiare.
Si hanno allora quattro sequenze nucleotidiche, si prende la prima, la si
copia e si copia su “BLAST” (sito internet che permette di importare
sequenze nucleotidiche o proteiche e in maniera automatizzata fare un
multi allineamento con tutte le sequenze nucleotidiche che vi si sono
state depositate all’interno). Si incolla la sequenza all’interno della
finestra apposita, dopo di che si specifica che tipo di database
interrogare quindi se è standard o di altro tipo, e si può anche indicare il
tipo di organismo anche se è meglio rimanere sul generale.
In questo modo il sistema restituisce tutta una lista di organismi più
similari a quello che possiede la sequenza nucleotidica che è stata
inserita dall’operatore; il valore che interessa maggiormente è il “query
cover” ossia quanta percentuale della sequenza depositata è coperta da
quella dell’organismo che la possiede simile, e l’altro valore è la
“percentuale d’identità”.
Un aspetto molto importante è anche che specifica il tipo di marcatore
che è stato utilizzato dal momento che se si va ad analizzare un
campione vegetale e il database produce dei risultati con dei marcatori
25
umani/animali, significa che l’operatore ha commesso degli errori o c’è
un inquinamento delle prove; lo stesso discorso si pone nel caso dei
primer.
I riferimenti “query cover” e della “percentuale d’identità” sono
importantissimi perché così si ha certezza di una determinata
percentuale che la sequenza caricata è identica a quella di un organismo
trovato e conosciuto. Si può anche cliccare poi su un codice a destra che
riporta la pagina relativa del campione con ulteriori informazioni e tutta
la sequenza nucleotidica dell’organismo: questo funziona come
riferimento per l’identificazione del campione ignoto che si ha in
laboratorio per ricostruire una filogenesi.
Analizzando le sequenze Fwr e Rev derivanti da entrambi i marcatori si
nota come una non è conforme alle altre: si tratta di un fungo infestante
la pianta a cui appartengono le altre tre sequenze. Per questo motivo è
importante attuare questo tipo di analisi più volte e soprattutto
analizzare il DNA del cloroplasto dal momento che i funghi non li
possiedono mentre quello del nucleo lo possiedono tutti.
Dopo aver fatto questo passo, si possono recuperare le sequenze
nucleotidiche che serviranno per l’analisi filogenetica così da inserire il
campione ignoto. Per iniziare ciò si deve preparare un file in formato
FASTA (formato che molti software leggono per fare multi allineamento
prima e ricostruzione delle relazioni evolutive dopo) recuperando la
maggior parte di sequenze nucleotidiche di riferimento di specie che
sono potenzialmente affini.
Per trovare le specie che risultano affini basta controllare i risultati di
BLAST in cui ci sono molte specie che possiedono percentuali molto alte
di affinità. Per preparare un nuovo formato FASTA si deve fare un nuovo
file di testo con:
>specieX (in cui X sarebbe ignoto) e la sequenza nucleotidica nel rigo
sotto
Nelle righe sotto si aggiungono le sequenze nucleotidiche delle specie
più vicine ottenute da BLAST: per prima cosa va messo il codice GenBank
(si trova in alto ed è identificato con “Locus”, è univoco del campione
depositato):
>codice GenBank specie e sequenza nucleotidica
Così via per tutte le altre specie affini.
Dalle diverse specie affini si ottengono le loro accezioni e insieme alla
specie X il tutto compone delle sequenze nucleotidiche grezze: il passo
successivo (il secondo) è eseguire un allineamento di queste sequenze.
26
Tali sequenze vengono messe a confronto tra di loro e si individuano
delle regioni comuni ed eventuali locus che sarebbero dei punti di
variabilità ossia delle mutazioni puntiformi o delle ripetizioni; possono
anche essere presenti delle delezioni o delle inserzioni.
L’ultima sequenza che si ha nel caso del multiallineamento è data dal
programma e si tratta di una sequenza di consenso che mette in
evidenza la sequenza che trova il maggior consenso cioè quella zona che
trova la maggiore “consistenza” e la minore “variabilità”.
La sequenza di consenso serve per fare un controllo con
l’elettroferogramma e vedere se esistono effettivamente quelle
mutazioni perché da un punto di vista pratico gli elettroferogrammi
possono presentare degli errori legati a come il sistema ottico della
macchina legge i picchi di fluorescenza dei frammenti al momento
dell’arrivo.
Tutti i programmi di
multiallineamento
funzionano allo stesso
modo più o meno: si
prend