Metodi più recenti per l'allineamento multiplo di sequenze
ClustalW è divenuto negli anni un metodo di riferimento per i biologi. Il programma però non è stato sostanzialmente più aggiornato dalla sua messa a punto nel 1994 e quindi permangono i suoi limiti, specialmente nel caso in cui si debbano allineare molte sequenze distanti. Nonostante ciò, il programma mantiene ancora una sua grandissima utilità.
La ricerca in questo ambito è andata avanti fino a proporre nuovi algoritmi capaci di calcolare allineamenti multipli più precisi, almeno in teoria, anche nelle condizioni in cui ClustalW mostra i suoi limiti. Alcuni di questi programmi però si possono considerare un'estensione di ClustalW, perché usano sostanzialmente la sua logica abbinata a un diverso sistema per quantificare la somiglianza tra sequenze, basato sulla coerenza (consistency).
Ciò significa che: se abbiamo tre sequenze A, B, C e allineiamo A con B e B con C e mettiamo insieme i due allineamenti in modo da ottenere uno a tre sequenze, implicitamente abbiamo definito anche l'allineamento tra A e C. Quest'allineamento multiplo implicito, però, può essere diverso (incoerente) rispetto a quello che otterremmo allineando A e C. Allora si può cercare un allineamento multiplo che massimizzi la coerenza tra gli allineamenti a coppie contenuti nell'allineamento multiplo e quelli ottenuti direttamente allineando le singole sequenze.
T-Coffee
T-Coffee è uno dei primi programmi a utilizzare la logica della coerenza. Una grossa limitazione di ClustalW è data dalla natura greedy (avido, ingordo in italiano) dell'algoritmo, nel senso che esso dipende essenzialmente dall'allineamento iniziale della prima coppia di sequenze. Una volta che i gap vengono inseriti nelle primissime fasi dell'allineamento, questi vengono fissati ed eventuali errori commessi in queste fasi non possono essere corretti. Questo problema determina la possibilità di propagazione degli errori all'intero allineamento. Al contrario, T-Coffee permette di fare modifiche, anche se da un certo punto in poi anche in questo programma non potranno essere apportate modifiche per correggere eventuali errori nell'allineamento.
Fasi operative di T-Coffee
Vediamo le diverse fasi in cui opera questo programma:
Fase 1
- Vengono fatti tutti i possibili allineamenti globali a coppie tra tutte le sequenze input, cioè ogni sequenza input viene allineata in modo globale con ciascuna sequenza input (esattamente come fa ClustalW nella fase 1).
- Vengono fatti anche tutti i possibili allineamenti locali a coppie tra tutte le sequenze input, cioè ogni sequenza input viene...
-
Fisica 1 - Esercizio 6
-
Macchine T - 6 CFU - Appunti Completi
-
Appunti di Fisica tecnica (Parte 6)
-
Econometria 6