La definizione di multi-allineamento è allineamento di un insieme
di sequenze aa o nucl superiore a 3 o parti di esse.
Generalizzazione dell allineamento a coppie. Computazionalmente
oneroso se affrontato in modo esatto, quindi si usano soluzioni euristiche.
Utilizza la stessa strategia dell allineamento a coppie, ma, nel caso
dell allin ottimo, la matrice di procedura avrà n dimensioni pari al
numero di sequenze in gioco. Se sono 3 sarà un cubo, dove per un allin
globale si procede dal vertice source al vertice sink.
Avendo tantissime seq da allineare non si usa l allin ottimo perché
esploderebbe. Il metodo euristico +conosciuto è l allineamento
progressivo: si inizia facendo allineamenti a coppie globali con
algoritmo ottimo per ogni coppia per definire distanez e similarità, si
determina un albero filogenetico guida applicando il metodo fenetico
di clustering UPGMA, e si allineano progressivamente le sequenze
dalle +vicine alle + lontane costruendo il multi-allineamento. L
implementazione + popolare è ClustalW.
Ad ogni allineamento a coppie globale corrisponde un punteggio.
Per n seq servono (n su 2)=n!/[(n-2)!*2!]=n(n-1)/2 allineam a coppie.
Dalla similarità devo passara alla distanza e costruire l albero,
usando UPGMA. Poi parto dalle 2 seq +vicine e faccio l allin a
coppie, per poi agginugere una ad una le altre seq +vicine fino alla
fine.
Multiallineamento. Zone + conservate, zone - conservate, gap. * per
posiz perfettamente conservate, : per similarità alta, . per simil
+bassa.
Nel fare gli allineam a coppie, posso dover farlo tra una coppia e un altro
elemento o tra due coppie.