Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MUSCLE
Sistema di allineamento che lavora come Clustal. Produce allineamenti a coppie, crea un albero, poi fa un allineamento progressivo ma le vecchie sequenze allineate man mano vengono riallineate per vedere se ce ne sono di più accurati. Generalmente MUSCLE fa allineamenti più lunghi di Clustal e fa più gaps e di maggiore estensione. Aprire un gap ha una discriminazione maggiore che non la sua estensione con Clustal.
Jalview
Jalview è un programma free, si tratta di una piattaforma che fa allineamenti, utilizza Java. Fa gli stessi allineamenti di Clustal e Muscle.
Man mano che passa il tempo dalle sequenze ancestrali si accumulano mutazioni, la sfida è portare ogni sito nella sua posizione corretta rispetto alle altre sequenze. Raw DNA - alignment. Non c'è una soglia fissa di distinzione tra una specie e un'altra, dipende dalla variabilità genetica. Introdurre o meno un gap può portare ad alberi filogenetici radicalmente diversi.
Diversi fra di loro.
Errori
Una volta allineate le sequenze tramite i programmi occorre sempre controllare ad occhio. Se delle sequenze hanno delle regioni particolari conosciute che vanno allineate in un certo modo, il software potrebbe sbagliare la loro collocazione poiché prova sempre l'allineamento migliore possibile, ma non il più corretto.
Per esempio non possono essere accettati gap di un singolo nucleotide perché il codice va letto a triplette e non a singoli nucleotidi.
Se ci sono troppi gap e si può modificare la relazione fra le sequenze sopra e sotto spostando anche leggermente conviene non tenerne conto perché i possibili allineamenti differiscono troppo tra di loro e la possibilità di errore cresce.
Un albero ottenuto con le sequenze nucleotidiche deve essere coerente con l'albero analogo costruito con le sequenze proteiche. In caso non corrispondano potrebbe essere sbagliata la traduzione delle proteine.
Regioni
Ci sono molte regioni
definire i gruppi fra di loro, si può ricavare anche una rappresentazionetestuale. Alcuni programmi usano la scrittura testuale con le parentesi per ricavare alberi.
Albero con radice/direzione: antenato comune alla base che si diversifica dando origine ad altre specie. Gli alberi senza radice non hanno un’origine fissata, ogni ramo potrebbe essere l’origine degli altri. Si può determinare sempre in formato di testo la lunghezza dei rami dell’albero, non solo le relazioni fra le specie.
Un albero con radice ha sempre una direzione, uno senza non ha direzione e neppure origine, nn si definiscono antenati e discendenti. Anche le sequenze vicine nell’albero non sono necessariamente le più vicine filogeneticamente.
Unrooted (senza radice)Con un albero senza radice ci sono diversi modelli possibili di alberi con radice che si possono ricavare. Uno per ogni ramo in genere. Costruire l’albero è più semplice se senza radice. Per discriminare tra quelli
conradice possibili uso:
- Midpoint root (media delle distanze fra le due specie più divergenti)
- Outgroup (gruppo meno simile): formo l'albero mettendolo per primo rispetto alla radice.
- Prendo Figtree (programma disegna alberi)
- Unresolved phylogeny: non si distingue chi si sia separato prima o dopo. Risultato: star tree
- Politomie: albero parzialmente risolto. Un albero completamente risolto ha solo rami BIFORCATI.
- Politomie: divergenza simultanea (radiazione adattativa esplosiva, ogni ramo accumula mutazioni ed è difficile dire quali siano avvenute prima e quali dopo) anche aumentando il numero di dati è difficile risolverle, quindi si parla di hard polytomy. Le soft polytomy però presentano specie con geni molto conservati e non si vede la divergenza perché le sequenze sono poco variabili. In questo caso aumentando il numero di dati si può risolvere facilmente.
- Cladogramma: albero che mostra solo le relazioni che ci sono fra le specie.
- Filogramma:
mostra le relazioni fra specie e anche le lunghezze dei rami, quante sostituzioni sono avvenute lungo una linea filogenetica.
Dendrogramma: sia le informazioni precedenti che una scala temporale. Tutte le foglie sono equidistanti dalla radice e i nodi mostrano i tempi evolutivi. Usano l'orologio molecolare. I filogrammi sono detti anche alberi additivi o metrici.
Se si allunga il cladogramma, non cambia nulla a livello di informazioni. Se però si allunga un filogramma o un dendrogramma in modo non proporzionale, il risultato sarà diverso. Non cambiano solo le relazioni ma anche i tassi evolutivi.
Se non ci sono indicate le distanze con una scala di misura è sempre un cladogramma.
Data 21/03-22/03
Realizzazione alberi toDa un numero di taxa, il numero di alberi realizzabili senza radice è decisamente inferiore al numero di possibili alberi con radice (i parametri da sostituire nella formula sono rispettivamente m-1 e m).
Questo numero enorme di alberi è un
Grosso problema per la filogenetica, considerando che il fine ultimo è trovare la migliore filogenesi tra tutti gli alberi possibili. Per un numero elevato di taxa analizzare tutte le possibilità è dunque quasi impossibile.
Le topologie di albero sono invece inferiori, le combinazioni variano ma la struttura ha sempre un numero limitato di varianti (forme o topologie dell'albero).
I metodi di ricostruzione degli alberi sono 2:
- Metodo di distanza (UPGMA, Neighbor joining, Minimum Evolution)
- Metodo dei caratteri discreti (Maximum Likelihood, ML, Bayesian Inference) confronto ogni sito per vedere i cambiamenti avvenuti.
I metodi di distanza (o clustering) vengono chiamati anche step by step approach (partendo dalla matrice di distanza formo un cluster e poi procedo man mano) quindi l'albero viene costruito a pezzetti man mano si aggiungono i vari taxa. L'albero risultante è senza radice.
Nei caratteri discreti costruisco tutti gli alberi ottenibili da
quel numero di taxa e in ogni albero sidevono mappare le mutazioni avvenute. Con un criterio di discriminazione si va poi a determinarel'albero migliore.
Optimally criterion: necessario dato che più taxa abbiamo più alberi possibili si vengono a creare.
Alberi e distanze
Per costruire le matrici di similarità basta contare le differenze negli allineamenti delle sequenze acoppie. Una volta ottenute le matrici di similarità si può passare agli alberi filogenetici. Le misure didistanza negli alberi devono essere metriche ed additive. Una distanza è metrica se soddisfa 4 proprietà.
In pratica se abbiamo due punti a e b (due geni generici):
- Proprietà di distinzione: distanza a da a = 0, distanza a da b diversa da 0, distanza b da b = 0, se a = b la distanza fra a e b è 0 (es. sequenze uguali fra di loro)
- Simmetria: le distanze devono essere simmetriche (distanza di a da b è uguale a quella da b ad a)
- Non negatività
della distanza: la distanza non deve essere negativa4.Inegualit&agra