Estratto del documento

Università degli Studi di Salerno

Tesi di laurea in informatica

Studio e analisi di strutture dati efficienti per la compressione di sequenze di DNA

Relatore: Prof. Rosalba Zizza Laureando: Serena Iannuzzi Anno Accademico: 2018/2019

Comprimere DNA

Una sequenza di DNA:

  • È una successione di lettere che rappresentano la struttura primaria di una molecola di DNA.

Perché comprimerlo?

  • Per distinguere tra le due regioni di una sequenza di DNA: codificante e non codificante.
  • Utile per valutare la distanza tra le sequenze di DNA.
  • Ecc...

Serena Iannuzzi

Obiettivo

Stiamo estendendo il nuovo approccio per costruire Suffix Arrays incrementali usando la Fattorizzazione di Lyndon alla costruzione dei Suffix Array estesi (SUNITA e DEEPAK GARG, 2018, “Extended suffix array construction using Lyndon factors”).

Serena Iannuzzi

Suffix Array esteso

Esistono due modi per realizzarlo:

  • Il primo consiste nel costruire il Suffix Array e, una volta completata la costruzione del Suffix Array, utilizzarlo per costruire l’array LCP.
  • Il secondo consiste nel costruire in modo incrementale il Suffix Array e insieme al Suffix Array calcolare anche l’array LCP di volta in volta.

Serena Iannuzzi

Suffix Array

  • Potente strumento per comprimere dati.
  • Struttura dati ottenuta ordinando i suffissi di una stringa in ordine lessicografico.

Serena Iannuzzi

Suffix Array - esempio

Testo S = informatica da indicizzare: suffissi ordinati in ordine crescente:

Suffissi I S[i] I Suffix I Suffix
0 i 0 informatica$ 11 $
1 n 1 nformatica$ 10 a$
2 f 2 formatica$ 6 atica$
3 o 3 ormatica$ 9 ca$
4 r 4 rmatica$ 2 formatica$
5 m 5 matica$ 8 ica$
6 a 6 atica$ 0 informatica$

Il Suffix Array è {10, 6, 9, 2, 8, 0, 5, 1, 3, 4, 7}

Anteprima
Vedrai una selezione di 4 pagine su 12
Presentazione Laurea Esame di Stato Pag. 1 Presentazione Laurea Esame di Stato Pag. 2
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Presentazione Laurea Esame di Stato Pag. 6
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Presentazione Laurea Esame di Stato Pag. 11
1 su 12
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze biologiche BIO/18 Genetica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher serena995 di informazioni apprese con la frequenza delle lezioni di Esame di Stato e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Salerno o del prof Zizza Rosalba.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community