Tesina - linguistica informatica
Traduzione assistita
Progetto di traduzione OmegaT
OmegaT è un software di traduzione assistita (Computer Assisted Translation) che utilizza come linguaggio di programmazione Java. Si tratta di un software libero, open source, ciò significa che il suo codice di programmazione è messo a disposizione degli utenti per essere modificato e migliorato liberamente.
OmegaT è uno strumento rivolto a traduttori professionisti e non professionisti ed è disponibile in 27 lingue. Le sue caratteristiche includono la creazione, importazione ed esportazione di memorie di traduzione, le concordanze parziali (fuzzy), la propagazione delle concordanze, l’elaborazione simultanea di progetti con più file, l’uso simultaneo di più memorie di traduzione, i glossari utente con riconoscimento delle forme flesse.
Vi è una versione standard, con manuale d’uso completo, e altre versioni di sviluppo, rivolte principalmente a utenti esperti o sviluppatori professionisti. Esiste inoltre un gruppo multilingue di utenti che serve come fonte di supporto, nonché come punto d’incontro fra gli utenti e gli sviluppatori.
Nel mio progetto di lavoro con OmegaT ho voluto tradurre due diversi generi di testo per metterli a confronto, osservare i risultati della traduzione e constatare la validità del software. Nel primo progetto ho tradotto dallo spagnolo all’italiano un brano letterario tratto dal libro Inés del alma mía (2006) dell’autrice cilena Isabel Allende che racconta il ruolo cruciale svolto dalla spagnola Inés Suárez nella conquista del Cile nel XVI secolo. L’ho ritenuto interessante, ai fini di una traduzione italiana, dal punto di vista lessicale e culturale.
Nel secondo progetto ho tradotto dall’italiano allo spagnolo un articolo dal sito del giornale di scienza Galileonet.it del 26 ottobre 2016 riguardante il riscaldamento globale e i suoi effetti sul Mediterraneo.
Dopo aver scaricato e installato OmegaT nella versione attuale dal sito internet www.omegat.org, nella finestra principale, molto intuitiva, vengono visualizzati tre riquadri: il riquadro di modifica (Editor), il riquadro delle concordanze parziali (fuzzy) e quello del Glossario. Nel riquadro di modifica viene visualizzata la "Guida di avvio rapido" che aiuta l’utente passo a passo. Il manuale completo è presente nella voce di menù "Aiuto" o premendo il tasto F1.
L’interfaccia, quindi, è essenziale, e questo rappresenta un enorme vantaggio dal momento che il lavoro del traduttore si concentra su un’unica finestra, quella con il testo da tradurre, senza perdersi fra decine di riquadri e widget colorati.
Per creare il progetto ho selezionato nel menu Progetto, “Nuovo...” passando a una cartella che conteneva tutti i file relativi, come i file di partenza, le memorie di traduzione, i glossari e gli eventuali file tradotti. Il nome che ho dato al primo progetto è “Traduzione italiana Allende”.
Dopodiché ho selezionato, nella finestra di dialogo successiva, le lingue di partenza e di destinazione desiderate facendo clic sulle frecce a destra di questi campi. Dal menu Progetto ho selezionato la voce “file del progetto”, e copiato nella cartella di partenza il file con il testo da tradurre: “Testo spagnolo Allende”. OmegaT copia i file scelti nella sottocartella /source/ del progetto appena creato.
I progetti di OmegaT sono entità virtuali. Si presentano come una serie di directory e di file accessibili con qualsiasi gestore di file tramite interfaccia grafica o da riga di comando più un documento XML, chiamato omegat.project, che contiene i metadati di progetto.
Gli strumenti della memoria di traduzione operano su unità di testo definite "segmenti". Questi segmenti, o stringhe, possono essere interi blocchi di testo, paragrafi, frasi o sintagmi. La frase all’interno di un testo sorgente, infatti, può essere considerata un segmento, ma il testo sorgente può essere diviso in parti più grandi, come un paragrafo, o anche più piccole a seconda dell’utilizzo che se ne farà. Le coppie che si creano sono chiamate "unità di traduzione". Le singole parole, invece, non vengono gestite direttamente dalle TM, ma da database terminologici.
Il programma quindi divide il testo in segmenti, ricerca eventuali corrispondenze tra tali segmenti e i segmenti origine, precedentemente tradotti e inseriti in memoria di traduzione, disponibili, poi propone le corrispondenze trovate come possibili soluzioni di traduzione. Il traduttore può accettare le corrispondenze proposte ovvero sostituirle o modificarle, per adattarle meglio al significato del testo e utilizzare la versione modificata. Negli ultimi due casi il segmento di testo e il corrispondente segmento tradotto metatesto, abbinati, sono inseriti nella memoria di traduzione.
Una memoria di traduzione, pertanto, si configura come un semplice database di campi contenenti: il segmento nella lingua sorgente, la traduzione del segmento, e altre informazioni (paragonabili a metadati) sul segmento stesso (data di creazione, ultima modifica, nome del traduttore, ecc…).
Alcuni programmi cercano solo le concordanze al 100% (concordanze esatte), vale a dire recuperano solo segmenti di testo che corrispondono esattamente alle unità di traduzione presenti nelle memorie di traduzione. Altri invece utilizzano algoritmi di corrispondenza approssimati, fuzzy, cercano stringhe che corrispondono parzialmente al segmento origine e le propongono al traduttore evidenziando le differenze. L’utente può impostare nel programma la percentuale di concordanza minima da considerare.
Se non si può risalire ad una precedente traduzione, il programma consente al traduttore di inserire la traduzione per il nuovo segmento. Dopo aver completato la traduzione del segmento, il programma si sposta al segmento successivo e archivia la nuova traduzione nel database, dove può essere utilizzato per traduzioni future e nelle ripetizioni dello stesso brano in corso di traduzione.
In OmegaT, i segmenti possono basarsi su paragrafi o su regole di segmentazione. La segmentazione è personalizzabile con l’uso di espressioni regolari, può essere configurata in base alla lingua o al formato del file. Si possono stabilire numerose regole e organizzarle in una gerarchia in modo che le successive ereditino i valori dalle precedenti.
Personalmente ho preferito utilizzare la segmentazione basata su regole che corrisponde, in genere, alla segmentazione a livello di frase. La segmentazione a livello di paragrafo è meno usata, ma può risultare utile nei casi dei cosiddetti "testi creativi".
Nella finestra Modifica si può passare direttamente al segmento successivo non tradotto. Si può, inoltre, annullare e ripetere le ultime operazioni, copiare e incollare, oppure ancora cambiare il testo da maiuscolo a minuscolo e viceversa, come in un editor di testo avanzato.
Nella finestra Opzioni si può selezionare il tipo di carattere, la mia scelta è stata Times New Roman 12, si può personalizzare il colore dei paragrafi, per esempio quelli non ancora tradotti, così da distinguerli da quelli già tradotti.
Le informazioni di formattazione che si trovano nel file di partenza sono trasferite anche a quello di arrivo. Qualora il file di partenza fosse formattato come Microsoft Word, LibreOffice Writer o HTML, OmegaT converte la formattazione in tag, ossia dei marcatori, in modo tale che anche al testo tradotto sia applicata la stessa formattazione.
I tag sono sequenze di lettere e numeri racchiusi tra parentesi angolate e sono di colore grigio. Sono protetti quindi non si può modificare il loro contenuto, ma si possono eliminare o mantenere, a seconda delle necessità.