vuoi
o PayPal
tutte le volte che vuoi
STRUMENTI DI TRADUZIONE ASSISTITA
È solo grazie alla diffusione commerciale dei computer e all’evoluzione dei sistemi in termini di usabilità (approccio grafico;
interfaccia utente point & click) che si può parlare di mercato dei software di TA e di CAT Tool. Le metodologie di «sfruttamento»
della potenza di calcolo per fini linguistici risalgono al secondo dopoguerra, poiché bisognava «trasformare» la problematica
linguistica e traduttiva in un vantaggio politico-militare. Negli anni 50 ci sono i blocchi contrapposti formati da USA vs URSS,
quindi serve carpire le informazioni del blocco contrapposto: tradurre tutto e subito. Sulla scia di alcuni esperimenti
anacronistici del tempo (i «cervelli meccanici» di Artsouni e Trojanskij negli anni ‘30, o sistemi di codifica e decodifica
matematico-linguistica come Enigma), il secondo dopoguerra si spinge verso questo nuovo filone di ricerca, volto allo
sfruttamento del dato computazionale (delle macchine) in ottica linguistica. Il concetto di base è quello secondo cui la
macchina può replicare il funzionamento del processo linguistico del cervello umano non solo nell’elaborazione del pensiero ma
anche in quello di trasformazione interlinguistica di produzioni scritte grazie al potenziale offerto dalle macchine in termini di
velocità di calcolo.
Il primo grande obiettivo è quello di far tradurre le macchine. I primi esperimenti coinvolgono la Traduzione Automatica (MT) e
non l’ausilio delle macchine per i traduttori. Le ragioni che supportano questa visione includono sia la velocità di produzione di
output sia i dati non in formato digitale in fase di input (trascrizione) e anche di output (nastro, scheda perforata). 1966: Il
Rapporto ALPAC (Automatic Language Processing Advisory Committee) pone un freno allo sviluppo della MT avente come
obiettivo (utopistico) la possibilità da parte della macchina di tradurre come un uomo.
Gli anni ‘80 rappresentano una svolta, poiché viene rimesso in discussione il rapporto tra uomo e macchina per fini linguistici (ma
non solo). Nel 1983: rilasciato TSS (Translation Support System), primo vero programma di MT su PC. I motivi alla base della
seconda era di sviluppo in questo campo sono le Innovazioni tecnologiche ed informatiche, la Diffusione dei Personal Computer,
l’Avvento di Internet, Nuove dinamiche nel commercio internazionale e dunque nuove esigenze di traduzione e localizzazione.
Bisognava velocizzare i tempi e ridurre i costi.
Nasce un nuovo approccio relativo al rapporto tra uomo e macchina. Si teorizzano due metodologie:
- Traduzione Automatica (Google translate, bing)
- Traduzione Assistita
Traduzione Automatica e traduzione Assistita sono due concetti spesso confusi fra loro. La maggiore differenza fra i due tipi di
sistemi consiste nel ruolo che la macchina ha nell’ambito della traduzione.
Nel primo caso si parla di Traduzione Automatica assistita dall’uomo (Human-Aided Machine Translation, HAMT). Nel
secondo caso si parla di Traduzione Umana assistita dal computer (Machine-Aided Human Translation, MAHT), ormai detta
Traduzione Assistita (Computer Assisted Translation , CAT ).
Per quanto riguarda la traduzione automatica assistita dall’uomo, il traduttore umano interviene in aiuto del sistema di
traduzione automatica prima (pre-editing), durante e dopo (post-editing) il processo di traduzione.
• Pre-editing: il testo da tradurre viene controllato e preparato per la macchina («linguaggio controllato»)
• Post- editing: il testo tradotto automaticamente viene rivisto dal traduttore umano dal punto di vista della forma e del
contenuto (coerenza, precisione, stile).
Le tre azioni principali del processo di post-editing sono: READY (leggere testo source e quello tradotto, scegliere gli elementi
validi); SET (controllare l’accuratezza); GO (correggere grammatica/terminologia).
In alcuni casi la traduzione automatica (HAMT) viene preferita alla traduzione assistita (MAHT) per via dei ridotti tempi di
consegna o del budget a disposizione o anche a seconda della tipologia del testo da tradurre. Un buon post-editor deve conoscere
bene la lingua/dominio, saper usare i CAT e il controllo linguistico automatico, essere positivo riguardo all’output prodotto dalla
macchina, esercitarsi. I vantaggi per lui sono: acquisizione di nuovi abilità, più testi tradotti in meno tempo, più velocità ed
efficienza.
Mentre la Traduzione Automatica tenta di sostituire i traduttori, i CAT tool forniscono ai traduttori degli strumenti perché possano
svolgere il proprio compito in maniera più efficiente, eliminando il lavoro ripetitivo, automatizzando le attività di ricerca
terminologica e riutilizzando testi tradotti in precedenza.
Di qui la nozione di CAT Technology, la tecnologia che include qualsiasi tipo di strumenti che i traduttori utilizzano come
supporto per il loro lavoro.
L’efficienza dei CAT tool varia a seconda della tipologia dei testi che si vogliono tradurre. I più soddisfacenti risultati si ottengono
quando si usano i CAT per tradurre testi specialistici, caratterizzate da una coerenza terminologica oppure quando i testi sono
costituiti da frasi semplici e brevi e dove aumentano, quindi, le probabilità di ripetizioni e diminuiscono i casi di ambiguità.
Software OCR (Optical Character Recognition): sono programmi per il riconoscimento ottico dei caratteri e che servono a
convertire un documento cartaceo in file digitale. Operano attraverso l’immagine scansionata nel computer e convertono le
immagini acquisite in testo in forma “leggibile dalla macchina”. Il metodo OCR permette al traduttore di guadagnare tempo
evitando di digitare un intero documento sulla tastiera, ma bisogna sempre controllare il risultato ottenuto, in quanto la qualità
dell’immagine e la somiglianza tra alcuni caratteri, potrebbe compromettere l’esattezza della conversione.
voice o speech recognition
I sistemi di consentono di convertire un testo cartaceo in documento digitale in quanto
riconoscono il linguaggio umano e permettono agli utenti di interagire con il computer per mezzo della voce invece che tramite
l’uso della tastiera o del mouse. funzionano in base alla frequenza delle associazioni fra parole e sono provvisti di vocabolario
fonetico con le pronunce di base di numerose parole nella lingua selezionata. La macchina non può interpretare un testo dal suo
contesto, si limita a trascrivere ciò che “ascolta” e quindi bisogna sempre ricontrollare il testo prodotto da questi CAT tool.
glossario
Un è una lista di termini e relative definizioni elencati in ordine alfabetico che appartengono a un particolare ambito o
dominio. A seconda che le definizioni vengano fornite in lingue diverse, è possibile creare anche glossari bilingue o multilingue. I
più semplici sono costituiti da schede contenenti un determinato termine, la sua traduzione in una o più lingue e alcune note. Ma
vi sono anche schede terminologiche molto complesse che contengono, per ciascun termine, la traduzione e la definizione in
ciascuna lingua d’arrivo, indicazioni di carattere semantico (sinonimi, contrari ecc.), esempi d’uso e particolari occorrenze
linguistiche.
corpus
Un è un esempio più complesso di banche dati terminologiche; è una raccolta di testi in formato elettronico selezionati
secondo determinati criteri per rappresentare il linguaggio di un settore, o una varietà di linguaggio, ed ottenere una fonte di dati
utili per la ricerca terminologica. Un corpus può contenere testi in un’unica lingua, in questo caso si parla di corpora monolingue,
o testi in due o più lingue, rispettivamente chiamati corpora bilingue e corpora multilingue. Un’altra distinzione è quella fra
corpora paralleli, che sono raccolte di testi scritti in una lingua e le loro rispettive traduzioni in altre lingue, e corpora
comparabili, vale a dire raccolte di testi in lingua originale e di traduzioni nella stessa lingua d’arrivo da una o più lingue di
partenza non esattamente identici in termini di testo ma di vicinanza semantica.
Mentre nella traduzione automatica è il computer a proporre la traduzione, nella traduzione umana assistita da computer
(MAHT) è il traduttore a prendere tutte le decisioni attraverso l’uso dei software di traduzione. I software di traduzione (Assistita
e non) sono programmi sviluppati appositamente per permettere al traduttore di svolgere il proprio lavoro con il supporto tecnico
del computer. L’utilizzo dei software di traduzione migliora sicuramente la produttività e l’efficienza del lavoro, tanto che le
agenzie di traduzione e localizzazione lavorano oggi esclusivamente utilizzando tali programmi, anche per garantire uno
standard metodologico di riferimento.
Fra gli strumenti messi a disposizione dai software di traduzione ci sono: i sistemi di traduzione automatica; I TMS
(Terminology-Management System): sistemi di gestione terminologica che si occupano dell’archiviazione, del recupero e
dell’aggiornamento delle banche dati terminologiche; Dizionari; Glossari elettronici.
memoria di traduzione.
Ma il ‘cuore’ degli strumenti di traduzione assistita è la
La memoria traduttiva (Translation Memory, TM) è costituita da uno o più archivi di frasi tradotte (chiamate SEGMENTI) che,
sul principio del ‘cerca e sostituisci’, vengono riproposte automaticamente alla successiva occorrenza della frase o di frasi simili
quando il traduttore lavora ad una nuova traduzione. Inizialmente le memorie traduttive sono vuote e possono essere riempite
dal traduttore man mano che traduce testi inserendo segmenti testuali nella lingua di partenza con le relative traduzioni nella
lingua di arrivo, oppure allineando un testo tradotto con il corrispondente testo originale, ovvero raffrontando i due documenti e
suddividendoli in base ad un insieme di regole di segmentazione prestabilite. Durante la traduzione, ogni volta che una frase del
testo da tradurre trova nel database della memoria traduttiva un corrispondente, questo viene proposto al traduttore che può
accettare la traduzione senza dover così ritradurre la frase.
Le corrispondenze assumono nomi diversi a seconda del grado di somiglianza fra i termini o le espressioni.
- Exact match (corrispondenza al 100%): quando due elementi sono identici sia linguisticamente (punteggiatura,
numero, genere, ecc.) sia dal punto di vista della formattazione (corsivo, grassetto, ecc.)
- Full match: corrispondenze che differiscono solo in alcuni elementi variabili tipo i numeri, le date, le misure e, in alcuni
casi, i nomi propri.
- Fuzzy match (o partial match): corrispondenze simili ma non identiche. Il grado di somiglianza nei fuzzy match può
andare dall’1% al 99%, in base alle necessità del’utente, che stabilisce una soglia di similarità tra segmenti in base alla quale
le unità traduttive presenti nella memoria vengono accett