Anteprima
Vedrai una selezione di 3 pagine su 9
Riassunto esame Tecnologie Informatiche applicate alla Traduzione, docente Meledandri Pag. 1 Riassunto esame Tecnologie Informatiche applicate alla Traduzione, docente Meledandri Pag. 2
Anteprima di 3 pagg. su 9.
Scarica il documento per vederlo tutto.
Riassunto esame Tecnologie Informatiche applicate alla Traduzione, docente Meledandri Pag. 6
1 su 9
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

STRUMENTI DI TRADUZIONE ASSISTITA

È solo grazie alla diffusione commerciale dei computer e all’evoluzione dei sistemi in termini di usabilità (approccio grafico;

interfaccia utente point & click) che si può parlare di mercato dei software di TA e di CAT Tool. Le metodologie di «sfruttamento»

della potenza di calcolo per fini linguistici risalgono al secondo dopoguerra, poiché bisognava «trasformare» la problematica

linguistica e traduttiva in un vantaggio politico-militare. Negli anni 50 ci sono i blocchi contrapposti formati da USA vs URSS,

quindi serve carpire le informazioni del blocco contrapposto: tradurre tutto e subito. Sulla scia di alcuni esperimenti

anacronistici del tempo (i «cervelli meccanici» di Artsouni e Trojanskij negli anni ‘30, o sistemi di codifica e decodifica

matematico-linguistica come Enigma), il secondo dopoguerra si spinge verso questo nuovo filone di ricerca, volto allo

sfruttamento del dato computazionale (delle macchine) in ottica linguistica. Il concetto di base è quello secondo cui la

macchina può replicare il funzionamento del processo linguistico del cervello umano non solo nell’elaborazione del pensiero ma

anche in quello di trasformazione interlinguistica di produzioni scritte grazie al potenziale offerto dalle macchine in termini di

velocità di calcolo.

Il primo grande obiettivo è quello di far tradurre le macchine. I primi esperimenti coinvolgono la Traduzione Automatica (MT) e

non l’ausilio delle macchine per i traduttori. Le ragioni che supportano questa visione includono sia la velocità di produzione di

output sia i dati non in formato digitale in fase di input (trascrizione) e anche di output (nastro, scheda perforata). 1966: Il

Rapporto ALPAC (Automatic Language Processing Advisory Committee) pone un freno allo sviluppo della MT avente come

obiettivo (utopistico) la possibilità da parte della macchina di tradurre come un uomo.

Gli anni ‘80 rappresentano una svolta, poiché viene rimesso in discussione il rapporto tra uomo e macchina per fini linguistici (ma

non solo). Nel 1983: rilasciato TSS (Translation Support System), primo vero programma di MT su PC. I motivi alla base della

seconda era di sviluppo in questo campo sono le Innovazioni tecnologiche ed informatiche, la Diffusione dei Personal Computer,

l’Avvento di Internet, Nuove dinamiche nel commercio internazionale e dunque nuove esigenze di traduzione e localizzazione.

Bisognava velocizzare i tempi e ridurre i costi.

Nasce un nuovo approccio relativo al rapporto tra uomo e macchina. Si teorizzano due metodologie:

- Traduzione Automatica (Google translate, bing)

- Traduzione Assistita

Traduzione Automatica e traduzione Assistita sono due concetti spesso confusi fra loro. La maggiore differenza fra i due tipi di

sistemi consiste nel ruolo che la macchina ha nell’ambito della traduzione.

Nel primo caso si parla di Traduzione Automatica assistita dall’uomo (Human-Aided Machine Translation, HAMT). Nel

secondo caso si parla di Traduzione Umana assistita dal computer (Machine-Aided Human Translation, MAHT), ormai detta

Traduzione Assistita (Computer Assisted Translation , CAT ).

Per quanto riguarda la traduzione automatica assistita dall’uomo, il traduttore umano interviene in aiuto del sistema di

traduzione automatica prima (pre-editing), durante e dopo (post-editing) il processo di traduzione.

• Pre-editing: il testo da tradurre viene controllato e preparato per la macchina («linguaggio controllato»)

• Post- editing: il testo tradotto automaticamente viene rivisto dal traduttore umano dal punto di vista della forma e del

contenuto (coerenza, precisione, stile).

Le tre azioni principali del processo di post-editing sono: READY (leggere testo source e quello tradotto, scegliere gli elementi

validi); SET (controllare l’accuratezza); GO (correggere grammatica/terminologia).

In alcuni casi la traduzione automatica (HAMT) viene preferita alla traduzione assistita (MAHT) per via dei ridotti tempi di

consegna o del budget a disposizione o anche a seconda della tipologia del testo da tradurre. Un buon post-editor deve conoscere

bene la lingua/dominio, saper usare i CAT e il controllo linguistico automatico, essere positivo riguardo all’output prodotto dalla

macchina, esercitarsi. I vantaggi per lui sono: acquisizione di nuovi abilità, più testi tradotti in meno tempo, più velocità ed

efficienza.

Mentre la Traduzione Automatica tenta di sostituire i traduttori, i CAT tool forniscono ai traduttori degli strumenti perché possano

svolgere il proprio compito in maniera più efficiente, eliminando il lavoro ripetitivo, automatizzando le attività di ricerca

terminologica e riutilizzando testi tradotti in precedenza.

Di qui la nozione di CAT Technology, la tecnologia che include qualsiasi tipo di strumenti che i traduttori utilizzano come

supporto per il loro lavoro.

L’efficienza dei CAT tool varia a seconda della tipologia dei testi che si vogliono tradurre. I più soddisfacenti risultati si ottengono

quando si usano i CAT per tradurre testi specialistici, caratterizzate da una coerenza terminologica oppure quando i testi sono

costituiti da frasi semplici e brevi e dove aumentano, quindi, le probabilità di ripetizioni e diminuiscono i casi di ambiguità.

Software OCR (Optical Character Recognition): sono programmi per il riconoscimento ottico dei caratteri e che servono a

convertire un documento cartaceo in file digitale. Operano attraverso l’immagine scansionata nel computer e convertono le

immagini acquisite in testo in forma “leggibile dalla macchina”. Il metodo OCR permette al traduttore di guadagnare tempo

evitando di digitare un intero documento sulla tastiera, ma bisogna sempre controllare il risultato ottenuto, in quanto la qualità

dell’immagine e la somiglianza tra alcuni caratteri, potrebbe compromettere l’esattezza della conversione.

voice o speech recognition

I sistemi di consentono di convertire un testo cartaceo in documento digitale in quanto

riconoscono il linguaggio umano e permettono agli utenti di interagire con il computer per mezzo della voce invece che tramite

l’uso della tastiera o del mouse. funzionano in base alla frequenza delle associazioni fra parole e sono provvisti di vocabolario

fonetico con le pronunce di base di numerose parole nella lingua selezionata. La macchina non può interpretare un testo dal suo

contesto, si limita a trascrivere ciò che “ascolta” e quindi bisogna sempre ricontrollare il testo prodotto da questi CAT tool.

glossario

Un è una lista di termini e relative definizioni elencati in ordine alfabetico che appartengono a un particolare ambito o

dominio. A seconda che le definizioni vengano fornite in lingue diverse, è possibile creare anche glossari bilingue o multilingue. I

più semplici sono costituiti da schede contenenti un determinato termine, la sua traduzione in una o più lingue e alcune note. Ma

vi sono anche schede terminologiche molto complesse che contengono, per ciascun termine, la traduzione e la definizione in

ciascuna lingua d’arrivo, indicazioni di carattere semantico (sinonimi, contrari ecc.), esempi d’uso e particolari occorrenze

linguistiche.

corpus

Un è un esempio più complesso di banche dati terminologiche; è una raccolta di testi in formato elettronico selezionati

secondo determinati criteri per rappresentare il linguaggio di un settore, o una varietà di linguaggio, ed ottenere una fonte di dati

utili per la ricerca terminologica. Un corpus può contenere testi in un’unica lingua, in questo caso si parla di corpora monolingue,

o testi in due o più lingue, rispettivamente chiamati corpora bilingue e corpora multilingue. Un’altra distinzione è quella fra

corpora paralleli, che sono raccolte di testi scritti in una lingua e le loro rispettive traduzioni in altre lingue, e corpora

comparabili, vale a dire raccolte di testi in lingua originale e di traduzioni nella stessa lingua d’arrivo da una o più lingue di

partenza non esattamente identici in termini di testo ma di vicinanza semantica.

Mentre nella traduzione automatica è il computer a proporre la traduzione, nella traduzione umana assistita da computer

(MAHT) è il traduttore a prendere tutte le decisioni attraverso l’uso dei software di traduzione. I software di traduzione (Assistita

e non) sono programmi sviluppati appositamente per permettere al traduttore di svolgere il proprio lavoro con il supporto tecnico

del computer. L’utilizzo dei software di traduzione migliora sicuramente la produttività e l’efficienza del lavoro, tanto che le

agenzie di traduzione e localizzazione lavorano oggi esclusivamente utilizzando tali programmi, anche per garantire uno

standard metodologico di riferimento.

Fra gli strumenti messi a disposizione dai software di traduzione ci sono: i sistemi di traduzione automatica; I TMS

(Terminology-Management System): sistemi di gestione terminologica che si occupano dell’archiviazione, del recupero e

dell’aggiornamento delle banche dati terminologiche; Dizionari; Glossari elettronici.

memoria di traduzione.

Ma il ‘cuore’ degli strumenti di traduzione assistita è la

La memoria traduttiva (Translation Memory, TM) è costituita da uno o più archivi di frasi tradotte (chiamate SEGMENTI) che,

sul principio del ‘cerca e sostituisci’, vengono riproposte automaticamente alla successiva occorrenza della frase o di frasi simili

quando il traduttore lavora ad una nuova traduzione. Inizialmente le memorie traduttive sono vuote e possono essere riempite

dal traduttore man mano che traduce testi inserendo segmenti testuali nella lingua di partenza con le relative traduzioni nella

lingua di arrivo, oppure allineando un testo tradotto con il corrispondente testo originale, ovvero raffrontando i due documenti e

suddividendoli in base ad un insieme di regole di segmentazione prestabilite. Durante la traduzione, ogni volta che una frase del

testo da tradurre trova nel database della memoria traduttiva un corrispondente, questo viene proposto al traduttore che può

accettare la traduzione senza dover così ritradurre la frase.

Le corrispondenze assumono nomi diversi a seconda del grado di somiglianza fra i termini o le espressioni.

- Exact match (corrispondenza al 100%): quando due elementi sono identici sia linguisticamente (punteggiatura,

numero, genere, ecc.) sia dal punto di vista della formattazione (corsivo, grassetto, ecc.)

- Full match: corrispondenze che differiscono solo in alcuni elementi variabili tipo i numeri, le date, le misure e, in alcuni

casi, i nomi propri.

- Fuzzy match (o partial match): corrispondenze simili ma non identiche. Il grado di somiglianza nei fuzzy match può

andare dall’1% al 99%, in base alle necessità del’utente, che stabilisce una soglia di similarità tra segmenti in base alla quale

le unità traduttive presenti nella memoria vengono accett

Dettagli
Publisher
A.A. 2017-2018
9 pagine
SSD Scienze matematiche e informatiche INF/01 Informatica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher gabbafamily92 di informazioni apprese con la frequenza delle lezioni di Tecnologie informatiche applicate alla traduzione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bari o del prof Meledandri Francesco.