Coniugare Technical Writing e LRT (Language Resources and Technologies)
In che modo risorse e tecnologie linguistiche possono supportare i redattori tecnici delle piccole e medie imprese italiane?
In anteprima pubblichiamo il documento curato da Giovanni Antico (S.Te.L S.r.L), Valeria Quochi e Monica Monachini (Istituto di Linguistica Computazionale - CNR), Maurizio Martinelli (Istituto di Informatica e Telematica - CNR), che sarà presentato il 27 maggio 2014 a Reykjavik, in occasione della 9a edizione della Language Resources and Evaluation Conference
Negli ultimi anni gli scenari operativi del technical writer e i suoi flussi di lavoro sono sensibilmente mutati. In particolare, la scrittura "free style" - ovvero quella manuale - è diventata obsoleta: molto più che in passato, il technical writing è ora incentrato sulla gestione strutturata dei contenuti.
Il technical writing è cresciuto in complessità a causa si numerosi fattori, fra i quali spicca la diffusione sempre più capillare dei dispositivi mobili.
Il documento illustra le nuove esigenze del technical writing e del content management, suggerendo come le LRT (Language Resources and Technologies) e in particolare le tecnologie di Machine Translation possono contribuire a incrementarne qualità e produttività.
Per maggiori informazioni:
- Informazioni sul LREC Workshop W2: Controlled Natural Language Simplifying Language Use: https://sites.google.com/site/lreccnl2014/
- Informazioni su LREC - Language Resources and Evaluation Conference 2014: http://lrec2014.lrec-conf.org/en/
Il cuore del documento è dedicato ai vantaggi che la messa a punto e l'adozione di un insieme integrato di Language and Resource Technologies possono portare al technical writing, in particolare nel contesto delle piccole e medie imprese (PMI).
Gli autori partono dalla constatazione che per lingue diverse dall'inglese (e in parte dal tedesco) attualmente vi è scarsa disponibilità diglossari, terminologie, linguaggi controllati e semplificati.
Questo tipo di risorse è però molto importante, perché aiuta le aziende a:
- Ridurre tempi e costi di redazione
- Standardizzare i contenuti, migliorando la qualità (chiarezza) della documentazione tecnica e di prodotto
- Ottimizzare le procedure di traduzione, incrementando l'affidabilità dei software di traduzione assistita e automatica (CAT tool e Machine Translation [MT] tool).
- Si tratta quindi di risorse che contribuiscono a incrementare la competitività delle PMI sul mercato internazionale.
Per la lingua italiana - per cui non esiste attualmente un linguaggio controllato o semplificato, e per cui anche glossari e terminologie sono disponibili in modo molto frammentario -, lo sviluppo di software in grado di estrarre da documenti esistenti glossari e terminologie, regole semantiche (metadati), regole sintattiche, grammaticali e ortografiche rappresenterebbe un primo passo strategico, perché permetterebbe di:
- Creare questo tipo di risorse a costi sostenibili
- Raffinare le risorse create automaticamente, utilizzando software di post-editing
- Condividere le risorse
- Rendere le risorse personalizzabili in base alle esigenze delle singole aziende (per esempio integrando le basi dati standard, con termini e regole del linguaggio aziendale e/o di specifici settori).
Gli autori sottolineano che le tecnologie di base per lo sviluppo di questo tipo di software di "estrazione" sono ormai mature.
Glossari e terminologie, metadati e regole del linguaggio controllato o semplificato rappresentano a loro volta la base per lo sviluppo di un insieme di software a supporto del technical writing e della traduzione:
- CLC - Controlled Language Checker, che supportano l'attività di redazione, validando i testi scritti dal technical writer sulla base del glossario / delle terminologie, nonché regole del linguaggio controllato / semplificato di riferimento. Il CLC può segnalare, per esempio, che l'uso dell'avverbio o della forma passiva non sono consentiti oppure suggerire termini preferenziali
- AMS - Authoring Memory Systems, che aiutano il redattore a riusare contenuti già presenti all'interno del sistema di Content Management (CMS)
- Software di traduzione assistita o automatica.
Attualmente questo tipo di applicazioni è disponibile essenzialmente per il mercato anglosassone e tedesco, come software a sé stanti o integrati all'interno di soluzioni di alta gamma, pensate per aziende di dimensioni medio-grandi, non comparabili con le PMI italiane.
La sfida è dunque quella di realizzare una soluzione incentrata sulla lingua italiana - in cui i redattori italiani normalmente scrivono i testi originali - e alla portata delle aziende piccole e medie, maggioritarie nel nostro panorama industriale.
Trasferimento tecnologico (cioè collaborazione virtuosa fra mondo della ricerca e partner industriali), automazione, condivisione, flessibilità escalabilità potrebbero risultare gli ingredienti fondamentali per centrare l'obiettivo.
Autore: Petra Dal Santo