El Internet y los idiomas [alrededor del año 2000]

Chapter 5

Chapter 53,561 wordsPublic domain

Bill añade en julio de 1999: "Cuando la página principal de un sitio web está disponible en varios idiomas, el siguiente paso es el desarrollo del contenido en cada idioma. Un webmaster notará cuáles de los idiomas atraen a más visitantes - y por lo tanto generan más ventas. Éstos serán los idiomas en los que se iniciará una campaña de promoción plurilingüe en la web. Mientras tanto, siempre es bueno que siga aumentando el número de idiomas en las que un sitio web está disponible. Al principio, basta con que sólo la página principal sea traducida a varios idiomas, pero es deseable que se establezca un verdadero sector para cada idioma."

El World Wide Web Consortium (W3C) es un consorcio internacional fundado en octubre de 1994 para definir los protocolos comunes de la web. En los años siguientes el sitio web del W3C lanza una sección Internacionalización / Localización para presentar los protocolos útiles en este caso: HTML (HyperText Markup Language), mapas (básicos) de caracteres, nuevos atributos, HTTP (HyperText Transfer Protocol), "negociación" del idioma, URL (Uniform Resource Locator) y otros identificadores para incluir caracteres diferentes del ASCII (American Standard Code for Information Interchange). Esta sección también da consejos prácticos para crear un sitio multilingüe.

La asociación LISA (Localisation Industry Standards Association - Asociación para Normas en la Industria de la Localización) tiene 130 miembros (a finales de 1998), entre los cuales editores de programas, fabricantes de material informático, proveedores de servicios de localización y un número creciente de empresas pertenecientes a otras áreas de las tecnologías de la información. El objetivo de LISA es promover la industria de la localización y de la internacionalización y proporcionar servicios que permiten a las empresas intercambiar y compartir información en este ámbito, por ejemplo el desarrollo del proceso, y sus herramientas, tecnologías y modelos. El sitio web de LISA es hospedado por el sitio de la Universidad de Ginebra (Suiza).

TRADUCCIÓN ASISTIDA POR COMPUTADOR

= [Cita]

Autor de "Chroniques de Cybérie" (Crónicas de Cyberia), una carta electrónica semanal sobre las noticias del internet, Jean-Pierre Cloutier deplora en agosto de 1999 "que se hagan tan pocas traducciones de textos y ensayos importantes publicados en la web, tanto del inglés hacia otras lenguas como a la inversa (...) La novedad del internet en las regiones donde ahora acaba de implantarse suscita ahí reflexiones que serían útiles de leer para nosotros. ¿Cuándo será posible disponer de una traducción de lo que escriben los pensadores de la comunicación de habla española, o de otro idioma?"

= [Texto]

Siendo el internet una fuente de información con vocación mundial, parece indispensable favorecer las actividades de traducción.

Aquarius es el primer directorio en línea no comercial de traductores e intérpretes, creado en Amsterdam (Países Bajos) por la empresa Vorontsoff, Wesseling & Partners. En noviembre de 1998, Aquarius cuenta con 6.100 traductores e intérpretes, 800 empresas de traducción, 91 áreas de especialización y 369 combinaciones lingüísticas. El sitio permite a individuos y firmas contactarles directamente, sin intermediarios. La búsqueda es posible por ubicación, combinación de idiomas y especialización.

Además, desde diciembre de 1997, algunos programas de traducción automática están disponibles gratis en la web - el primero es él de SYSTRAN en la página web AltaVista Translation, que puede traducir en unos segundos una página web o un breve texto con varios pares de idiomas posibles. Obviamente la traducción automática no ofrece la calidad del trabajo de traductores profesionales, que es muy preferible cuando uno tiene tiempo y dinero. Sin embargo es muy práctica para obtener una traducción aproximada inmediata y gratis.

La traducción asistida por computador, que acopla la traducción automática con el trabajo del traductor profesional, se utiliza cada vez más. Al igual que el procesamiento del lenguaje natural y la traducción automática (véase el capítulo siguiente), es una rama de la ingeniería lingüística.

¿Qué es la ingeniería lingüística? El sitio web HLTCentral (HLT: Human Languages Technologies - Tecnologías de las Lenguas Humanas), lanzado en enero de 1999 por la Comisión Europea, la define así: "La ingeniería lingüística permite vivir cómodamente con la tecnología. Podemos usar nuestro conocimiento de la lengua para desarrollar sistemas capaces de reconocer a la vez el habla y la escritura, para comprender un texto suficientemente en profundidad para poder seleccionar información, para traducirlo a varios idiomas y generar tanto un discurso oral como un texto impreso. La aplicación de estas tecnologías nos permite ampliar los límites actuales de nuestro uso de la lengua. Por ejemplo los sistemas con mando vocal van a desempeñar un papel importante y formar parte de nuestra vida cotidiana."

A diferencia de la traducción automática que analiza el texto en el idioma de fuente y genera automáticamente el texto en el idioma de destino sin la intervención humana en este proceso, la traducción asistida por computador se basa en la interacción entre el hombre y la máquina durante el proceso de traducción.

Este método es adoptado por ejemplo a mediados de los 1990 por la Oficina de los Servicios Lingüísticos de la Organización Mundial de la Salud (OMS) en Ginebra (Suiza). Los traductores trabajan en los seis idiomas oficiales de la organización: inglés, español, francés, ruso, árabe y chino. También han intentado experimentos con la traducción automática en varias ocasiones, pero las traducciones obtenidas requerían un trabajo de revisión demasiado largo. En aquella etapa de su desarrollo y habida cuenta del tipo de documentos que había que traducir, no se consideraba lo suficientemente rentable.

En la OMS, la Unidad de Traducción Asistida por Computador y de Terminología (CTT: Computer-assisted Translation and Terminology) también explora las posibilidades técnicas de los nuevos sistemas basados en la noción de "memoria de traducción". Como se explica en su página web, "estos sistemas permiten al traductor tener acceso inmediato al 'patrimonio que ya se ha traducido' en que puede extraer, desechar o modificar las traducciones anteriores de sus colegas, y añadir su propia traducción en esta 'memoria'. Así, al archivar la producción diaria, los traductores pronto tendrían acceso a una 'memoria' colosal que ofrece soluciones inmediatas a un gran número de problemas de traducción."

Además, el CTT utiliza varias aplicaciones para el archivo electrónico y la búsqueda en textos integrales, la alineación de textos bilingües y multilingües, la gestión de memorias de traducción y de bases terminológicas, y el reconocimiento de la voz.

En su sede en Washington DC (Estados Unidos), la Organización Panamericana de la Salud (OPS, o PAHO en inglés) y la Oficina Regional de la OMS para las Américas utilizan un sistema de traducción automática desarrollado por los lingüistas computacionales, los traductores y programadores de la OPS. El Servicio de Traducción utiliza SPANAM (programa de traducción automática del español al inglés) desde 1980 y ENGSPAN (del inglés al español) desde 1985, lo que ha permitido tratar más de 25 millones de palabras entre 1980 y 1998 en los dos idiomas oficiales más usados de la OPS. Los traductores de la OPS y los traductores externos corrigen el resultado obtenido por SPANAM y ENGSPAN con una ganancia de productividad del 30 al 50%. Estos programas también están a disposición de los servicios técnicos y administrativos en la red local de la sede de la organización y en varias oficinas regionales, y se distribuyen a las agencias gubernamentales y organizaciones sin fines de lucro de los Estados Unidos, de Latinoamérica y de España. El nuevo nombre del programa de traducción automática es PAHOMTS. Además del inglés y del español, incluye el portugués, el tercer idioma oficial de la OPS.

Otro experimento es el de Wordfast. En junio de 2001, las firmas Logos y Y.A. Champollion se asocian para crear Champollion Wordfast, una empresa de servicios de ingeniería en traducción y localización, y en gestión de contenidos multilingües. Wordfast es un programa de traducción con terminología disponible en tiempo real y con control tipográfico. Es compatible con otros programas como el WebSphere Translation Server de IBM y los programas de TMX o Trados. Una versión simplificada de Wordfast se puede descargar gratis, con un manual del usuario disponible en 16 idiomas. Wordfast se ha convertido en los últimos años (2005-2009) en el primer programa de traducción mundial que puede usarse en cualquier plataforma, y en el segundo programa mundial en cuanto al número de ventas (después de SDL Trados), con 20.000 clientes en el mundo entero, por ejemplo las Naciones Unidas, Nomura Securities, la NASA (National Aeronautics and Space Administration - Administración Nacional de Aeronáutica y del Espacio) y McGraw-Hill.

TRADUCCIÓN AUTOMÁTICA

= [Cita]

Tim McKenna, escritor y filósofo, escribe en octubre de 2000: "Cuando la calidad de los softwares sea suficiente para que la gente converse por escrito y verbalmente en la web en varios idiomas y en tiempo real, veremos un nuevo mundo abrirse ante nosotros. Científicos, políticos, empresarios y muchos otros grupos podrán comunicar directamente entre ellos sin la intervención de mediadores o traductores."

= Definición

Un programa de traducción automática analiza el texto en la lengua de salida (texto origen) y genera automáticamente el texto correspondiente en la lengua de llegada (texto meta), aplicando reglas precisas para la transferencia de la estructura gramatical. El ser humano no interviene en el proceso, a diferencia de lo que pasa con la traducción asistida por computador, que supone la interacción entre el hombre y la máquina. Si la traducción automática sigue siendo aproximada, los programas van mejorando con regularidad, sin pretender competir con el cerebro humano.

SYSTRAN, empresa pionera en el procesamiento automático de las lenguas, explica en su sitio web: "Un programa de traducción automática traduce de un lengua natural a otra lengua natural. La traducción automática tiene en cuenta la estructura gramatical de cada lengua y utiliza reglas para transferir la estructura gramatical de la lengua de origen (texto para traducir) a la lengua meta (texto traducido). La traducción automática no sustituye ni está destinada a sustituir al traductor humano."

La Asociación Europea de Traducción Automática (EAMT: European Association for Machine Translation) propone la definición siguiente en su sitio web: "La traducción automática consiste en el uso de la computadora para traducir textos de una lengua natural a otra. Fue una de las primeras áreas de investigación en informática. Resultó que este objetivo era difícil de lograr. Sin embargo existen hoy en día unos cuantos sistemas que producen resultados cuya calidad - aunque no sea perfecta - es suficiente para ser útil en ciertas aplicaciones específicas, en general en el campo de la documentación técnica. Además los programas de traducción, destinados esencialmente a ayudar al traductor humano a generar traducciones, gozan de una creciente popularidad entre los organismos de traducción profesionales."

¿Cuándo empezó la investigación relativa a la traducción automática? Se puede leer un historial en el sitio web de Globalink, una empresa especializada en programas y servicios de traducción (ahora desaparecida). He aquí un resumen de este historial.

Desde sus inicios, la traducción automática y el procesamiento del lenguaje natural progresan al mismo tiempo que el desarrollo de la informática cuantitativa. El desarrollo de las primeras computadoras programables durante la Segunda Guerra Mundial es acelerado por los primeros esfuerzos criptográficos para romper los códigos secretos alemanes. Después de la guerra, la traducción y el análisis de texto en lenguaje natural proporcionan una base para el campo emergente de la teoría de la información.

Durante los años 1950, la investigación sobre la traducción automática toma forma pero limitándose aún a una traducción literal (palabra por palabra) sin utilizar reglas lingüísticas. El proyecto ruso iniciado en la Universidad de Georgetown a principios de los años 1950 representa el primer intento sistemático para crear un sistema de traducción automática utilizable.

Hasta mediados de los años 1960, una serie de investigaciones académicas y de investigaciones financiadas por los gobiernos se llevan a cabo en los Estados Unidos y en Europa. Al mismo tiempo, los rápidos avances en el campo de la lingüística teórica culminan en 1965 con la publicación del libro "Aspects of the Theory of Syntax" ("Aspectos de la Teoría de la Sintaxis") por Noam Chomsky, y alteran radicalmente la estructura vigente para la comprensión de la fonología, la morfología, la sintaxis y la semántica del lenguaje humano.

En 1966, el informe del la Comisión ALPAC (Automatic Language Processing Advisory Committee - Comisión Asesora Sobre el Tratamiento Automático del Lenguaje) del gobierno de los Estados Unidos hace una estimación prematuramente negativa del valor de los sistemas de traducción automática y de las perspectivas para sus aplicaciones prácticas, poniendo así fin a la financiación y la experimentación en este ámbito para la década siguiente.

Hay que esperar hasta fines de los años 1970 para ver aparecer nuevos experimentos serios, junto con los avances de la informática y de las tecnologías de las lenguas. Este período ve el desarrollo de sistemas de transferencia de una lengua a otra, y el lanzamiento de los primeros intentos comerciales. Empresas como SYSTRAN y METAL están convencidas de la viabilidad y la utilidad de semejante mercado. Desarrollan productos y servicios de traducción automáticos conectados a un servidor central.

Pero quedan muchos problemas, por ejemplo los altos costes de desarrollo, un trabajo lexicográfico enorme, la dificultad de ofrecer nuevas combinaciones de idiomas, la inaccesibilidad de estos sistemas para el usuario medio, y finalmente el desafío de pasar a nuevas etapas de desarrollo.

= Experiencias

En los años 1990, la expansión del internet y del comercio electrónico favorecen el desarrollo de un verdadero mercado con productos y servicios de las empresas SYSTRAN, Alis Technologies, Lernout & Hauspie, Globalink y Softissimo, entre otras, para usuarios profesionales y usuarios medios.

SYSTRAN (acrónimo de "System Translation"), pionero en el procesamiento del lenguaje natural, es el autor del primer programa de traducción gratis en la web. AltaVista, un buscador utilizado por doce millones de usuarios, tiene más y más usuarios que no hablan inglés. Lanzado en diciembre de 1997, AltaVista Translation - también conocido como Babel Fish - es un servicio de traducción automática de páginas web del inglés a los idiomas siguientes: alemán, francés, español, italiano y portugués, y viceversa. La sede de SYSTRAN está en París (Francia), con una sucursal en San Diego (California) para las ventas y el marketing, y parte de la I + D (Investigación y Desarrollo).

Con sede en Montreal (Quebec), Alis Technologies desarrolla y comercializa soluciones y servicios de procesamiento lingüístico con programas de traducción que convierten sistemas informáticos monolingües en herramientas multilingües.

Con sede en Ypres (Bélgica) y Burlington (Massachusetts, Estados Unidos), Lernout & Hauspie (posteriormente adquirido por ScanSoft) tiene productos y servicios en dictado, traducción, compresión de voz, síntesis de voz y documentación industrial. Las tecnologías cubiertas incluyen el reconocimiento automático de las lenguas, la compresión digital de la palabra, el paso del texto a la voz, y la traducción. Los productos de las tres primeras tecnologías están destinados a grandes empresas de telecomunicaciones, informática, multimedia, electrónica de consumo y electrónica de automoción. Los productos de la cuarta tecnología - servicios de traducción - están destinados a las empresas de tecnologías de la información, a los mercados verticales y a los mercados de automatización.

Lernout & Hauspie forma también el Machine Translation Group (Grupo de Traducción Automática), que incluye empresas que desarrollan, producen y venden sistemas de traducción, por ejemplo L&H Language Technology, AppTek, AILogic, NeocorTech y Globalink.

Fundada en 1990 en los Estados Unidos, Globalink es una empresa especializada en programas y servicios de traducción, con soluciones personalizadas a partir de una gama de programas, opciones en línea y servicios de traducción profesional. La empresa distribuye sus programas de traducción en alemán, inglés, español, francés, italiano y portugués, y propone soluciones a problemas de traducción para individuos, pequeñas empresas, multinacionales y gobiernos, ya sea un producto individual con una traducción preliminar rápida o un sistema completo para la gestión de traducciones de documentos profesionales.

El sitio web de Globalink (ahora desaparecido) destaca a finales de los años 1990: "Con los programas de aplicación de Globalink, la computadora utiliza tres conjuntos de datos: el texto que hay que tratar, el programa de traducción y un diccionario de palabras y frases en el idioma fuente, así como información sobre los conceptos descritos por el diccionario y las normas aplicables a la frase: reglas de sintaxis y gramática, entre los cuales algoritmos que regulan la conjugación de verbos, el ajuste de la sintaxis, las concordancias de género y número y el orden de las palabras. Una vez que el usuario ha seleccionado el texto y lanzado el proceso de traducción, el programa empieza por comparar las palabras del texto a tratar con las palabras almacenadas en el diccionario. Una vez encontrada la adecuación, la aplicación prepara una nota completa que incluye información sobre los posibles significados de la palabra y, según el contexto, sus relaciones con otras palabras en la misma frase. El tiempo necesario para la traducción depende de la largura del texto. Un documento de tres páginas y 750 palabras requiere un tratamiento de aproximadamente tres minutos para una primera traducción."

Con sede en París (Francia), Softissimo comercializa la serie de programas de traducción Reverso, junto con productos de escritura multilingüe, diccionarios electrónicos y métodos de lenguas. Reverso se utiliza por ejemplo en Voilà, el buscador de France Télécom. Softissimo también distribuye programas de aprendizaje de idiomas y diccionarios como el Eurodico o los diccionarios de la editorial Collins.

En marzo de 2001, IBM se lanza en el mercado de la traducción con un producto profesional de alto nivel, el WebSphere Translation Server. Este programa traduce inmediatamente a varios idiomas (alemán, chino, coreano, español, francés, inglés, italiano, japonés) las páginas web, los correos electrónicos y los diálogos en línea (chats). Puede interpretar 500 palabras por segundo y permite añadir vocabularios específicos.

= El futuro

François Vadrot, director de FTPress (French Touch Press), una firma de prensa en línea, escribe en mayo de 2000: "¿Realmente es posible pensar que toda la población del mundo acabará comunicando en cualquier dirección? ¿Quizás sí? ¿Vía sistemas de traducción instantánea, escrita u oral? Me cuesta trabajo imaginar que veremos tan pronto aparecer instrumentos capaces de traducir las sutilezas del modo de pensar propio de un país: en este caso no bastaría con traducir la lengua sino que sería preciso establecer pasarelas de sensibilidad. ¿A no ser que la 'mundialización' uniformice todo eso?"

Alex Andrachmes, productor audiovisual, escritor y "explorador de hipertexto", está igual de dubitativo. Escribe en diciembre de 2000: "Espero a ver cómo son aquellas famosas traducciones simultáneas en vivo... Nos las describen provistas de nuevos procesadores ultra- poderosos, pero ya nos las anunciaban para la generación de procesadores actual. Por lo tanto, si es para obtener un: usted / reserva / avión / de el / november 17-2000 ... Gracias, puedo pasar sin ello. Tal vez más adelante sí."

Otras personas son más optimistas.

Pierre-Noël Favennec, experto en la dirección científica de France Télécom R&D, destaca en febrero de 2001: "La investigación sobre la traducción automática debería permitir una traducción automática a los idiomas deseados, pero ofreciendo aplicaciones para cada lengua y no sólo para las lenguas dominantes (por ejemplo, la difusión de documentos en japonés, si el emisor es de lengua japonesa, y la lectura en bretón, si el receptor es de lengua bretona). Así pues queda mucho por hacer en el campo de la traducción automática y escrita de todas las lenguas."

Tim McKenna, escritor y filósofo, escribe en octubre de 2000: "Cuando la calidad de los softwares sea suficiente para que la gente converse por escrito y verbalmente en la web en diferentes idiomas y en tiempo real, veremos un nuevo mundo abrirse ante nosotros. Científicos, políticos, empresarios y muchos otros grupos podrán comunicar directamente entre ellos sin la intervención de mediadores o traductores."

Randy Hobler es consultor en marketing internet para Globalink, una empresa de productos y servicios de traducción. Entrevistado en septiembre de 1998, destaca perspectivas interesantes sobre el futuro de la traducción: "Pronto alcanzaremos el punto en que será tan habitual obtener una traducción muy fiel del texto y del habla que esta funcionalidad podrá formar parte de las plataformas o incluso de los chips. En esta etapa, cuando el desarrollo del internet haya alcanzado su velocidad de crucero, cuando la fidelidad de la traducción supere el 98% y cuando las diferentes combinaciones de idiomas posibles hayan cubierto la gran mayoría del mercado, la transparencia de la lengua - es decir cualquier comunicación de un idioma a otro - será una visión demasiado restrictiva para los que venden esta tecnología.

El desarrollo siguiente será la 'transparencia transcultural y transnacional' en la cual los otros aspectos de la comunicación humana, el comercio y las transacciones más allá del solo idioma entrarán en juego. Por ejemplo, los gestos tienen un significado, los movimientos faciales tienen un significado, y esto varía en función de las normas sociales de un país a otro. La letra 'O' hecha con el pulgar y el dedo índice significa 'OK' en los Estados Unidos, mientras que en Argentina es un gesto obsceno.

Cuando asistamos al desarrollo inevitable de la videoconferencia multilingüe multimedia, será necesario corregir visualmente estos gestos. El Media Lab del MIT (Massachusetts Institute of Technology - Instituto de Tecnología del Massachusetts), Microsoft y muchos otros trabajan sobre el reconocimiento informático de las expresiones faciales, la identificación de los datos biométricos para la cara, etc. No sirve para nada que un empresario estadounidense haga un discurso excelente para un argentino durante una videoconferencia multilingüe en la web si hace también el gesto 'O' con el pulgar y el dedo índice, aunque su discurso esté traducido en un español argentino perfecto. Los computadores podrán interceptar estos gestos y corregirlos visualmente.