La web, una enciclopedia multilingüe

Part 5

Chapter 53,753 wordsPublic domain

En el verano de 2000, los usuarios no anglófonos del internet alcanza 50%. Falta diversificar los idiomas en una red en la cual 78% de las páginas web todavía están en inglés en el otoño de 2000.

2000 > EL PORTAL YOURDICTIONARY.COM

[Resumen] Robert Beard, profesor de lenguas en la Universidad Bucknell (Estados Unidos), crea en primer lugar, en 1995, el sitio A Web of Online Dictionaries (Una web de diccionarios en línea), un directorio de los diccionarios en línea en varios idiomas (800 diccionarios en el otoño de 1998), con otras secciones para diccionarios multilingües, diccionarios especializados de lengua inglesa, tesauros, vocabularios, gramáticas, glosarios y métodos de enseñanza de lenguas. La sección llamada Linguistic Fun (Diversión Lingüística) tiene elementos de lingüística para los que no son especialistas. Robert Beard cofunda luego, en febrero de 2000, el portal yourDictionary.com, que integra su sitio precedente. yourDictionary.com hace el inventario de 1.800 diccionarios en 250 idiomas en septiembre de 2003, y de 2.500 diccionarios en 300 idiomas en abril de 2007. Como pretende ser el portal de referencia para todos los idiomas, sin excepción alguna, también propone una sección dedicada a las lenguas en peligro de extinción, llamada Endangered Language Repository (Repositorio de idiomas amenazados).

***

Antes de cofundar en febrero de 2000 el portal yourDictionary.com como el portal de todos los idiomas, sin excepción, Robert Beard crea el sitio A Web of Online Dictionaries, en 1995.

Robert Beard es profesor de lenguas en la Universidad Bucknell (Estados Unidos). A Web of Online Dictionaries (Una web de diccionarios en línea) es un directorio de los diccionarios en línea en varios idiomas (800 diccionarios en el otoño de 1998), con otras secciones para diccionarios multilingües, diccionarios especializados de la lengua inglesa, tesauros, vocabularios, gramáticas, glosarios y métodos de enseñanza de lenguas. La sección llamada Linguistic Fun (Diversión lingüística) tiene elementos de lingüística para los que no son especialistas.

Robert Beard destaca en septiembre de 1998: «Al principio se temió que la web representara una amenaza para el multilingüismo, dado que el lenguaje HTML y otros lenguajes de programación se basan en el inglés, y que hay más sitios web en inglés que en cualquier otro idioma. Sin embargo, el sitio web que administro muestra que el multilingüismo está muy presente y que la web puede ayudar a preservar las lenguas en peligro de extinción. Ahora propongo enlaces hacia diccionarios en 150 idiomas y gramáticas en 65 idiomas. Por otro lado, la gente que desarrolla navegadores se interesa más por la diversidad de los idiomas del mundo, promoviendo así la presencia de un número aún mayor de sitios web en varios idiomas».

Cinco años después de la creación de su primer sitio web, Robert Beard cofunda el portal yourDictionary.com, que integra su sitio precedente, y lanza este nuevo portal en febrero de 2000. Explica, en enero de 2000: «Tenemos muchas ideas nuevas. Planeamos trabajar con el Endangered Language Fund [Fondo para lenguas en peligro], en los Estados Unidos y en Gran Bretaña, para recaudar fondos para esta fundación, y publicaremos los resultados en nuestro sitio web. Tendremos grupos de discusión y boletines de información sobre los idiomas. Tendremos juegos de lengua para entretenerse y para aprender los fundamentos de la lingüística. La página web Linguistic Fun [Diversión lingüística] se convertirá en un diario en línea con fragmentos breves, interesantes e incluso divertidos en varios idiomas, seleccionados por expertos del mundo entero».

yourDictionary.com pretende ser el portal de referencia para todos los idiomas, sin excepción alguna. También propone una sección dedicada a las lenguas en peligro de extinción, llamada Endangered Language Repository (Repositorio de idiomas amenazados). Robert Beard explica: «Las lenguas en peligro son esencialmente aquellas que no tienen tradición escrita. Solo un tercio de los 6.000 idiomas que existen en el mundo tienen a la vez tradición escrita y hablada. Pero no pienso que la web contribuya a la pérdida de la identidad de los idiomas. Al contrario, me da la impresión de que a largo plazo la web irá reforzando esta identidad. Por ejemplo, cada vez hay más indios americanos que contactan a lingüistas para pedirles que escriban la gramática de su idioma y les ayuden a elaborar diccionarios. Para ellos la web representa un instrumento de expresión cultural accesible y a la vez muy valioso».

En septiembre de 2003, yourDictionary.com es un directorio de 1.800 diccionarios en 250 idiomas y otras herramientas lingüísticas: vocabularios, gramáticas, glosarios, métodos de enseñanzas de lenguas, etc. En abril de 2007, el directorio incluye 2.500 diccionarios y gramáticas en 300 idiomas.

Robert Beard escribió de manera profética en septiembre de 1998: «La web será una enciclopedia del mundo, hecha por el mundo y para el mundo. Ya no habrá información o conocimientos útiles que no estén disponibles, de manera que se eliminará la barrera principal a la comprensión internacional e interpersonal, y al desarrollo personal e institucional. Hará falta tener una imaginación más desbordante que la mía para predecir el efecto de este desarrollo sobre la humanidad».

2000 > EL PROYECTO GUTENBERG Y LOS IDIOMAS

[Resumen] El Proyecto Gutenberg es un proyecto visionario, lanzado por Michael Hart en julio de 1971, que pretende crear versiones electrónicas gratuitas de obras literarias y difundirlas por todo el mundo. En 2010, el Proyecto Gutenberg cuenta con más de 33.000 ebooks de alta calidad y decenas de miles de descargas al día. Tiene sitios web en los Estados Unidos, en Australia, en Europa y en Canadá, con 40 sitios espejo repartidos por todo el planeta. El Proyecto Gutenberg ofrece ebooks en su mayoría en inglés, pero el multilingüismo es una de sus prioridades desde finales de los años 1990. El francés es el segundo idioma del proyecto. Las colecciones reúnen libros en 60 idiomas —incluso en español— en diciembre de 2010, gracias a la labor paciente de Distributed Proofreaders, un sitio web creado en 2000 para compartir la revisión de los libros entre centenares de voluntarios de diversos países.

***

El Proyecto Gutenberg es un proyecto visionario, lanzado por Michael Hart en 1971, que pretende crear versiones electrónicas gratuitas de obras literarias y difundirlas por todo el mundo. En el siglo 15, Gutenberg había hecho posible para cualquier persona poder tener libros impresos por un precio relativamente módico. En el siglo 21, el Proyecto Gutenberg va a permitir a cada una disponer de una biblioteca digital gratuita.

Michael trabaja desde Illinois (Estados Unidos), tecleando libros del dominio público, por ejemplo la Biblia y la obra completa de Shakespeare, primero él solo y luego con la ayuda de algunos voluntarios.

Su proyecto cobra nuevo aliento con la aparición de la web en 1990. 95% de los usuarios del internet son de lengua materna inglesa a mediados de 1990; entonces, los libros digitales están en inglés en su gran mayoría.

El Proyecto Gutenberg también inspiró otras bibliotecas digitales en Europa. El Projekt Runeberg es creado en Suecia en 1992 para digitalizar la literatura nórdica (escandinava) clásica. El Projekt Gutenberg-DE es creado en Alemania, en 1994, para digitalizar la literatura alemana clásica.

El francés llegó a ser la segunda lengua del Proyecto Gutenberg, y siguió siéndolo en 2010. Los primeros libros en francés son seis obras de Stendhal y dos obras de Julio Verne, todas disponibles a principios de 1997. En aquella fecha, tres novelas de Julio Verne ya estaban disponibles en inglés desde 1994. Desde esta fecha, Julio Verne siempre ha sido parte de los autores más descargados.

En octubre de 1997, Michael Hart anuncia su intención de aumentar la producción de libros en otros idiomas aparte del inglés. A principios de 1998, además de diez libros en francés, el catálogo incluye obras en alemán, español, italiano y latín. Disponible en mayo de 1999, el ebook #2000 es Don Quijote (1605), en castellano, su idioma original. En julio de 1999, Michael escribe en una entrevista por correo electrónico: «Ahora añado un nuevo idioma cada mes, y voy a seguir haciéndolo todo el tiempo mientras sea posible».

El Proyecto Gutenberg cobra nuevo aliento con el lanzamiento de Distributed Proofreaders, un sitio creado en octubre de 2000 por Charles Franks para compartir la revisión de los libros entre centenares de voluntarios de diferentes países.

Disponible en abril de 2002, el ebook #5000 es The Notebooks of Leonardo da Vinci (Los cuadernos de Leonardo da Vinci), en una traducción del italiano al inglés de estos cuadernos escritos a comienzos del siglo 16. Desde su puesta en línea, este ebook ha figurado siempre en el Top 100 de los libros más descargados.

El Proyecto Gutenberg ofrece obras en 25 idiomas a principios de 2004, en 42 idiomas en julio de 2005, incluyendo el sánscrito y las lenguas mayas, y en 59 idiomas en octubre de 2010. Los diez principales idiomas son el inglés (con 28.441 ebooks el 7 de octubre 2010), el francés (1.659 ebooks), el alemán (709 ebooks), el finlandés (536 ebooks), el holandés (496 ebooks), el portugués (473 ebooks), el chino (405 ebooks), el español (295 ebooks), el italiano (250 ebooks) y el griego (101 ebooks). Los idiomas siguientes son el latín, el esperanto, el sueco y el tagalo.

Cuando la traducción automática haya logrado un porcentaje de fiabilidad de 99%, quizás podremos leer estas obras literarias en una gran variedad de idiomas. Los libros traducidos por un software de traducción automática no van a competir con el trabajo de los traductores literarios y sus esfuerzos talentosos durante días y meses, si no años, pero van a permitir al lector captar lo esencial de obras literarias que nunca antes habían sido traducidas —o traducidas solo a unos pocos idiomas por razones comerciales—.

Un libro traducido por un software de traducción podrá a continuación ser corregido por traductores (seres humanos) mediante el uso de una interfaz similar a la que utilizan ahora los voluntarios de Distributed Proofreaders para la corrección de un libro digital producido por un software de OCR (reconocimiento óptico de caracteres). Así pues, quizás veremos la creación de Distributed Translators para compartir la revisión de las traducciones, como un socio de Distributed Proofreaders y del Proyecto Gutenberg.

2001 > WIKIPEDIA: UNA ENCICLOPEDIA COLECTIVA

[Resumen] Wikipedia es creada en enero de 2001 por Jimmy Wales y Larry Sanger (Larry dimitirá más tarde) como una enciclopedia colectiva gratuita en línea cuyo contenido puede reutilizarse libremente. La redactan miles de voluntarios, con la posibilidad de escribir, corregir o completar los artículos, tanto los propios como los de otros contribuidores. Los artículos siguen siendo propiedad de sus autores, y su libre utilización es regida por la licencia GFDL (GNU Free Documentation License) y la licencia Creative Commons. En diciembre de 2006, Wikipedia llega a ser uno de los diez sitios más visitados de la web, conteniendo 6 millones de artículos en 250 idiomas. En mayo de 2007, Wikipedia cuenta con 7 millones de artículos en 192 idiomas, de los cuales 1,8 millones están en inglés, 589.000 en alemán, 500.000 en francés, 260.000 en portugués y 236.000 en español. En 2009, Wikipedia es uno de los cinco sitios más visitados de la web. En enero de 2011, Wikipedia cuenta con 17 millones de artículos en 270 idiomas y 400 millones de visitas al mes en sus sitios.

***

Creada en enero de 2001, Wikipedia es una enciclopedia colectiva gratuita en línea cuyo contenido puede reutilizarse libremente.

¿Qué es exactamente un wiki? Un wiki (palabra hawaiana que significa «rápido») es un sitio web que permite a varios usuarios colaborar juntos en línea redactando el contenido del wiki, modificándolo y enriqueciéndolo en cualquier momento. Se usa el wiki, por ejemplo, para crear y gestionar sitios de información, diccionarios y enciclopedias. El software utilizado para estructurar la interfaz de un wiki puede ser más o menos elaborado. Un software sencillo permite administrar textos e hipervínculos. Un software complejo permite incluir imágenes, gráficos, tablas, etc.

Wikipedia es creada por Jimmy Wales y Larry Sanger (Larry dimitirá más tarde). Inmediatamente adquiere una gran popularidad. No alberga publicidad y es financiada gracias a donaciones. La redactan miles de voluntarios —que se registran con un seudónimo— con la posibilidad de escribir, corregir o completar los artículos, tanto los propios como los de otros contribuidores. Los artículos siguen siendo propiedad de sus autores. Su libre utilización es regida por la licencia GFDL (GNU Free Documentation License) y la licencia Creative Commons.

Fundada en junio de 2003, la Wikimedia Foundation no administra solo Wikipedia, sino también Wiktionary, un diccionario y tesoro multilingüe lanzado en diciembre de 2002, y después Wikibooks (libros y manuales en proceso de redacción) lanzado en junio de 2003, a los que se añaden más adelante Wikiquote (repertorio de citas), Wikisource (textos del dominio público), Wikimedia Commons (fuentes multimedia), Wikispecies (repertorio de especies animales y vegetales), Wikinews (sitio web de noticias) y Wikiversity (material didáctico), lanzado en agosto de 2006.

En diciembre de 2004, Wikipedia cuenta con 1,3 millones de artículos redactados por 13.000 contribuidores en un centenar de idiomas. En diciembre de 2006, cuenta con 6 millones de artículos en 250 idiomas, y llega a ser uno de los diez sitios más visitados de la web. En mayo de 2007, Wikipedia cuenta con siete millones de artículos en 192 idiomas, de los cuales 1,8 millones de artículos en inglés, 589.000 artículos en alemán, 500.000 artículos en francés, 260.000 artículos en portugués y 236.000 artículos en español. En 2009, Wikipedia es uno de los cinco sitios más visitados de la web. En septiembre de 2010, Wikipedia cuenta con 14 millones de artículos en 272 idiomas, de los cuales 3,4 millones de artículos están en inglés, 1,1 millón en alemán y 1 millón en francés. En enero de 2011, Wikipedia celebra sus diez años de existencia con 17 millones de artículos en 270 idiomas y 400 millones de visitas al mes en sus sitios.

Wikipedia también inspira muchos otros proyectos a lo largo de los años, por ejemplo Citizendium, lanzado en marzo de 2007 como una enciclopedia colaborativa experimental de contenido verificado por expertos, o la Encyclopedia of Life, un proyecto mundial lanzado en mayo de 2007 para hacer el inventario de todas las especies animales y vegetales conocidas.

2001 > EL UNL: UN PROYECTO DE METALENGUAJE DIGITAL

[Resumen] La Fundación UNDL (Universal Networking Digital Language – Lenguaje Digital Universal de Conexión) es creada en enero de 2001 en Ginebra (Suiza) para desarrollar y promover el proyecto UNL (Universal Networking Language – Lenguaje Universal de Conexión). Desarrollado desde 1996 en Tokio (Japón) por el Instituto de Estudios Avanzados (IAS: Institute of Advanced Studies) de la Universidad de las Naciones Unidas (UNU), el proyecto UNL es un proyecto de metalenguaje digital —o interlenguaje— destinado a ser un puente entre un idioma de origen y uno de destino para ofrecer una solución a la barrera del idioma. Como se explica en 2010 en un wiki del proyecto, «el UNL es una lengua artificial creada para tener en cuenta la información y los conocimientos transmitidos por las lenguas humanas. Tiene componentes léxicos, gramaticales y semánticos, como las lenguas naturales. Acoplado a la inteligencia artificial, el UNL facilita la comunicación entre el ser humano y la máquina y, a través de la máquina, entre todos los pueblos en la lengua materna de cada cual».

***

El proyecto UNL (Universal Networking Language – Lenguaje Universal de Conexión) es un proyecto de metalenguaje digital para la codificación, el almacenamiento, la búsqueda y la comunicación de la información multilingüe.

Este interlenguaje está destinado a ser un puente entre un idioma de origen y uno de destino para ofrecer una solución a la barrera del idioma. Es desarrollado desde 1996 en Tokio (Japón) por el Instituto de Estudios Avanzados (IAS: Institute of Advanced Studies) de la Universidad de las Naciones Unidas (UNU) dentro del UNL Programme —un programa internacional con la participación de numerosos colaboradores en varias comunidades lingüísticas—. En 1998, 120 investigadores de todo el mundo trabajan sobre un proyecto plurilingüe que incluye 16 idiomas (alemán, árabe, brasileño, chino, español, francés, hindi, indonesio, inglés, italiano, japonés, letón, mongol, ruso, swahili y tailandés).

Dentro del IMAG (Institut d’Informatique et de Mathématiques Appliquées de Grenoble – Instituto de Informática y de Matemáticas Aplicadas de Grenoble) en Francia, el GETA (Groupe d’Étude pour la Traduction Automatique – Grupo de Estudio para la Traducción Automática) participa en el UNL Programme. Christian Boitet, su director, explica en septiembre de 1998: «No se trata de un TAO [traducción asistida por ordenador] sino de comunicación y búsqueda de información multilingüe. 14 grupos han empezado su trabajo sobre 12 idiomas (y dos idiomas anexos) desde el comienzo de 1997. La idea es: (a) desarrollar un estándar llamado UNL, que sería el HTML del contenido lingüístico; (b) para cada idioma, desarrollar un generador (llamado “deconvertor’”), accesible en uno o más servidores, y un “enconvertor”».

Las aplicaciones posibles son el correo electrónico en varios idiomas, la información multilingüe, los diccionarios en línea para la lectura de idiomas extranjeros en la web y la traducción automática para navegar en la web y para el «monitoreo informático».

¿Y cuáles son las perspectivas? Según Christian Boitet, «el plan general es abrir el proyecto a otros idiomas de la ONU en 2000. Tenemos que llegar a un estado satisfactorio para los otros 12 idiomas antes que eso. Desde un punto de vista político y cultural, este proyecto es muy importante, porque demuestra por primera vez una vía posible para elaborar varias herramientas apoyando el uso de todos los idiomas en el internet, tanto de los mayoritarios como de los minoritarios».

Este programa continúa bajo los auspicios de la Fundación UNDL (Universal Networking Digital Language – Lenguaje Digital Universal de Conexión), creada en enero de 2001 en Ginebra (Suiza) para desarrollar y promover el proyecto UNL, en asociación con las Naciones Unidas.

Según un wiki del proyecto en 2010, «el UNL es una lengua artificial creada para tomar en cuenta la información y los conocimientos transmitidos por los idiomas humanos. Tiene componentes léxicos, gramaticales y semánticos, como las lenguas naturales. Acoplado a la inteligencia artificial, el UNL facilita la comunicación entre el ser humano y la máquina, y a través de la máquina, entre todos los pueblos en la lengua materna de cada uno. Nuestra primera tarea es la de completar el sistema UNL antes de ponerlo al servicio de todas las naciones».

2001 > UN MERCADO PARA LOS SOFTWARE DE TRADUCCIÓN

[Resumen] En marzo de 2001, IBM se lanza en el creciente mercado de la traducción con un producto profesional de alto nivel, el WebSphere Translation Server. Este software traduce al instante a varios idiomas (alemán, chino, coreano, español, francés, inglés, italiano y japonés) las páginas web, los correos electrónicos y los diálogos en línea (los chats). Puede interpretar 500 palabras por segundo y permite añadir vocabularios específicos. Los software de traducción asistida por ordenador son desarrollados para traductores profesionales. Incluyen una «memoria de traducción» con gestión de la terminología en tiempo real y control tipográfico, por ejemplo Wordfast, creado en 1999 por Yves Champollion y compatible con otros grandes software del mercado como el WebSphere Translation Server de IBM y los software de SDL Trados. Disponible para cualquier plataforma (Windows, Mac, Linux), Wordfast cuenta con 14.000 clientes alrededor del mundo en 2010, como por ejemplo las Naciones Unidas, Coca-Cola y Sony.

***

La generalización del internet como fuente de información mundial y el desarrollo del comercio electrónico favorecen el mercado creciente de los software de traducción.

Empresas especializadas como Systran, Alis Technologies, Lernout & Hauspie, Globalink o Softissimo desarrollan software, productos y servicios dirigidos a tres tipos de clientes: el público en general, los profesionales de la lengua y las empresas, localizando sus sitios web para ampliar su audiencia y atraer nuevos clientes.

En marzo de 2001, IBM se lanza en el mercado de la traducción con un producto profesional de alto nivel, el WebSphere Translation Server. Este software traduce al instante a varios idiomas (alemán, chino, coreano, español, francés, inglés, italiano y japonés) las páginas web, los correos electrónicos y los diálogos en línea (chats). Puede interpretar 500 palabras por segundo y permite añadir vocabularios específicos.

Un software de traducción automática (TA) analiza el texto en la lengua de salida (texto origen) y genera automáticamente el texto correspondiente en la lengua de llegada (texto meta), aplicando reglas precisas para la transferencia de la estructura gramatical. El ser humano no interviene en el proceso, a diferencia de lo que pasa con la traducción asistida por ordenador (TAO), que se basa en la interacción entre el ser humano y la máquina.

Los software de traducción asistida por ordenador son desarrollados para los traductores profesionales. Estos incluyen una «memoria de traducción» con gestión de la terminología en tiempo real y control tipográfico. Es el caso, por ejemplo, de Wordfast, creado en 1999 por Yves Champollion, y compatible con otros grandes software del mercado como el WebSphere Translation Server de IBM y los software de SDL Trados. Disponible para cualquier plataforma (Windows, Mac o Linux), Wordfast cuenta con 14.000 clientes alrededor del mundo en 2010, por ejemplo las Naciones Unidas, Coca-Cola y Sony.

Tim McKenna, escritor y filósofo, escribe en octubre de 2000: «Cuando la calidad de los software sea suficiente para que la gente converse por escrito y verbalmente en la web en varios idiomas y en tiempo real, veremos un nuevo mundo abrirse ante nosotros. Científicos, políticos, empresarios y muchos otros grupos podrán comunicar directamente entre ellos sin la intervención de mediadores o traductores».

Según Randy Hobler, consultor en marketing internet de productos y servicios de traducción, el siguiente paso será «la transparencia transcultural y transnacional».

Explica en septiembre de 1998: «Pronto alcanzaremos el punto en que será tan habitual obtener una traducción tan fiel del texto y del habla que esta funcionalidad podrá formar parte de las plataformas o incluso de los chips. En esta etapa, cuando el desarrollo del internet haya alcanzado su velocidad de crucero, cuando la fidelidad de la traducción supere el 98% y cuando las diferentes combinaciones de idiomas posibles hayan cubierto la gran mayoría del mercado, la transparencia de la lengua —es decir, cualquier comunicación de un idioma a otro— será una visión demasiado restrictiva para los que venden esta tecnología. El desarrollo siguiente será la “transparencia transcultural y transnacional” en la cual los otros aspectos de la comunicación humana, el comercio y las transacciones más allá del idioma entrarán en juego. Por ejemplo, los gestos tienen un significado, los movimientos faciales tienen un significado, y esto varía en función de las normas sociales de un país a otro.

(…)