El Internet y los idiomas [alrededor del año 2000]
Chapter 2
Profesor en tecnologías de la comunicación en la Webster University de Ginebra (Suiza), Henk Slettenhaar insiste en la necesidad de sitios web bilingües, en su idioma original y en inglés. Escribe en diciembre de 1998: "Las comunidades locales presentes en la web deberían utilizar antes de todo su propio idioma para difundir información. Si desean presentar esta información a la comunidad mundial, esta información deberá ser disponible también en inglés. Pienso que los sitios web bilingües son verdaderamente necesarios. (...) Pero estoy encantado de que ahora existan tantos documentos disponibles en su lengua original. Prefiero - y con mucho - leer el original con cierta dificultad antes que una traducción mediocre."
Henk añade en agosto de 1999: "A mi parecer, existen dos tipos de búsquedas en la web. En el primer caso, se trata de una búsqueda global en el campo de los negocios y de la información. Para llevarla a cabo, el idioma es primero el inglés, con versiones locales si es necesario. El segundo tipo de búsqueda concierne información local de toda clase en los lugares más remotos. Si la información se dirige a una etnia o a un grupo lingüístico, debe aparecer primero en el idioma de dicha etnia o de dicho grupo, con quizás un resumen en inglés."
Alain Bron, consultor en sistemas de información y escritor, explica en noviembre de 1999: "Se seguirán usando lenguas diferentes, y eso por mucho tiempo, tanto mejor para el derecho a la diferencia. El riesgo es por supuesto la invasión de una lengua en perjuicio de otras, y por lo tanto la nivelación cultural en detrimento de las otras. Pienso que poco a poco van a crearse servicios en línea para paliar esta dificultad. Al principio, algunos traductores podrán traducir y comentar textos a petición de los usuarios, y sobre todo los sitios más frecuentados invertirán en versiones en lenguas diversas, como lo hace la industria audiovisual."
Philippe Loubière, traductor literario francés, denuncia por su parte la preponderancia del inglés que se ha apoderado de la red. Explica en marzo de 2001: "Todo lo que puede contribuir a la diversidad lingüística, tanto en la web como en otros ámbitos, es indispensable para la supervivencia de la libertad de pensamiento. No exagero en absoluto: el hombre moderno se juega en ello la supervivencia. Ahora bien, yo soy muy pesimista respecto a esta evolución. Los anglosajones suelen escribir a todo el mundo en inglés sin ningún escrúpulo. La inmensa mayoría de los franceses comprueba con una indiferencia total cómo el inglés macarrónico de los comerciales y de los publicistas va sustituyendo poco a poco su propio idioma, y el resto del mundo ha dado por perfectamente admitida la hegemonía lingüística de los anglosajones porque no tiene más perspectivas sino servir a esos ricos y poderosos dueños. La única solución consistiría en recurrir a legislaciones internacionales lo suficientemente restrictivas como para obligar a los gobiernos nacionales a respetar y a hacer respetar la lengua nacional en sus propios países (el francés en Francia, el rumano en Rumanía, etc.), y eso en todos los campos, y no sólo en internet. Pero no hay que hacerse ilusiones..."
Richard Chotin, profesor en la Escuela Superior de Negocios (ESA: École Supérieure des Affaires) de Lille (Francia), recuerda con razón que la supremacía del inglés sustituyó a la del francés. "El problema es político e ideológico, explica en septiembre de 2000. Es el problema del 'imperialismo' de la lengua inglesa que emana del imperialismo norteamericano. De hecho basta con recordar el 'imperialismo' de la lengua francesa a lo largo de los siglos 18 y 19 para comprender por qué se les da tan mal a los estudiantes franceses aprender idiomas. Al no tener que esforzarse para hacerse entender, uno no se esmera, y son los demás los que tienen que hacer esfuerzos."
Bakayoko Bourahima, bibliotecario en la Escuela Nacional Superior de Estadística y de Economía Aplicada (ENSEA: Ecole Nationale Supérieure de Statistique et d'Économie Appliquée) de Abiyán (Costa de Marfil), escribe en julio de 2000: "Para nosotros, africanos de habla francesa, la imposición del inglés en el internet representa para las masas una doble desventaja para acceder a los recursos de la red. Primero por culpa del problema de alfabetización que aún dista mucho de estar resuelto y que el internet enfatizará mucho más; luego se plantea el problema del dominio de una segunda lengua extranjera y de su adecuación al entorno cultural. En suma, si no se hace multilingüe, el internet nos impondrá una segunda colonización lingüística con todas las limitaciones que esto supone. Y esto no deja de ser un gran problema porque a nuestros sistemas educativos ya les cuesta mucho trabajo optimizar sus prestaciones debido al uso del francés como lengua de instrucción básica, según dicen algunos peritos. Por lo tanto cada vez se evoca más la posibilidad de recurrir a las lenguas vernáculas para la instrucción básica, para 'desenclavar' el colegio en África e implicarlo lo mejor posible en la valorización de los recursos humanos. ¿Cómo proceder? En mi opinión no cabe la posibilidad para nosotros de hacer prevalecer cualquier clase de excepción cultural en la red, pues esto sería una reacción absolutamente gregaria. Entonces es preciso que los diferentes bloques lingüísticos se impliquen mucho para promover su propio acceso a la red, sin olvidar sus especificidades internas."
Guy Antoine, creador de Windows on Haiti, un sitio web de referencia sobre la cultura haitiana, cree en la necesidad del inglés como lengua común. Escribe en noviembre de 1999: "Por razones prácticas, el inglés seguirá dominando la red. No pienso que sea una cosa mala, a pesar de los sentimientos regionales que se oponen a eso, porque necesitamos una lengua común que permita favorecer la comunicación a nivel internacional. Dicho esto, no comparto la idea pesimista según la cual las otras lenguas solamente tendrían que someterse a la lengua dominante. Al contrario. Primero porque el internet puede reunir información útil para las lenguas minoritarias, que de otra manera correrían el riesgo de desaparecer sin dejar rastro. Además, en mi opinión, el internet incita a la gente a aprender las lenguas asociadas a las culturas que les interesan. Estas personas se dan cuenta rápidamente que la lengua de un pueblo constituye un elemento fundamental de su cultura.
Por este hecho, no les tengo mucha confianza a los instrumentos de traducción automática que, aunque traduzcan las palabras y expresiones, no pueden traducir el alma de un pueblo. ¿Qué son los haitianos, por ejemplo, sin el 'Kreyòl' (el criollo, para los no iniciados), una lengua que se desarrolló y que permitió unir entre ellas a varias tribus africanas desplazadas a Haití durante el periodo de la esclavitud? Esta lengua representa de la manera más palpable la unión de nuestro pueblo. Sin embargo es sobre todo una lengua hablada y no escrita. En mi opinión la situación irá cambiando gracias a la red, más que con cualquier otro medio tradicional de difusión de una lengua.
En el sitio web Windows on Haiti, la lengua principal es el inglés, pero también hay un foro de discusión animado en 'Kreyól'. Existen también documentos sobre Haití en francés y en criollo antiguo colonial, y estoy dispuesto a publicar otros documentos en español y en otras lenguas. No propongo traducciones, pero el plurilingüismo es palpable en mi sitio, y me parece que esto no tardará en convertirse cada vez más en una norma en la red."
Tarde o temprano, ¿acabará correspondiendo la proporción de idiomas en la red con su repartición en el planeta? Nada parece menos cierto a la hora de la fractura digital entre ricos y pobres, entre zonas rurales y zonas urbanas, entre regiones favorecidas y regiones desfavorecidas, entre el hemisferio norte y el hemisferio sur, entre países desarrollados y países en desarrollo.
Según Zina Tucsnak, ingeniera de estudios en el Laboratorio ATILF (Analyse et Traitement Informatique de la Langue Française - Análisis y Procesamiento Informático de la Lengua francesa), entrevistada en octubre de 2000, "la mejor opción sería la aplicación de una ley por la cual se atribuyera una 'cuota' a cada idioma. Pero ¿no será acaso una utopía pedir la aplicación de una ley como ésta en una sociedad de consumo como la nuestra?"
En la misma fecha, Emmanuel Barthe, documentalista jurídico, expresa una opinión contraria: "Señales recientes dejan pensar que basta con dejar las lenguas tal y como están actualmente en la web. Efectivamente, los idiomas - aparte del inglés - se desarrollan gracias a la multiplicación de sitios web nacionales que se dirigen específicamente a públicos nacionales, a fin de atraerlos hacia el internet. Basta con observar cuánto se han multiplicado las lenguas disponibles en las interfaces de los buscadores generalistas."
Olivier Gainon, creador de CyLibris, una editorial literaria electrónica, escribe en diciembre de 2000: "Me parece muy importante que los futuros protocolos permitan transmitir perfectamente muchos idiomas (...). Si se consigue esto, lo demás se derivará de ello: la representación de los idiomas se hará en función del número de personas conectadas, y al fin y al cabo habrá que contemplar la idea de usar buscadores multilingües."
Pierre Magnenat, responsable del servicio "gestión y previsión" del centro de informática en la Universidad de Lausana (Suiza), escribe en octubre de 2000: "La única solución que veo sería un esfuerzo mundial importante para desarrollar traductores automáticos. Creo que ningún incentivo o cuota bastaría para impedir la dominación total del inglés. Este esfuerzo podría - y debería - estar iniciado al nivel de los estados, y tener recursos suficientes para llegar a un buen resultado."
CODIFICACIÓN: DEL ASCII AL UNICODE
= [Cita]
Olivier Gainon, creador de CyLibris, una editorial literaria electrónica, escribe en diciembre de 2000: "Me parece muy importante que los futuros protocolos permitan transmitir perfectamente muchos idiomas - lo cual podría resultar bastante complicado (en las evoluciones futuras del lenguaje HTML o de los protocolos IP, etc.). Por lo tanto, es necesario que cada uno pueda sentirse a gusto con el internet y no sólo los individuos que dominen (más o menos) el inglés. No parece normal que hoy en día la transmisión de los acentos plantee problemas en los correos electrónicos."
= ASCII
El primer sistema de codificación informática es el ASCII (American Standard Code for Information Interchange - Código Estadounidense Estándar Para el Intercambio de Información). Publicado en 1968 por el ANSI (American National Standards Institute - Instituto Estadounidense Nacional de Normas) y actualizado en 1977 y 1986, el ASCII es un código de 128 caracteres convertidos en lenguaje binario en siete bits (A se convierte en "1000001", B se convierte en "1000010", etc.). Los 128 caracteres incluyen 33 caracteres de control (que no representan símbolos escritos) y 95 caracteres imprimibles: las 26 letras sin acento en mayúsculas (A-Z) y en minúsculas (a-z), las cifras, los signos de puntuación y algunos símbolos, que corresponden en su conjunto a las teclas del teclado estadounidense o del teclado inglés en Europa y en otros países.
El ASCII no permite más que la lectura del inglés y del latín. No permite tomar en cuenta las letras acentuadas presentes en gran parte de las lenguas europeas y aún menos los idiomas no alfabéticos (chino, japonés, coreano, etc.). Esto no planteaba ningún problema de importancia en los primeros años, cuando el intercambio de archivos electrónicos se limitaba esencialmente a Norteamérica. Pero el plurilingüismo pronto se convierte en una necesidad vital. Variantes del ASCII (norma ISO-8859 o ISO-Latin) toman en cuenta los caracteres acentuados de idiomas europeos. La norma ISO 8859-1 (Latin-1) es la norma utilizada en la mayoría de los países de Europa occidental, incluido para el español.
Yoshi Mikami es informático en la sociedad Asia Info Network en Fujisawa (Japón). En diciembre de 1995, lanza la página web bilingüe (inglés-japonés) "The Languages of the World by Computers and the Internet" (Los Idiomas del Mundo con Computadoras y el Internet), conocida comúnmente como Logos Home Page o Kotoba Home Page. Su página presenta un breve historial de cada idioma con sus características, su sistema de escritura, su mapa de caracteres y la configuración del teclado en dicho idioma. Yoshi Mikami también es el coautor (junto con Kenji Sekine y Nobutoshi Kohara) de "The Multilingual Web Guide" (Guía por una web multilingüe), publicado en japonés por las ediciones O'Reilly en agosto de 1997, y traducido al inglés, al alemán y al francés en 1998.
Yoshi explica en diciembre de 1998: "Mi lengua materna es el japonés. Al haber realizado mis estudios de tercer ciclo en los Estados Unidos y trabajado en informática, he llegado a ser bilingüe japonés-inglés americano. Siempre me he interesado por otras lenguas y culturas, lo que me llevó a aprender ruso, francés y chino sobre la marcha. A finales de 1995, he creado en la web el sitio 'The Languages of the World by Computers and the Internet' y he intentado proponer - en inglés y en japonés - un breve historial de todos estos idiomas, así como las características propias de cada lengua y de su fonética. Avalado por la experiencia adquirida, he instigado a mis dos asociados a escribir un libro sobre la concepción, la creación y la presentación de sitios web multilingües. Este libro se publicó en agosto de 1997 bajo el título 'The Multilingual Web Guide' y fue el primer libro sobre dicho tema."
¿Y cómo se imagina la evolución hacia una red multilingüe? "Miles de años atrás, en Egipto, en China y en otros lugares, la gente era más sensible a la necesidad de comunicar sus leyes y reflexiones en varios idiomas y no en uno solo. En nuestra sociedad moderna, cada Estado ha adoptado más o menos una sola lengua de comunicación. A mi parecer, el internet permitirá un uso más amplio de varios idiomas y de páginas multilingües - y no sólo una gravitación alrededor del inglés americano - y un uso más creativo de la traducción informática multilingüe. ¡99% de los sitios web creados en Japón están redactados en japonés!"
= Unicode
Con el desarrollo de la web, el intercambio de datos se internacionaliza más y más. Comunicar en muchos idiomas requiere un sistema de codificación que tome en cuenta muchos alfabetos o ideogramas. Además el paso del ASCII original a sus diversas extensiones no tarda en convertirse en un verdadero rompecabezas, incluso en la Unión Europea, donde se plantean problemas como la multiplicación de las variantes, la corrupción de los datos durante los intercambios informáticos, la incompatibilidad de los sistemas o la visualización de las páginas web en un solo idioma a la vez.
Publicado por primera vez en enero de 1991, el Unicode es un sistema de codificación de caracteres "universal" en 16 bits que asigna un número único a cada carácter. Este número es legible desde cualquier plataforma y con cualquier programa. El Unicode puede tomar en cuenta 65.000 caracteres únicos, es decir todos los sistemas de escritura del planeta. Para gran satisfacción de los lingüistas, progresivamente el Unicode va sustituyendo el ASCII, así como sus variantes UTF-8, UTF-16 y UTF-32 (UTF: Unicode Transformation Format). Se convierte en uno de los componentes de las especificaciones del World Wide Web Consortium (W3C), el organismo internacional encargado del desarrollo de la web.
Patrick Rebollar, profesor de literatura francesa en Japón y moderador de la lista de difusión LITOR (Literatura e Informática), destaca en enero de 2000: "El primer problema es un problema de software. Como se ve con Netscape o Internet Explorer, es posible fijar múltiples idiomas en la web. Pero la compatibilidad entre esos navegadores y otros programas (el Office de Microsoft, por ejemplo) aún no es sistemático. La adopción del Unicode debería resolver muchos problemas, pero esto supone volver a escribir la mayor parte de los programas, lo que los productores de programas se muestran renuentes a hacer debido a los gastos, pues el rendimiento no está garantizado ya que los programas totalmente multilingües tienen menos interés para sus clientes que los programas de navegación."
La utilización del Unicode se generaliza alrededor del año 2000, por ejemplo para los archivos de texto bajo plataforma Windows (Windows NT, Windows 2000, Windows XP y siguientes versiones), que hasta entonces estaban en ASCII.
Pero el Unicode no puede solucionar todos los problemas, como lo subraya en junio de 2000 Luc Dall'Armellina, co-autor y webmaster de oVosite, un espacio de escritura hipermedia: "Los sistemas operativos se van dotando de fuentes Unicode capaces de representar todos los idiomas del mundo. Ojalá sigan el mismo rumbo todas las aplicaciones, desde el procesamiento de texto hasta el navegador web. Las dificultades son inmensas: nuestro teclado, con sus ± 250 teclas, deja ver sus insuficiencias siempre que es necesario digitalizar Katakana o Hiragana japoneses, y aún peor con el chino. La gran variedad de los sistemas de escritura por el mundo y el número de caracteres que abarcan constituyen un freno potente. Sin embargo los obstáculos culturales no son menos importantes, pues están vinculados con los códigos y modalidades de representación propios de cada cultura o etnia."
= ASCII y/o Unicode
El Proyecto Gutenberg es fundado en 1971 por Michael Hart con el objetivo de difundir bajo forma electrónica las obras literarias para ponerlas gratuitamente a la disposición de todos. Tanto los libros que fueron digitalizados hace treinta años como los de ahora se digitalizan en modo texto, mediante uso del ASCII original de siete bits. De esta manera los textos pueden ser leídos sin problema con cualquier computadora, plataforma y programa. Para los idiomas con acentos como el español, los libros tienen dos versiones: una versión en ASCII de ocho bits para tomar en cuenta los caracteres acentuados, y una versión en ASCII de siete bits, sin acentos. A excepción, claro, de las lenguas no codificables en ASCII, como el chino, que está codificado en Big-5.
El Proyecto Gutenberg ofrece libros en otros formatos, incluso en formatos populares tales como HTML, XML, RTF y Unicode. Además, cualquier formato propuesto por voluntarios es generalmente aceptado - PDF, LIT, TeX y muchos otros - siempre y cuando un archivo ASCII también esté presente.
En cuanto a idiomas, el Proyecto Gutenberg es en su mayoría de lengua inglesa, ya que está instalado en los Estados Unidos y que sirve principalmente a la comunidad de habla inglesa a nivel nacional e internacional. En octubre de 1997, Michael Hart anuncia su intención de intensificar la producción de libros en otros idiomas. A principios de 1998, el catálogo incluye algunas obras en alemán, español, francés, italiano y latín. Michael escribe en julio de 1999: "Lanzamos ahora una nueva lengua al mes, y voy a seguir con esta política durante tanto tiempo como sea posible."
A la misión original se añade un papel de puente entre idiomas y culturas diversas. El multilingüismo se convierte poco a poco en una de las prioridades del Proyecto Gutenberg, como la internacionalización, con el Proyecto Gutenberg Australia (creado en agosto de 2001), el Proyecto Gutenberg Europa (creado en enero de 2004), el Proyecto Gutenberg Canadá (creado en julio de 2007) y otros Proyectos Gutenberg por venir en varios países. El Proyecto Gutenberg original (el de los Estados Unidos) tiene libros en 25 idiomas en enero de 2004 y libros en 42 idiomas en julio de 2005.
Desde su creación en enero de 2004, el Proyecto Gutenberg Europa (PG Europa) y Distributed Proofreaders Europa (DP Europa) son sitios web multilingües que tienen en cuenta las principales lenguas europeas. El sitio de DP Europa está inspirado del sitio original de Distributed Proofreaders (el de los Estados Unidos) para gestionar la corrección de los libros digitales entre los voluntarios, que comparan las versiones digitales con las páginas escaneadas de las versiones impresas. En abril de 2004, gracias a traductores voluntarios, el sitio de DP Europa está disponible en doce idiomas. El objetivo a medio plazo es un sitio en sesenta idiomas que tenga en cuenta todas las lenguas europeas. DP Europa utiliza Unicode en lugar del ASCII, para procesar libros en muchos idiomas.
PRIMEROS PROYECTOS MULTILINGÜES
= [Cita]
Tyler Chambers, creador de dos proyectos en la web - la Human- Languages Page (Página de las Lenguas Humanas) y el Internet Dictionary Project (Proyecto de Diccionarios en el Internet) - cuenta en septiembre de 1998: "Mi actividad en línea consiste en favorecer el acceso de más gente a datos lingüísticos, a través de dos proyectos en la web. Aunque yo no sea polígloto, ni siquiera bilingüe, estoy consciente de que muy pocas áreas tienen una importancia comparable al área de las lenguas y del plurilingüismo. (...) En general, creo que la web es importante para la sensibilización a las lenguas y a los temas culturales. ¿En qué otro lugar se puede navegar al azar durante veinte minutos y encontrar información útil en tres lenguas o más?"
= Travlang
Travlang, un sitio web dedicado a la vez a las lenguas y al viaje, fue creado en 1994 por Michael C. Martin, un estudiante en física. Michael siguió administrando este sitio muy popular cuando empezó a trabajar como investigador en el Lawrence Berkeley National Laboratory en California.
La sección Foreign Languages for Travelers (Idiomas Extranjeros para Viajeros) da la oportunidad de aprender en la web los fundamentos de sesenta idiomas. La sección Translating Dictionaries (Diccionarios de Traducción) proporciona acceso a diccionarios gratuitos en varios idiomas (afrikaans, alemán, checo, danés, español, esperanto, finlandés, francés, frisón, húngaro, italiano, latín, noruego y portugués). Estos diccionarios son a menudo breves y de calidad desigual. El sitio también ofrece muchos enlaces a servicios de traducción, escuelas de idiomas, librerías multilingües, etc.
Michael Martin escribe en agosto de 1998: "Pienso que la web es un lugar ideal para acercar las culturas y las personas, y eso incluye que la web sea multilingüe. Nuestro sitio Travlang es muy popular por esta razón. A la gente le encanta el contacto con otras partes del mundo. (...) De verdad el internet es un instrumento importante para comunicar con personas con las cuales no tendríamos la oportunidad de interactuar de otro modo. Agradezco la cooperación que ha hecho posible las páginas de Foreign Languages for Travelers.
¿Cómo ve Michael el futuro? "Creo que las traducciones integrales informatizadas se convertirán en algo común para comunicar directamente con más gente. Esto también ayudará a que el internet alcance más a la gente que no habla inglés."
= La Human-Languages Page
Creada por Tyler Chambers en mayo de 1994, la Human-Languages Page (Página de las Lenguas Humanas) es un catálogo de 1.800 recursos lingüísticos en una centena de lenguas. Los recursos están clasificados en varias secciones: lengua y literatura, escuelas e instituciones, productos y servicios, agencias de empleo y formación, diccionarios, cursos de idiomas.
Otro proyecto web de Tyler es el Internet Dictionary Project (Proyecto de Diccionarios en el Internet), un proyecto colaborativo abierto a todos para la creación de diccionarios gratis en la web, del inglés a otros idiomas (alemán, español, francés, italiano, latín y portugués).