Le web, une encyclopédie multilingue

Part 2

Chapter 23,543 wordsPublic domain

Pour mémoire, le premier système d'encodage informatique est l’ASCII (American Standard Code for Information Interchange), publié en 1963 aux États-Unis par l’American National Standards Institute (ANSI) pour encoder des informations en anglais.

Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l’ASCII prennent en compte d’autres langues à partir de 1986. Avec le développement de l’internet, l’échange des données s’internationalise de plus en plus, si bien qu’il n’est plus possible de se limiter à un système d’encodage datant des débuts de l’informatique, même avec ses variantes.

Publié pour la première fois en janvier 1991, l’Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère (ou idéogramme). Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L’Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d’écriture de la planète. À la grande satisfaction des linguistes, il remplace progressivement l’ASCII, avec des variantes UTF-8, UTF-16 et UTF-32 (UTF: Unicode Transformation Format) selon le nombre de bits utilisés pour l’encodage.

L'Unicode est maintenu par l'Unicode Consortium. Il devient une composante des spécifications du World Wide Web Consortium (W3C), fondé en octobre 1994 pour promouvoir le développement du web. L’utilisation de l’Unicode se généralise à partir de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII.

# Une tâche énorme

Mais la tâche s’annonce rude. Patrick Rebollar, professeur de français et de littérature française au Japon et modérateur de la liste de diffusion LITOR (Littérature et ordinateur), précise en janvier 2000: «Il s'agit d'abord d'un problème logiciel. Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de la table Unicode devrait résoudre une grande partie des problèmes, mais il faut pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces logiciels entièrement multilingues intéressent moins de clients que les logiciels de navigation.»

Luc Dall’Armellina, co-auteur et webmestre d’oVosite, un espace d’écriture hypermédia, écrit en juin 2000: «Les systèmes d’exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu’il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d’écriture de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie.» Un sentiment prémonitoire puisque l’Unicode ne supplantera l’ASCII qu’en décembre 2007.

1994 > TRAVLANG, DES LANGUES POUR VOYAGER

[Résumé] Les premiers dictionnaires de langues en ligne sont d’un niveau très moyen, mais il faut un début à tout et ils dépannent les voyageurs. En 1994, Michael C. Martin, étudiant en physique, crée d’abord une rubrique intitulée «Foreign Languages for Travelers» sur le site de son université à New York. L'année suivante, il lance Travlang, un site dédié à la fois aux voyages et aux langues, nommé meilleur site de voyages en 1997. En août 1998, la section «Foreign Languages for Travelers» permet d'apprendre les rudiments de soixante langues sur le web. La section «Translating Dictionaries» donne accès à des dictionnaires gratuits dans quinze langues (afrikaans, allemand, danois, espagnol, espéranto, finnois, français, frison, hollandais, hongrois, italien, latin, norvégien, portugais, tchèque). Ces dictionnaires sont le plus souvent sommaires et de qualité inégale. D’autres sections offrent des liens vers des services de traduction, des écoles de langue, des librairies multilingues, etc.

***

Les premiers dictionnaires de langues disponibles sur le web - tels ceux de Travlang - sont d’un niveau très moyen, mais il faut un début à tout. Ils dépannent les voyageurs et fraient une voie aux bons sites de dictionnaires qui suivront ensuite.

En 1994, Michael C. Martin, étudiant en physique, crée d’abord une rubrique intitulée «Foreign Languages for Travelers» sur le site de son université à New York, pour apprendre les langues sur le web. Cette rubrique s'étoffe rapidement et rencontre un grand succès. L'année suivante, il lance Travlang, un site dédié à la fois aux voyages et aux langues, nommé meilleur site de voyages en 1997. Devenu chercheur en physique au Lawrence Berkeley National Laboratory (Californie), Michael continue de gérer Travlang lui- même.

En 1998, la section «Foreign Languages for Travelers» permet d’apprendre les rudiments de soixante langues sur le web. La section «Translating Dictionaries» donne accès à des dictionnaires gratuits dans quinze langues (afrikaans, allemand, danois, espagnol, espéranto, finnois, français, frison, hollandais, hongrois, italien, latin, norvégien, portugais, tchèque). Ces dictionnaires sont le plus souvent sommaires et de qualité inégale.

D’autres sections offrent des liens vers des services de traduction, des écoles de langue, des librairies multilingues, etc. On peut également réserver son hôtel, sa voiture ou son billet d’avion, s’informer des taux de change ou encore consulter un index de 7.000 liens vers d’autres sites de langues et de voyages.

Michael C. Martin écrit en août 1998: «Je pense que le web est un endroit idéal pour rapprocher les cultures et les personnes, et ceci inclut d'être multilingue. Notre site Travlang est très populaire pour cette raison, et les gens aiment le contact avec d'autres parties du monde. (...) L'internet est vraiment un outil important pour communiquer avec des gens avec lesquels on n'aurait pas l'occasion de dialoguer autrement. J'apprécie vraiment la collaboration générale qui a rendu possibles les pages de Foreign Languages for Travelers.»

En ce qui concerne l’avenir, «je pense que les traductions intégrales informatisées vont devenir monnaie courante, et qu'elles permettront de communiquer à la base avec davantage de gens. Ceci aidera aussi à amener davantage l'internet au monde non anglophone.»

Travlang est acquis en février 1999 par la société GourmetMarket.com, puis racheté en janvier 2000 par la société iiGroup. En juillet 2000, le site compte 2 millions de visiteurs par mois. C’est l’époque où on commence à trouver de bons dictionnaires sur l’internet… mais sur d’autres sites, Travlang étant devenu commercial à 200%, dans le pire sens du terme, est désormais uniquement axé sur les voyages.

1995 > L’INTERNET DICTIONARY PROJECT

[Résumé] Tyler Chambers, informaticien, crée d’abord en mai 1994 la Human- Languages Page (H-LP) pour proposer un index des ressources linguistiques disponibles sur l’internet dans diverses langues. Puis il lance en parallèle en 1995 l'Internet Dictionary Project (IDP), à savoir un projet coopératif ouvert à tous pour constituer des dictionnaires en accès libre sur le web, de l'anglais vers d'autres langues (allemand, espagnol, français, italien, latin, portugais). Comme expliqué sur le site web, «le but est de créer des dictionnaires de traduction grâce à l'aide des internautes. Ce site permet aux usagers du monde entier de les consulter et de participer à la traduction de termes anglais dans d'autres langues. Les listes de termes anglais et leurs correspondants dans d'autres langues sont ensuite mis à la disposition de tous sur ce site, sans restriction d'aucune sorte.»

***

Tyler Chambers, informaticien, lance l’Internet Dictionary Project (IDP) en 1995 en tant que projet coopératif ouvert à tous pour constituer des dictionnaires en accès libre sur le web.

Un an auparavant, Tyler crée la Human-Languages Page (H-LP) pour proposer un répertoire de ressources linguistiques. Ce répertoire recense 1.800 ressources dans une centaine de langues en octobre 1998. Ces ressources sont classées dans plusieurs rubriques: langues et littérature, écoles et institutions, ressources linguistiques, produits et services, organismes, emplois et stages, dictionnaires, cours de langues.

Quant à l’Internet Dictionary Project, son but est de créer des dictionnaires de traduction de l'anglais vers d'autres langues (allemand, espagnol, français, italien, latin, portugais).

Comme expliqué à l’époque sur le site web, «le but est de créer des dictionnaires de traduction grâce à l'aide des internautes. Ce site permet aux usagers du monde entier de les consulter et de participer à la traduction de termes anglais dans d'autres langues. Les listes de termes anglais et leurs correspondants dans d'autres langues sont ensuite mis à la disposition de tous sur ce site, sans restriction d'aucune sorte. (...)

L'Internet Dictionary Project a débuté en 1995 pour combler une lacune et procurer des dictionnaires de traduction gratuits à la communauté des internautes et à tous ceux qui s'intéressent à l'informatique. Non seulement il est très utile d'avoir immédiatement accès à des dictionnaires par le World Wide Web, mais ceci permet aussi le développement de logiciels pouvant tirer parti de tels dictionnaires, que ce soit des programmes de traduction ou des vérificateurs d'orthographe ou encore des guides d'apprentissage des langues. En facilitant la création de ces dictionnaires en ligne par des milliers de volontaires, et en les mettant gratuitement à la disposition de tous, l'Internet Dictionary Project espère imprimer sa marque sur l'internet et susciter d'autres projets qui seront plus bénéfiques que de générer des revenus purement financiers.»

Tyler Chambers raconte en septembre 1998 lors d'un entretien par courriel: «Le multilinguisme sur le web était inévitable bien avant que ce médium ne se développe vraiment. Mon premier vrai contact avec le web date de 1994, un peu après ses débuts mais bien avant son expansion. 1994 a été aussi l'année où j'ai débuté mon premier projet web multilingue, et il existait déjà un nombre significatif de ressources linguistiques en ligne. Ceci était antérieur à la création de Netscape. Mosaic était le seul navigateur sur le web, et les pages web étaient essentiellement des documents textuels reliés par des hyperliens. Avec l'amélioration des navigateurs et l'expérience acquise par les usagers, je ne pense pas qu'il existe une langue vivante qui ne soit pas maintenant représentée sur le web, que ce soit la langue des Indiens d'Amérique ou les dialectes moyen-orientaux. De même une pléthore de langues mortes peut maintenant trouver une audience nouvelle avec des érudits et autres spécialistes en ligne. (…)

Bien que je ne sois pas multilingue, ni même bilingue moi-même, je suis conscient du fait que très peu de domaines ont une importance comparable à celle des langues et du multilinguisme. (…) Dans l'ensemble, je pense que le web est important pour la sensibilisation aux langues et pour les questions culturelles. Dans quel autre endroit peut-on chercher au hasard pendant vingt minutes et trouver des informations susceptibles de vous intéresser dans trois langues différentes sinon plus? (…)

Dire que l'internet aiguillonne le multilinguisme est à mon sens une opinion fausse. C'est la communication qui aiguillonne le multilinguisme et l'échange multiculturel. L'internet est seulement le mode de communication le plus récent qui soit accessible aux gens plus ou moins ordinaires. (…) Les langues deviendront encore plus importantes qu'elles ne le sont lorsque tout le monde pourra communiquer à l'échelle de la planète (à travers le web, les discussions, les jeux, le courrier électronique, ou toute application appartenant encore au domaine de l'avenir).»

Au printemps 2001, la Human-Languages Page fusionne avec le Languages Catalog, une section de la WWW Virtual Library, pour devenir iLoveLanguages. En septembre 2003, iLoveLanguages offre 2.000 ressources linguistiques dans une centaine de langues. Quant à l'Internet Dictionary Project, Tyler Chambers y met fin en janvier 2007, faute de temps, tout en laissant les dictionnaires existants tels quels pour consultation ou téléchargement.

1995 > NETGLOS, GLOSSAIRE DE L'INTERNET

[Résumé] NetGlos - abrégé de «Multilingual Glossary of Internet Terminology» - est lancé en 1995 à l'initiative du WorldWide Language Institute (WWLI), un institut enseignant les langues via l'internet. NetGlos est un projet collaboratif en treize langues (allemand, anglais, chinois, croate, espagnol, français, grec, hébreu, hollandais/flamand, italien, maori, norvégien, portugais), avec la participation de nombreux traducteurs volontaires et autres professionnels des langues dans le monde entier. Comme expliqué en septembre 1998 par Brian King, directeur du WorldWide Language Institute, «avant qu'un nouveau terme ne soit accepté comme le terme correct, il y a une période d'instabilité avec plusieurs candidats en compétition. Souvent un terme emprunté à l'anglais est le point de départ et, dans de nombreux cas, il est aussi le point d'arrivée. Finalement émerge un vainqueur qui est ensuite utilisé aussi bien dans les dictionnaires techniques que dans le vocabulaire quotidien de l'usager non spécialiste.»

***

NetGlos - abrégé de «Multilingual Glossary of Internet Terminology» - est un glossaire coopératif lancé en 1995 à l'initiative du WorldWide Language Institute (WWLI), un institut enseignant les langues via l’internet.

Trois ans plus tard, NetGlos est disponible en treize langues (allemand, anglais, chinois, croate, espagnol, français, grec, hébreu, hollandais/flamand, italien, maori, norvégien, portugais), avec la participation de nombreux traducteurs et autres professionnels des langues dans le monde entier.

Brian King, directeur du WorldWide Language Institute, explique en septembre 1998: «Une grande partie de la terminologie technique disponible sur le web n'est pas encore traduite dans d'autres langues [que l’anglais]. Et, comme nous nous en sommes rendus compte dans NetGlos, la traduction de ces termes n'est pas toujours facile. Avant qu'un nouveau terme ne soit accepté comme le terme correct, il y a une période d'instabilité avec plusieurs candidats en compétition. Souvent un terme emprunté à l'anglais est le point de départ et, dans de nombreux cas, il est aussi le point d'arrivée. Finalement émerge un vainqueur qui est ensuite utilisé aussi bien dans les dictionnaires techniques que dans le vocabulaire quotidien de l'usager non spécialiste. La dernière version de NetGlos est la version russe, et elle devrait être disponible dans deux semaines environ [à savoir fin septembre 1998]. Elle sera sans nul doute un excellent exemple du processus dynamique en cours pour la russification de la terminologie du web.»

Quelles sont les perspectives? «La technologie change à une allure frénétique. L'apprentissage durant toute la vie est une stratégie que nous devons tous adopter si nous voulons rester en tête et être compétitifs. C'est une tâche qui est déjà assez difficile dans un environnement anglophone. Si nous ajoutons à cela la complexité apportée par la communication dans un cyberespace multilingue et multiculturel, la tâche devient encore plus astreignante. Probablement davantage encore que par le passé, la coopération est aussi indispensable que la concurrence. Les germes d'une coopération par le biais de l'internet existent déjà. Notre projet NetGlos dépend du bon vouloir de traducteurs volontaires dans de nombreux pays: Canada, États-Unis, Autriche, Norvège, Belgique, Israël, Portugal, Russie, Grèce, Brésil, Nouvelle- Zélande, etc. À mon avis, les centaines de visiteurs qui consultent quotidiennement les pages de NetGlos constituent un excellent témoignage du succès de ce type de relations de travail. Les relations de coopération s'accroîtront encore à l'avenir, mais pas nécessairement sur la base du volontariat.»

1995 > PLUSIEURS LANGUES SUR NOTRE ÉCRAN

[Résumé] Comment se débrouiller pour afficher plusieurs langues à l’écran? Yoshi Mikami, informaticien à Fujisawa (Japon), lance d’abord un site web en décembre 1995 avant d’écrire le premier livre sur le sujet en août 1997. Son site bilingue anglais-japonais «The Languages of the World by Computers and the Internet» est plus connu sous le nom de Kotoba Home Page ou Logos Home Page (à ne pas confondre avec le site de la société de traduction Logos, lancé deux ans plus tard). La Kotoba Home Page donne un bref historique de chaque langue, ses caractéristiques, sa phonétique, son jeu de caractères et son encodage informatique. Fort de cette expérience, Yoshi Mikami co-écrit ensuite (avec Kenji Sekine et Nobutoshi Kohara) le premier livre sur le sujet, «Pour un web multilingue», publié en japonais par les éditions O’Reilly en août 1997 avant d'être traduit l’année suivante en anglais, en allemand et en français.

***

Comment se débrouiller pour afficher plusieurs langues à l’écran? Yoshi Mikami lance d’abord un site web en décembre 1995 avant de publier le premier livre au monde sur le sujet en août 1997.

Yoshi Mikami, qui travaille à l’époque comme informaticien chez Asia Info Network à Fujisawa (Japon), lance le site bilingue anglais-japonais «The Languages of the World by Computers and the Internet», plus connu sous le nom de Logos Home Page ou Kotoba Home Page. Fort de cette expérience, il co-écrit ensuite (avec Kenji Sekine et Nobutoshi Kohara) le premier livre sur le sujet, «Pour un web multilingue», publié en japonais par les éditions O’Reilly Media en août 1997 avant d'être traduit l’année suivante en anglais, en allemand et en français.

Yoshi raconte en décembre 1998: «Ma langue maternelle est le japonais. Comme j'ai suivi mes études de troisième cycle aux États-Unis et que j'ai travaillé dans l'informatique, je suis devenu bilingue japonais/anglais américain. J'ai toujours été intéressé par différentes langues et cultures, aussi j'ai appris le russe, le français et le chinois dans la foulée. À la fin de 1995, j'ai créé sur le web "The Languages of the World by Computers and the Internet" et j'ai tenté de donner - en anglais et en japonais - un bref historique des six principales langues utilisées sur l’internet, ainsi que les caractéristiques propres à chaque langue, sa phonétique, son jeu de caractères et son encodage informatique. Suite à l'expérience acquise, j'ai invité mes deux associés à écrire un livre sur la conception, la création et la présentation de pages web multilingues, livre qui fut publié en août 1997 dans son édition japonaise, le premier livre au monde sur un tel sujet.»

Plus généralement, «il y a des milliers d'années de cela, en Égypte, en Chine et ailleurs, les gens étaient plus sensibles au fait de communiquer leurs lois et leurs réflexions non seulement dans une langue mais dans plusieurs. Dans notre monde moderne, chaque État a le plus souvent adopté une seule langue de communication. À mon avis, l'internet verra l'utilisation plus grande de langues différentes et de pages multilingues - et pas seulement une gravitation autour de l'anglais américain - et un usage plus créatif de la traduction informatique multilingue. 99% des sites web créés au Japon sont en japonais!»

1995 > GLOBAL REACH, POUR LOCALISER LES SITES WEB

[Résumé] Bill Dunlap est le fondateur de Euro-Marketing Associates, une société de conseil en marketing qu'il lance en 1985 à Paris et San Francisco. En 1995, il restructure cette société en service de conseil en ligne dénommé Global Reach, le but étant de promouvoir les sites web des entreprises américaines dans d'autres pays, afin d'attirer plus de visiteurs, et donc d'augmenter les ventes. Cette méthode comprend la traduction d'un site web dans plusieurs langues, la promotion active du site, et enfin l'accroissement de la fréquentation locale au moyen de bandeaux publicitaires ciblés. Bill Dunlap explique en décembre 1998: «Promouvoir un site est aussi important que le créer, sinon plus. On doit être préparé à utiliser au moins autant de temps et d'argent à promouvoir son site qu'on en a passé à l'origine à le créer. Le programme Global Reach permet de promouvoir un site dans des pays non anglophones, afin d'atteindre une clientèle plus large... et davantage de ventes.»

***

La société Global Reach se spécialise d’emblée dans l’internationalisation des sites web, tout comme leur localisation dans plusieurs langues.

Bill Dunlap fonde d’abord Euro-Marketing Associates, une société de conseil en marketing qu'il lance en 1985 à Paris et San Francisco. En 1995, il restructure cette société en service de conseil en ligne dénommé Global Reach, le but étant de promouvoir les sites web des entreprises américaines dans d'autres pays, afin d'attirer plus de visiteurs, et donc d'augmenter les ventes. Cette méthode comprend la traduction d'un site web dans plusieurs langues, la promotion active du site, et enfin l'accroissement de la fréquentation locale au moyen de bandeaux publicitaires ciblés.

Bill Dunlap explique en décembre 1998: «Il y a très peu de gens aux États-Unis qui sont intéressés de communiquer dans plusieurs langues. Pour la plupart, ils pensent encore que le monde entier parle anglais. Par contre, en Europe, les pays sont petits, si bien que, depuis des siècles, une perspective internationale est nécessaire. (…)

Depuis 1981, début de mon activité professionnelle, j'ai été impliqué dans la venue de sociétés américaines en Europe. Ceci est pour beaucoup un problème de langue, puisque leurs informations commerciales doivent être disponibles dans les langues européennes pour être prises en compte en Europe. Comme le web est devenu populaire en 1995, j'ai donné à ces activités une dimension "en ligne", et j'en suis venu à promouvoir le cybercommerce européen auprès de mes compatriotes américains. (...)

Promouvoir un site est aussi important que le créer, sinon plus. On doit être préparé à utiliser au moins autant de temps et d'argent à promouvoir son site qu'on en a passé à l'origine à le créer. Le programme Global Reach permet de promouvoir un site dans des pays non anglophones, afin d'atteindre une clientèle plus large... avec davantage de ventes. Une société a de nombreuses bonnes raisons de considérer sérieusement le marché international. Global Reach est pour elle le moyen d'étendre son site web à de nombreux pays, de le présenter à des visiteurs en ligne dans leur propre langue, et de pénétrer le réseau de commerce en ligne présent dans ces pays.»

Bill Dunlap ajoute en juillet 1999: «Une fois que la page d'accueil d'un site est disponible en plusieurs langues, l'étape suivante est le développement du contenu dans chaque langue. Un webmestre notera quelles langues attirent plus de visiteurs (et donc plus de ventes) que d'autres. Ce seront dans ces langues que débutera une campagne de promotion multilingue sur le web. Parallèlement, il est toujours bon de continuer à augmenter le nombre de langues dans lesquelles un site web est disponible. Au début, seule la page d'accueil traduite en plusieurs langues suffit, mais ensuite il est souhaitable de développer un véritable secteur pour chaque langue.»

1996 > ONE LOOK DICTIONARIES, POINT D'ACCÈS COMMUN