Le Livre 010101, Tome 2 (1998-2003)

Chapter 13

Chapter 133,484 wordsPublic domain

Tôt ou tard, le pourcentage des langues sur le réseau correspondra-t-il à leur répartition sur la planète? Rien n’est moins sûr à l’heure de la fracture numérique entre riches et pauvres, entre zones rurales et zones urbaines, entre régions favorisées et régions défavorisées, entre l’hémisphère nord et l’hémisphère sud, entre pays développés et pays en développement. Selon Zina Tucsnak, ingénieure d’études à l’ATILF (Analyse et traitement informatique de la langue française), interviewée en octobre 2000, "le meilleur moyen serait l’application d’une loi par laquelle on va attribuer un 'quota' à chaque langue. Mais n’est-ce pas une utopie de demander l’application d’une telle loi dans une société de consommation comme la nôtre?" Interviewé à la même date, Emmanuel Barthe, documentaliste juridique, exprime un avis contraire: "Des signes récents laissent penser qu’il suffit de laisser les langues telles qu’elles sont actuellement sur le web. En effet, les langues autres que l’anglais se développent avec l’accroissement du nombre de sites web nationaux s’adressant spécifiquement aux publics nationaux, afin de les attirer vers internet. Il suffit de regarder l’accroissement du nombre de langues disponibles dans les interfaces des moteurs de recherche généralistes."

= Le français sur le réseau

Dès le milieu des années 1990, quelques pionniers œuvrent pour le développement du français sur le réseau, par exemple Jean-Pierre Cloutier ou Olivier Bogros.

En novembre 1994, Jean-Pierre Cloutier, journaliste québécois, décide de passer en revue le web francophone dans une chronique hebdomadaire qu’il intitule Les Chroniques de Cybérie. "Au début, les Chroniques traitaient principalement des nouveautés (nouveaux sites, nouveaux logiciels), relate-t-il en juin 1998. Mais graduellement on a davantage traité des questions de fond du réseau, puis débordé sur certains points d'actualité nationale et internationale dans le social, le politique et l'économique."

En juin 1996, Olivier Bogros, bibliothécaire français, crée la Bibliothèque électronique de Lisieux, l’une des premières bibliothèques numériques francophones. "Les bibliothèques ont la possibilité d’élargir leur public en direction de toute la francophonie, explique-t-il en juin 1998. Cela passe par la mise en ligne d’un contenu qui n’est pas seulement la mise en ligne du catalogue, mais aussi et surtout la constitution de véritables bibliothèques virtuelles."

Deux exemples parmi d’autres puisque les initiatives individuelles et collectives ont fleuri, d’abord au Québec, ensuite en Europe et maintenant en Afrique.

Bakayoko Bourahima, bibliothécaire à l’ENSEA (Ecole nationale supérieure de statistique et d’économie appliquée) d’Abidjan, écrit en juillet 2000: "Pour nous les Africains francophones, le diktat de l’anglais sur la toile représente pour la masse un double handicap d’accès aux ressources du réseau. Il y a d’abord le problème de l’alphabétisation qui est loin d’être résolu et que l’internet va poser avec beaucoup plus d’acuité, ensuite se pose le problème de la maîtrise d’une seconde langue étrangère et son adéquation à l’environnement culturel. En somme, à défaut de multilinguisme, l’internet va nous imposer une seconde colonisation linguistique avec toutes les contraintes que cela suppose. Ce qui n’est pas rien quand on sait que nos systèmes éducatifs ont déjà beaucoup de mal à optimiser leurs performances, en raison, selon certains spécialistes, des contraintes de l’utilisation du français comme langue de formation de base. Il est donc de plus en plus question de recourir aux langues vernaculaires pour les formations de base, pour 'désenclaver' l’école en Afrique et l’impliquer au mieux dans la valorisation des ressources humaines. Comment faire? Je pense qu’il n’y a pas de chance pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques s’investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier leurs différentes spécificités internes."

Richard Chotin, professeur à l’Ecole supérieure des affaires (ESA) de Lille, rappelle à juste titre que la suprématie de l’anglais a succédé à celle du français. "Le problème est politique et idéologique: c’est celui de l’'impérialisme' de la langue anglaise découlant de l’impérialisme américain, explique-t-il en septembre 2000. Il suffit d’ailleurs de se souvenir de l’'impérialisme' du français aux 18e et 19e siècles pour comprendre la déficience en langues des étudiants français: quand on n’a pas besoin de faire des efforts pour se faire comprendre, on n’en fait pas, ce sont les autres qui les font."

= Les langues "minoritaires"

De plus, cet impérialisme linguistique, politique et idéologique n’est-il pas universel, malheureusement? La France elle aussi n’est pas sans exercer pression pour imposer la suprématie de la langue française sur d’autres langues, comme en témoigne Guy Antoine, créateur du site Windows on Haiti, qui écrit en juin 2001:"J’ai fait de la promotion du kreyòl (créole haïtien) une cause personnelle, puisque cette langue est le principal lien unissant tous les Haïtiens, malgré l’attitude dédaigneuse d’une petite élite haïtienne - à l’influence disproportionnée - vis-à-vis de l’adoption de normes pour l’écriture du kreyòl et le soutien de la publication de livres et d’informations officielles dans cette langue. A titre d’exemple, il y avait récemment dans la capitale d’Haïti un salon du livre de deux semaines, à qui on avait donné le nom de 'Livres en folie'. Sur les 500 livres d’auteurs haïtiens qui étaient présentés lors du salon, il y en avait une vingtaine en kreyòl, ceci dans le cadre de la campagne insistante que mène la France pour célébrer la francophonie dans ses anciennes colonies. A Haïti cela se passe relativement bien, mais au détriment direct de la créolophonie.

En réponse à l’attitude de cette minorité haïtienne, j’ai créé sur mon site web Windows on Haiti deux forums de discussion exclusivement en kreyòl. Le premier forum regroupe des discussions générales sur toutes sortes de sujets, mais en fait ces discussions concernent principalement les problèmes socio-politiques qui agitent Haïti. Le deuxième forum est uniquement réservé aux débats sur les normes d’écriture du kreyòl. Ces débats sont assez animés, et un certain nombre d’experts linguistiques y participent. Le caractère exceptionnel de ces forums est qu’ils ne sont pas académiques. Je n’ai trouvé nulle part ailleurs sur l’internet un échange aussi spontané et aussi libre entre des experts et le grand public pour débattre dans une langue donnée des attributs et des normes de la même langue."

En septembre 2000, Guy Antoine a pour projet de rejoindre l’équipe dirigeante de Mason Integrated Technologies, dont l’objectif est de créer des outils permettant l’accessibilité des documents créés dans des langues dites minoritaires. "Etant donné l’expérience de l’équipe en la matière, nous travaillons d’abord sur le créole haïtien (kreyòl), qui est la seule langue nationale d’Haïti, et l’une des deux langues officielles, l’autre étant le français. Cette langue ne peut guère être considérée comme une langue minoritaire dans les Caraïbes puisqu’elle est parlée par huit à dix millions de personnes."

Autre expérience, celle de Caoimhín Ó Donnaíle, professeur d’informatique à l’Institut Sabhal Mór Ostaig, situé sur l’île de Skye, en Ecosse. Il dispense ses cours en gaélique écossais. Il est aussi le webmestre du site de l’institut, bilingue anglais-gaélique, qui se trouve être la principale source d’information mondiale sur le gaélique écossais. Sur ce site, il tient à jour European Minority Languages, une liste de langues minoritaires elle aussi bilingue, avec classement par ordre alphabétique de langues et par famille linguistique. Interviewé en mai 2001, il raconte: "Nos étudiants utilisent un correcteur d’orthographe en gaélique et une base terminologique en ligne en gaélique. (...) Il est maintenant possible d’écouter la radio en gaélique (écossais et irlandais) en continu sur l’internet partout dans le monde. Une réalisation particulièrement importante a été la traduction en gaélique du logiciel de navigation Opera. C’est la première fois qu’un logiciel de cette taille est disponible en gaélique."

Plus généralement, "en ce qui concerne l’avenir des langues menacées, l’internet accélère les choses dans les deux sens. Si les gens ne se soucient pas de préserver les langues, l’internet et la mondialisation qui l’accompagne accéléreront considérablement la disparition de ces langues. Si les gens se soucient vraiment de les préserver, l’internet constituera une aide irremplaçable."

En 1999, Robert Beard co-fonde yourDictionary.com, portail de référence pour toutes les langues sans exception, avec une section importante consacrée aux langues menacées (Endangered Language Repository). "Les langues menacées sont essentiellement des langues non écrites, écrit-il en janvier 2000. Un tiers seulement des quelque 6.000 langues existant dans le monde sont à la fois écrites et parlées. Je ne pense pourtant pas que le web va contribuer à la perte de l’identité des langues et j’ai même le sentiment que, à long terme, il va renforcer cette identité. Par exemple, de plus en plus d’Indiens d’Amérique contactent des linguistes pour leur demander d’écrire la grammaire de leur langue et de les aider à élaborer des dictionnaires. Pour eux, le web est un instrument à la fois accessible et très précieux d’expression culturelle."

9.3. L’importance de la traduction

= Un nombre de traductions insuffisant

L’internet étant une source d’information à vocation mondiale, il semble indispensable d’augmenter fortement les activités de traduction. Auteur des Chroniques de Cybérie, chronique hebdomadaire des actualités du réseau, Jean-Pierre Cloutier déplore en août 1999 "qu’il se fasse très peu de traductions des textes et essais importants qui sont publiés sur le web, tant de l’anglais vers d’autres langues que l’inverse. (...) La nouveauté d’internet dans les régions où il se déploie présentement y suscite des réflexions qu’il nous serait utile de lire. À quand la traduction des penseurs hispanophones et autres de la communication?" Professeure d’espagnol en entreprise et traductrice, Maria Victoria Marinetti écrit à la même date: "Il est très important de pouvoir communiquer en différentes langues. Je dirais même que c’est obligatoire, car l’information donnée sur le net est à destination du monde entier, alors pourquoi ne l’aurions-nous pas dans notre propre langue ou dans la langue que nous souhaitons lire? Information mondiale, mais pas de vaste choix dans les langues, ce serait contradictoire, pas vrai?"

Si toutes les langues sont désormais représentées, on oublie trop souvent que de nombreux usagers sont unilingues. C'est le cas de Miriam Mellman, qui travaille dans le service de télévente du San Francisco Chronicle, un quotidien à fort tirage. "Ce serait formidable que des gens paresseux comme moi puissent disposer de programmes de traduction instantanée, raconte-t-elle en juin 2000. Même si je décide d’apprendre une autre langue que l’anglais, il en existe bien d’autres, et ceci rendrait la communication plus facile." Ce souhait est également partagé par ceux qui parlent plusieurs langues, comme Gérard Fourestier, créateur du site Rubriques à Bac, ensemble de bases de données pour les lycéens et les étudiants. "Je suis de langue française, écrit-il en octobre 2000. J’ai appris l’allemand, l’anglais, l’arabe, mais je suisencore loin du compte quand je surfe dans tous les coins de la planète. Il serait dommage que les plus nombreux ou les plus puissants soient les seuls qui 's’affichent' et, pour ce qui est des logiciels de traduction, il y a encore largement à faire."

Il importe en effet d’avoir à l’esprit l’ensemble des langues et pas seulement les langues dominantes, comme le souligne en février 2001 Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D: "Les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l’émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne...). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues."

= La traduction automatique

Il va sans dire que la traduction automatique n’offre pas la qualité de travail des professionnels de la traduction, et qu’il est très préférable de faire appel à ces derniers quand on a le temps et l’argent nécessaires. Les logiciels de traduction sont toutefois très pratiques pour fournir un résultat immédiat et à moindres frais, sinon gratuit. Des logiciels en accès libre sur l’internet permettent de traduire en quelques secondes une page web ou un texte court, avec plusieurs combinaisons de langues possibles.

Le but d’un logiciel de traduction automatique est d’analyser le texte dans la langue source (texte à traduire) et de générer automatiquement le texte correspondant dans la langue cible (texte traduit), en utilisant des règles précises pour le transfert de la structure grammaticale. Comme l’explique l’EAMT (European Association for Machine Translation) sur son site, "il existe aujourd’hui un certain nombre de systèmes produisant un résultat qui, s’il n’est pas parfait, est de qualité suffisante pour être utile dans certaines applications spécifiques, en général dans le domaine de la documentation technique. De plus, les logiciels de traduction, qui sont essentiellement destinés à aider le traducteur humain à produire des traductions, jouissent d’une popularité croissante auprès des organismes professionnels de traduction."

En 1998, un historique de la traduction automatique était présent sur le site de Globalink, société spécialisée dans les produits et services de traduction. Le site a depuis disparu, Globalink ayant été racheté en 1999 par Lernout & Hauspie (lui-même racheté en 2002 par ScanSoft). Voici cet historique résumé dans les deux paragraphes qui suivent.

La traduction automatique et le traitement de la langue naturelle font leur apparition à la fin des années 1930, et progressent ensuite de pair avec l’évolution de l’informatique quantitative. Pendant la deuxième guerre mondiale, le développement des premiers ordinateurs programmables bénéficie des progrès de la cryptographie et des efforts faits pour tenter de fissurer les codes secrets allemands et autres codes de guerre. Suite à la guerre, dans le secteur émergent des technologies de l’information, on continue de s’intéresser de près à la traduction et à l’analyse du texte en langue naturelle. Dans les années 1950, la recherche porte sur la traduction littérale, à savoir la traduction mot à mot sans prise en compte des règles linguistiques. Le projet russe débuté en 1950 à l’Université de Georgetown représente la première tentative systématique visant à créer un système de traduction automatique utilisable. Tout au long des années 1950 et au début des années 1960, des recherches sont également menées en Europe et aux Etats-Unis. En 1965, les progrès rapides en linguistique théorique culminent avec la publication d’Aspects de la théorie syntaxique, de Noam Chomsky, qui propose de nouvelles définitions de la phonologie, la morphologie, la syntaxe et la sémantique du langage humain. Toutefois, en 1966, un rapport officiel américain donne une estimation prématurément négative des systèmes de traduction automatique, mettant fin au financement et à l’expérimentation dans ce domaine pour la décennie suivante.

Il faut attendre la fin des années 1970 pour que des expériences sérieuses soient à nouveau entreprises, parallèlement aux progrès de l’informatique et des technologies des langues. Cette période voit aussi le développement de systèmes de transfert d’une langue à l’autre et le lancement des premières tentatives commerciales. Des sociétés comme Systran et Metal sont persuadées de la viabilité et de l’utilité d’un tel marché. Elles mettent sur pied des produits et services de traduction automatique reliés à un serveur central. Mais les problèmes restent nombreux: des coûts élevés de développement, un énorme travail lexicographique, la difficulté de proposer de nouvelles combinaisons de langues, l’inaccessibilité de tels systèmes pour l’utilisateur moyen, et enfin la difficulté de passer à de nouveaux stades de développement.

En 1999 et 2000, la généralisation de l’internet et les débuts du commerce électronique provoquent la naissance d’un véritable marché. Trois sociétés – Systran, Softissimo et Lernout & Hauspie – lancent des produits à destination du grand public, des professionnels et des industriels.

Systran développe un logiciel de traduction utilisé notamment par le moteur de recherche AltaVista. Softissimo commercialise la série de logiciels de traduction Reverso, à côté de produits d’écriture multilingue, de dictionnaires électroniques et de méthodes de langues. Reverso équipe par exemple Voilà, le moteur de recherche de France Télécom. Lernout & Hauspie (racheté depuis par ScanSoft) propose des produits et services en dictée, traduction, compression vocale, synthèse vocale et documentation industrielle.

En mars 2001, IBM se lance à son tour dans un marché en pleine expansion. Il commercialise un produit professionnel haut de gamme, le WebSphere Translation Server. Ce logiciel traduit instantanément en plusieurs langues (allemand, anglais, chinois, coréen, espagnol, français, italien, japonais) des pages web, des courriers électroniques et des dialogues en direct (chats). Il interprète 500 mots à la seconde et permet l’ajout de vocabulaires spécifiques.

En juin 2001, les sociétés Logos et Y.A. Champollion s’associent pour créer Champollion Wordfast, une société de services d’ingénierie en traduction et localisation et en gestion de contenu multilingue. Wordfast est un logiciel de traduction automatique avec terminologie disponible en temps réel, contrôle typographique et compatibilité avec le WebSphere Translation Server d'IBM, les logiciels de TMX et ceux de Trados. Une version simplifiée de Wordfast est téléchargeable gratuitement, tout comme le manuel d’utilisation, disponible en 16 langues différentes.

De nombreux organismes publics participent eux aussi à la R&D (recherche et développement) en traduction automatique. Voici trois exemples parmi d’autres, l’un dans la communauté anglophone, l’autre dans la communauté francophone, le troisième dans la communauté internationale.

Rattaché à l’USC/ISI (University of Southern California / Information Sciences Institute), le Natural Language Group traite de plusieurs aspects du traitement de la langue naturelle: traduction automatique, résumé automatique de texte, gestion multilingue des verbes, développement de taxinomies de concepts (ontologies), génération de texte, élaboration de gros lexiques multilingues et communication multimédia.

Au sein du laboratoire CLIPS (Communication langagière et interaction personne-système) de l’Institut d’informatique et mathématiques appliquées (IMAG) de Grenoble, le GETA (Groupe d’étude pour la traduction automatique) est une équipe pluridisciplinaire formée d’informaticiens et de linguistes. Ses thèmes de recherche concernent tous les aspects théoriques, méthodologiques et pratiques de la traduction assistée par ordinateur (TAO), et plus généralement de l’informatique multilingue.

Le GETA participe entre autres à l’élaboration de l’UNL (universal networking language), un métalangage numérique destiné à l’encodage, au stockage, à la recherche et à la communication d’informations multilingues indépendamment d’une langue source donnée. Ce métalangage est développé par l’UNL Program, un programme international impliquant de nombreux partenaires dans toutes les communautés linguistiques. Créé dans le cadre de l’UNU/IAS (United Nations University / Institute of Advanced Studies), ce programme se poursuit désormais sous l’égide de l’UNDL Foundation (UNDL: Universal Networking Digital Language).

CONCLUSION

Si le ralentissement de la nouvelle économie observé depuis la fin 2000 affecte l’industrie du livre, le développement du livre numérique ne semble pas subir de contre-coup majeur. Le tout est de ne pas le limiter à son aspect commercial, et de cesser de l’opposer au livre imprimé pour le considérer plutôt comme un mode de diffusion complémentaire. Le livre numérique est encore dans l’enfance, et de nombreuses questions restent posées quant à sa présentation, sa distribution et ses supports de lecture.

= Le rôle de l’internet

L’internet est devenu le principal véhicule de l’information, que celle-ci transite par le courrier électronique, les listes de diffusion, les forums de discussion, la presse électronique, les sites web, etc. Sous-ensemble de l’internet, le web doit rester cet outil de communication et de diffusion créé en 1990 pour favoriser les échanges au niveau personnel, local et global, en dépit des pressions exercées par les multinationales et autres canaux dirigistes pour contrôler cette information.

Lucie de Boutiny, romancière multimédia, écrit en juin 2000: "Des stratégies utopistes avaient été mises en place mais je crains qu’internet ne soit plus aux mains d’internautes comme c’était le cas. L’intelligence collective virtuelle pourtant se défend bien dans divers forums ou listes de discussions, et ça, à défaut d’être souvent efficace, c’est beau. Dans l’utopie originelle, on aurait aimé profiter de ce nouveau média, notamment de communication, pour sortir de cette tarte à la crème qu’on se reçoit chaque jour, merci à la société du spectacle, et ne pas répéter les erreurs de la télévision qui n’est, du point de vue de l’art, jamais devenue un média de création ambitieux."

Xavier Malbreil, auteur hypermédia, est plus optimiste. "Concernant l’avenir de l’internet, je le crois illimité, explique-t-il en mars 2001. Il ne faut pas confondre les gamelles que se prennent certaines start-up trop gourmandes, ou dont l’objectif était mal défini, et la réalité du net. Mettre des gens éloignés en contact, leur permettre d’interagir, et que chacun, s’il le désire, devienne son propre fournisseur de contenu, c’est une révolution dont nous n’avons pas encore pris toute la mesure."

Cet optimisme est partagé par Christian Vandendorpe, professeur à l’Université d’Ottawa, interviewé à la même date: "Cet outil fabuleux qu’est le web peut accélérer les échanges entre les êtres, permettant des collaborations à distance et un épanouissement culturel sans précédent. Mais cet espace est encore fragile. (...) Il existe cependant des signes encourageants, notamment dans le développement des liaisons de personne à personne et surtout dans l’immense effort accompli par des millions d’internautes partout au monde pour en faire une zone riche et vivante."

= La convergence multimédia

L’industrie du livre subit le contrecoup de ce qu’on appelle la convergence multimédia. Celle-ci peut être définie comme la convergence des secteurs de l’informatique, du téléphone, de la radio et de la télévision dans une industrie de la communication et de la distribution utilisant les mêmes autoroutes de l’information. Cette convergence entraîne l’unification progressive des secteurs liés à l’information (imprimerie, édition, presse, conception graphique, enregistrements sonores, films, etc.). Ces secteurs utilisent désormais les mêmes techniques de numérisation pour le traitement du texte, du son et de l’image alors que, par le passé, ce traitement était assuré par divers procédés sur des supports différents (papier pour l’écriture, bande magnétique pour la musique, celluloïd pour le cinéma).