Chapter 3
Geoffrey Kingscott est directeur général de Praetorius, une société britannique spécialisée en linguistique appliquée. Il explique en septembre 1998: «Les caractéristiques propres au web sont la multiplicité de générateurs de sites et le bas prix de l'émission de messages. Ceci favorisera donc le multilinguisme au fur et à mesure du développement du web. Comme celui-ci a vu le jour aux États-Unis, il est encore principalement en anglais, mais ce n'est qu'un phénomène temporaire. Pour expliquer ceci plus en détail, je dirais que, quand nous comptions sur l'imprimé ou l'audiovisuel (film, télévision, radio, vidéo, cassettes), l'information ou le divertissement que nous attendions dépendait d'agents (éditeurs, stations de télévision ou de radio, producteurs de cassettes ou de vidéos) qui devaient subsister commercialement et, dans le cas de la radio-télédiffusion du service public, avec de sévères contraintes budgétaires. Ceci signifie que la quantité de clients est primordiale, et détermine la nécessité de langues autres que l'omniprésent anglais. Ces contraintes disparaissent avec le web.
Pour ne donner qu'un exemple mineur tiré de notre expérience, nous publions la version imprimée de notre magazine Language Today uniquement en anglais, qui est le dénominateur commun de nos lecteurs. Quand nous utilisons un article qui était originellement dans une autre langue que l'anglais, ou que nous relatons un entretien mené dans une autre langue que l'anglais, nous le traduisons en anglais et nous ne publions que la version anglaise, pour la raison suivante: le nombre de pages que nous pouvons imprimer est limité, et déterminé en fonction de notre clientèle (annonceurs et abonnés). Par contre, dans notre version web, nous proposons aussi la version originale.»
= Commentaires francophones
Luc dall'Armellina, co-auteur et webmestre d'oVosite, un espace d'écriture hypermédia, écrit en juin 2000: «L'anglais s'impose sans doute parce qu'il est devenu la langue commerciale d'échange généralisée; il semble important que toutes les langues puissent continuer à être représentées parce que chacune d'elle est porteuse d'une vision "singulière" du monde. La traduction simultanée (proposée par AltaVista par exemple) ou les versions multilingues d'un même contenu me semblent aujourd'hui les meilleures réponses au danger de pensée unique que représenterait une seule langue d'échange. Peut-être appartient-il aux éditeurs des systèmes d'exploitation (ou de navigateurs?) de proposer des solutions de traduction partielle, avec toutes les limites connues des systèmes automatiques de traduction...»
Pierre François Gagnon, fondateur d'Éditel et pionnier de l'édition littéraire francophone en ligne, écrit en juillet 2000: «Je pense que, si les diverses langues de la planète vont occuper chacune l'internet en proportion de leur poids démographique respectif, la nécessité d'une langue véhiculaire unique se fera sentir comme jamais auparavant, ce qui ne fera qu'assurer davantage encore la suprématie planétaire de l'anglais, ne serait-ce que du fait qu'il a été adopté définitivement par l'Inde et la Chine. Or la marche de l'histoire n'est pas plus comprimable dans le dé à coudre d'une quelconque équation mathématique que le marché des options en bourse!»
Philippe Loubière, traducteur littéraire et dramatique, dénonce pour sa part la main-mise anglophone sur le réseau. «Tout ce qui peut contribuer à la diversité linguistique, sur internet comme ailleurs, est indispensable à la survie de la liberté de penser, explique-t-il en mars 2001. Je n'exagère absolument pas: l'homme moderne joue là sa survie. Cela dit, je suis très pessimiste devant cette évolution. Les Anglo-saxons vous écrivent en anglais sans vergogne. L'immense majorité des Français constate avec une indifférence totale le remplacement progressif de leur langue par le mauvais anglais des marchands et des publicitaires, et le reste du monde a parfaitement admis l'hégémonie linguistique des Anglo-saxons parce qu'ils n'ont pas d'autres horizons que de servir ces riches et puissants maîtres. La seule solution consisterait à recourir à des législations internationales assez contraignantes pour obliger les gouvernements nationaux à respecter et à faire respecter la langue nationale dans leur propre pays (le français en France, le roumain en Roumanie, etc.), cela dans tous les domaines et pas seulement sur internet. Mais ne rêvons pas...»
C'est aussi le sentiment de Blaise Rosnay, webmestre du site du Club des poètes, qui écrit en janvier 2000: «Dans la mesure où la culture française, y compris contemporaine, pourra être diffusée sans obstacles, la langue française aura la possibilité de rester vivante sur le réseau. Ses oeuvres, liées au génie de notre langue, susciteront nécessairement de l'intérêt puisqu'elles sont en prise avec l'évolution actuelle de l'esprit humain. Dans la mesure où il y aura une volonté d'utiliser l'internet comme moyen de partage de la connaissance, de la beauté, de la culture, toutes les langues, chacune avec leur génie propre, y auront leur place. Mais si l'internet, comme cela semble être le cas, abandonne ces promesses pour devenir un lieu unique de transactions commerciales, la seule langue qui y sera finalement parlée sera une sorte de jargon dénaturant la belle langue anglaise, je veux dire un anglais amoindri à l'usage des relations uniquement commerciales.»
Richard Chotin, professeur à l'École supérieure des affaires (ESA) de Lille, rappelle à juste titre que la suprématie de l'anglais a succédé à celle du français. «Le problème est politique et idéologique, explique-t-il en septembre 2000. C'est celui de l'"impérialisme" de la langue anglaise découlant de l'impérialisme américain. Il suffit d'ailleurs de se souvenir de l'"impérialisme" du français aux 18e et 19e siècles pour comprendre la déficience en langues des étudiants français: quand on n'a pas besoin de faire des efforts pour se faire comprendre, on n'en fait pas, ce sont les autres qui les font.»
Bakayoko Bourahima, bibliothécaire de l'École nationale supérieure de statistique et d'économie appliquée (ENSEA) d'Abidjan (Côte d'Ivoire), écrit en juillet 2000: «Pour nous les Africains francophones, le diktat de l'anglais sur la toile représente pour la masse un double handicap d'accès aux ressources du réseau. Il y a d'abord le problème de l'alphabétisation qui est loin d'être résolu et que l'internet va poser avec beaucoup plus d'acuité, ensuite se pose le problème de la maîtrise d'une seconde langue étrangère et son adéquation à l'environnement culturel. En somme, à défaut de multilinguisme, l'internet va nous imposer une seconde colonisation linguistique avec toutes les contraintes que cela suppose. Ce qui n'est pas rien quand on sait que nos systèmes éducatifs ont déjà beaucoup de mal à optimiser leurs performances, en raison, selon certains spécialistes, des contraintes de l'utilisation du français comme langue de formation de base. Il est donc de plus en plus question de recourir aux langues vernaculaires pour les formations de base, pour "désenclaver" l'école en Afrique et l'impliquer au mieux dans la valorisation des ressources humaines. Comment faire? Je pense qu'il n'y a pas de chance pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques s'investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier leurs différentes spécificités internes.»
Lucie de Boutiny, romancière, écrit en septembre 2000: "Les chiffres de septembre 2000 montrent que 51% des utilisateurs sont anglo-saxons, et 78% des sites aussi. Les chiffres de cette prépondérance baissent à mesure qu'augmentent le nombre des internautes de par le monde... L'anglais va devenir la deuxième langue mondiale après la langue natale, mais il y en aura d'autres. Un exemple: personnellement, à l'âge de 4 ans, je parlais trois langues alors que je ne savais ni lire ni écrire. Pour parler une langue, il peut suffire d'avoir la chance de l'écouter. On peut espérer que le cosmopolitisme traverse toutes les classes sociales en raison, par exemple, de l'Union européenne, du nomadisme des travailleurs, de la facilité de déplacement à l'étranger des étudiants, de la présence des chaînes TV et sites étrangers, etc."
Gérard Fourestier, créateur de Rubriques à Bac, un site destiné aux étudiants du premier cycle universitaire, écrit en octobre 2000: «Je suis de langue française. J'ai appris l'allemand, l'anglais, l'arabe, mais je suis encore loin du compte quand je surfe dans tous les coins de la planète. Il serait dommage que les plus nombreux ou les plus puissants soient les seuls qui "s'affichent" et, pour ce qui est des logiciels de traduction, il y a encore largement à faire. (...) Pour l'instant, [il importe] de connaître suffisamment d'anglais et de créer beaucoup plus encore en français.»
= Des solutions logicielles
Alain Bron, consultant en systèmes d'information et écrivain, explique pour sa part en novembre 1999: «Il y aura encore pendant longtemps l'usage de langues différentes et tant mieux pour le droit à la différence. Le risque est bien entendu l'envahissement d'une langue au détriment des autres, donc l'aplanissement culturel. Je pense que des services en ligne vont petit à petit se créer pour pallier cette difficulté. Tout d'abord, des traducteurs pourront traduire et commenter des textes à la demande, et surtout les sites de grande fréquentation vont investir dans des versions en langues différentes, comme le fait l'industrie audiovisuelle.»
Tôt ou tard, le pourcentage des langues sur le réseau correspondra-t-il à leur répartition sur la planète? Rien n'est moins sûr à l'heure de la fracture numérique entre riches et pauvres, entre zones rurales et zones urbaines, entre régions favorisées et régions défavorisées, entre l'hémisphère nord et l'hémisphère sud, entre pays développés et pays en développement.
Selon Zina Tucsnak, ingénieur d'études au laboratoire ATILF (Analyse et traitement informatique de la langue française), interviewée en octobre 2000, "le meilleur moyen serait l'application d'une loi par laquelle on va attribuer un "quota" à chaque langue. Mais n'est-ce pas une utopie de demander l'application d'une telle loi dans une société de consommation comme la nôtre?"
À la même date, Emmanuel Barthe, documentaliste juridique, exprime un avis contraire: «Des signes récents laissent penser qu'il suffit de laisser les langues telles qu'elles sont actuellement sur le web. En effet, les langues autres que l'anglais se développent avec l'accroissement du nombre de sites web nationaux s'adressant spécifiquement aux publics nationaux, afin de les attirer vers internet. Il suffit de regarder l'accroissement du nombre de langues disponibles dans les interfaces des moteurs de recherche généralistes. Il serait néanmoins utile (et bénéfique pour un meilleur équilibre des langues) de disposer de logiciels de traduction automatique de meilleure qualité et à très bas prix sur internet. La récente mise sur le web du GDT (Grand dictionnaire terminologique, rédigé par l'Office de la langue française du Québec) va dans ce sens.»
Michel Benoît, romancier vivant à Montréal (Québec), écrit en juin 2000: «Lorsqu'un problème affecte une structure, quelle qu'elle soit, j'ai toujours tendance à imaginer que c'est techniquement que le problème trouve sa solution. Vous connaissez cette théorie? Si les Romains avaient trouvé le moyen d'enlever le plomb de leur couvert d'étain, Néron ne serait jamais devenu fou et n'aurait jamais incendié Rome. Escusi, farfelu? Peut-être que oui, peut-être que non. E que save? L'internet multilingue? Demain, ou après-demain au plus. Voyons, pensez au premier ordinateur, il y a de cela un peu plus que cinquante ans. Un étage au complet pour faire à peine plus que les quatre opérations de base. Dans ce temps-là, un bug, c'était véritablement une mouche - ou autre insecte - qui s'insérait entre les lecteurs optiques. De nos jours [en 2000], un carte de 3 cm x 5 cm fait la même chose. La traduction instantanée: demain, après-demain au plus.»
C'est aussi l'avis de Pierre Magnenat, responsable de la cellule «gestion et prospective» du centre informatique de l'Université de Lausanne, qui écrit en octobre 2000: «La seule solution que je vois serait qu'un effort majeur et global soit entrepris pour développer des traducteurs automatiques. Je ne pense pas qu'une quelconque incitation ou autre quota pourrait empêcher la domination totale de l'anglais. Cet effort pourrait - et devrait - être initié au niveau des États, et disposer des moyens suffisants pour aboutir.»
Pierre-Noël Favennec, expert à la direction scientifique de France Télécom R&D, souligne en février 2001: «Les recherches sur la traduction automatique devraient permettre une traduction automatique dans les langues souhaitées, mais avec des applications pour toutes les langues et non les seules dominantes (ex.: diffusion de documents en japonais, si l'émetteur est de langue japonaise, et lecture en breton, si le récepteur est de langue bretonne...). Il y a donc beaucoup de travaux à faire dans le domaine de la traduction automatique et écrite de toutes les langues.»
LE FRANÇAIS SUR LE WEB
= Une «nation de langue» francophone
En décembre 1997, Tim Berners-Lee, l'inventeur du World Wide Web (en 1990), déclare à Pierre Ruetschi, journaliste à la Tribune de Genève, un quotidien suisse: «Pourquoi les Francophones ne mettent-ils pas davantage d'informations sur le web? Est-ce qu'ils pensent que personne ne veut la lire, que la culture française n'a rien à offrir? C'est de la folie, l'offre est évidemment énorme.»
C'est chose faite dans les années qui suivent, d'abord par le Québec, une région dynamique qui dispose d'un accès beaucoup plus facile et économique à l'internet les premières années, et ensuite par la Francophonie dans son ensemble.
Début 1998, les Québécois, pionniers de l'internet francophone, attendent de pied ferme l'arrivée en masse de sites web français, y compris commerciaux. Lors d'un entretien publié par le magazine en ligne Multimédium, Louise Beaudouin, ministre de la Culture et des Communications au Québec, déclare en février 1998: «J'attendais depuis deux ans que la France se réveille. Aujourd'hui, je ne m'en plaindrai pas.» À cette date, le Québec (avec 6 millions d'habitants) propose plus de sites web que la France (avec 60 millions d'habitants). La ministre attribue le retard de la France à deux facteurs: d'une part les tarifs élevés du téléphone (et donc de l'internet, puisque la connexion s'effectue par le biais de la ligne téléphonique), d'autre part les transactions commerciales possibles sur le minitel (le videotex français) depuis plusieurs années, ce qui ralentit l'expansion du commerce électronique sur l'internet.
C'est l'UREC (Unité réseaux du Centre national de la recherche scientifique) qui, en France, lance le premier annuaire de sites web francophones. L'annuaire de l'UREC a pour but de se familiariser avec le web sans se noyer dans la masse d'informations mondiale, et de connaître les sites qui petit à petit fleurissent en langue française. Créé début 1994, il recense d'abord les sites académiques avant de devenir plus généraliste. D'autres annuaires voient ensuite le jour, dont certains débutés avec l'aide de l'UREC. Le nombre de sites web, y compris commerciaux, augmente de manière exponentielle, si bien que la gestion d'un annuaire généraliste devient difficile. En juillet 1997, considérant sa mission comme accomplie, l'UREC arrête la mise à jour de cet annuaire généraliste, et le remplace par un annuaire spécialisé consacré à l'enseignement supérieur et à la recherche.
Fondée en mars 1970 à Niamey (Niger) pour regrouper 21 États francophones, l'Agence la Francophonie - qui se prénomme d'abord l'Agence de coopération culturelle et technique (ACCT) - compte 47 États francophones en 1997. Cette agence se veut un «instrument de coopération multilatérale née d'un idéal, celui de créer une communauté qui fasse entendre sa voix dans le concert des nations».
Une Conférence des ministres francophones chargés des inforoutes a lieu à Montréal en mai 1997. Datée du 21 mai 1997, la Déclaration de Montréal propose de «développer une aire francophone d'éducation, de formation et de recherche; soutenir la création et la circulation de contenus francophones et contribuer à la sauvegarde et à la valorisation des patrimoines; encourager la promotion de l'aire francophone de développement économique; mettre en place une vigie francophone (veille active); sensibiliser prioritairement la jeunesse ainsi que les utilisateurs, les producteurs et les décideurs; assurer la présence et la concertation des Francophones dans les instances spécialisées.»
Par ailleurs, l'Agence universitaire de la Francophonie (AUF) crée le réseau internet REFER pour desservir la communauté scientifique et technique en Afrique, en Asie et en Europe orientale, avec 24 pays participants en 2002.
Le 20 mars 2010, la Francophonie fête ses quarante ans d'existence. L'Organisation internationale de la Francophonie (OIF) rassemble désormais 70 États et gouvernements (56 membres et 14 observateurs) totalisant 870 millions d'habitants, soit 13% de la population mondiale.
Mais, selon diverses sources, on ne recenserait en fait que 200 millions de Francophones dans le monde, dont 72 millions de «locuteurs partiels». 96,2 millions de Francophones vivraient en Afrique. Le français serait la neuvième langue de la planète et 5% des pages internet seraient rédigées en français. Tous chiffres à prendre avec précaution.
S'il est la langue des pays francophones, le français est aussi la deuxième langue utilisée dans les organisations internationales. Malgré la pression anglophone - réelle ou supposée selon les cas -, des Francophones veillent à ce que leur langue ait une place significative dans le monde, au même titre que les autres grandes langues de communication que sont l'anglais, l'arabe, le chinois et l'espagnol. Là aussi, l'optique est aussi bien la défense d'une langue que le respect du multilinguisme et de la diversité des peuples.
= Le patrimoine linguistique en ligne
L'internet peut favoriser non seulement l'usage du français, en cas de volonté politique et culturelle dans ce sens, mais aussi la transmission du patrimoine linguistique. Un exemple parmi d'autres est celui des dictionnaires anciens, qui trouvent une nouvelle vie grâce au web.
Dès 1996, le site de l'Institut national de la langue française (InaLF) offre des ressources terminologiques sur le discours littéraire des 14e au 20e siècles (contenu, sémantique, thématique), sur la langue courante (langue écrite, langue parlée, argot) et sur le discours scientifique et technique.
Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy, explique en juin 1998: «Les premières pages sur l'INaLF ont été mises sur l'internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. J'ai participé à la mise sous internet de ces pages (...). La direction a senti la nécessité urgente de nous faire connaître par l'internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet "Unité de recherche et de service" et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux étant la base textuelle FRANTEXT [sur l'internet depuis début 1995, NDLR], ainsi qu'une maquette du tome 14 du TLF [Trésor de la langue française]. Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale.»
La base FRANTEXT comprend, en mode interactif, 180 millions de mots- occurrences provenant d'une collection représentative de 3.500 unités textuelles en arts, sciences et techniques des 16e-20e siècles. Début 1998, 82 centres de recherche et bibliothèques universitaires sont abonnés, en Europe, en Australie, au Japon et au Canada, ce qui représente 1.250 postes de travail ayant accès à la base, avec une cinquantaine de sessions d'interrogations par jour.
Le Projet ARTFL (ARTFL: American and French Research on the Treasury of the French Language) est un projet commun du Centre national de la recherche scientifique (CNRS, France) et de l'Université de Chicago (Illinois, États-Unis). À l'origine, ce projet a pour but de constituer une base de données de 2.000 textes des 13e-20e siècles ayant trait à la littérature, la philosophie, les arts et les sciences.
En 1998, l'ARTFL travaille à la version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles rédigés par plus de 140 collaborateurs - dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach, Turgot, etc. - ont fait de cette encyclopédie un monumental ouvrage de référence pour les arts et les sciences. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du 18e siècle, et c'est grâce à elle qu'ont été propagées les idées du Siècle des Lumières.
L'Encyclopédie comprend 17 volumes de texte - qui représentent 18.000 pages et 20.736.912 mots - et 11 volumes de planches.
La base de données correspondant au premier volume est accessible en ligne à titre expérimental. La recherche peut être effectuée par mot, portion de texte, auteur ou catégorie, ou par la combinaison de ces critères entre eux. On dispose de renvois d'un article à l'autre, au moyen de liens permettant d'aller d'une planche au texte ou du texte au fac-similé des pages originales. L'automatisation complète des procédures de saisie entraîne des erreurs typographiques et des erreurs d'identification qui sont ensuite corrigées au fil des mois. La recherche d'images par mot, portion de texte ou catégorie est également possible dans un deuxième temps.
L'ARTFL travaille aussi à un projet de base de données pour le Dictionnaire de l'Académie française, dont les différentes éditions se sont échelonnées entre 1694 et 1935. Ce projet inclut la saisie et l'édition du texte, ainsi que la création d'un moteur de recherche spécifique. La première édition (1694) et la cinquième édition (1798) du dictionnaire sont les premières à être disponibles pour une recherche par mot, puis pour une recherche en texte intégral. Les différentes éditions sont ensuite combinées dans une base de données unique, qui permet de juger de l'évolution d'un terme en consultant aussi bien une édition particulière que l'ensemble des éditions.
Les autres projets de l'ARTFL sont la version image de l'édition de 1740 du Dictionnaire historique et critique de Philippe Bayle, le Roget's Thesaurus de 1911, le Webster's Revised Unabridged Dictionary de 1913, le Thresor de la langue française de Jean Nicot (1606), un projet multilingue sur La Bible comprenant entre autres La Bible française de Louis Segond (1910), etc.
PREMIERS PROJETS MULTILINGUES
= Travlang
Travlang, site dédié à la fois aux voyages et aux langues, est créé par Michael C. Martin en 1994 sur le site de son université alors qu'il était étudiant en physique. Devenu chercheur au Lawrence Berkeley National Laboratory (Californie), Michael Martin poursuit la gestion de ce site devenu très populaire.