Chapter 7
Créé par le projet LINGLINK, HLTCentral (HLT: Human Language Technologies - Technologies du langage humain) veut rassembler les ressources en technologies des langues présentes sur le Web: informations, actualités, fichiers à télédécharger, liens, événements, groupes de discussion et études commissionnées (commerce électronique, télécommunications, localisation, etc.).
Le secteur HLT fait partie du programme IST (Information Society Technologies - Technologies de la société de l'information) lancé par la Commission européenne pour la période 1999-2002. Il succède à Ingénierie linguistique, développé entre 1992 et 1998 par le Programme d'applications télématiques. Son but était de faciliter l'utilisation d'applications télématiques et d'augmenter les possibilités de communication entre langues européennes. Les travaux de RTD (recherche et développement technologique) concernaient principalement des projets pilotes intégrant les technologies de la langue dans les applications et services d'information et de communication.
FRANCIL (Réseau francophone de l'ingénierie de la langue) est un programme mis en place en juin 1994 par l'Agence universitaire de la francophonie (AUPELF-UREF) pour renforcer ses activités dans le domaine du génie linguistique, défini ainsi sur le site:
"Le Génie Linguistique est une partie du traitement électronique de l'information. Dans ce contexte, le traitement automatique des langues est un secteur en plein développement. Il comprend les recherches et développement en matière d'analyse et de génération de textes, de reconnaissance, de compréhension et de synthèse de la parole. Il inclut les applications relatives à la gestion de documents, à la communication entre l'humain et la machine, à l'aide à la rédaction, à la traduction assistée par ordinateur. Il comporte des enjeux de type industriel et économique, de type scientifique et technologique mais présente aussi une dimension culturelle très spécifique. Il est toujours préférable de maîtriser la langue qui sert à exprimer les résultats des recherches, surtout si cette recherche porte sur la langue elle-même. La langue française et la francophonie sont donc très directement concernées par cet enjeu."
Comme son nom l'indique, la Multilingual Application Interface for Telematic Services (MAITS) (Interface pour les applications multilingues des services télématiques) est un consortium formé pour développer un API (applications programming interface - interface pour la programmation des applications) pour les applications multilingues des services télématiques.
5.4. Internationalisation et localisation
"Vers la communication sur Internet dans toutes les langues..." Babel est un projet conjoint d'Alis Technologies et de l'Internet Society traitant de l'internationalisation d'Internet. Son site multilingue (allemand, anglais, espagnol, français, italien, portugais et suédois) comprend deux grands secteurs: langues (les langues du monde; glossaire typographique et linguistique; Francophonie), et Internet et multilinguisme (développer votre site web multilingue; le codage des écritures du monde).
La Localisation Industry Standards Association (LISA) (Association pour les normes de l'industrie de la localisation) est une organisation majeure pour l'industrie de localisation et d'internationalisation. Ses 130 membres comprennent des éditeurs de logiciels, des fabricants de matériel, des vendeurs de services de localisation, et un nombre croissant de sociétés venant des secteurs voisins de technologie de l'information. La mission de LISA est de promouvoir l'industrie de la localisation et de l'internationalisation et de procurer un mécanisme et des services permettant aux sociétés d'échanger et de partager l'information dans le développement de processus, outils, technologies et modèles de sociétés en rapport avec la localisation, l'internationalisation et les domaines voisins. Son site est hébergé par l'Université de Genève, en Suisse.
W3C Internationalization/Localization est un secteur du World Wide Web Consortium (W3C), consortium international de l'industrie fondé en 1994 pour développer les protocoles communs du World Wide Web. Le site donne en particulier une définition des protocoles utilisés pour l'internationalisation et la localisation: HTML (hypertext markup language), jeu de base de caractères, nouveaux attributs, HTTP (hypertext transfer protocol), négociation de la langue, URL (uniform resource locator) et autres identificateurs incluant des caractères non-ASCII (American standard code for information interchange). Le site propose aussi une aide pour créer un site multilingue.
6. SELECTION DE SITES
[Dictionnaires - exemples / Dictionnaires - répertoires / Ingénierie de la langue / Internationalisation et localisation / Langue française - promotion et recherche / Langues - enseignement / Langues - répertoires / Langues appliquées / Linguistique computationnelle / Multilinguisme - chiffres / Multilinguisme en Europe / Outils linguistiques - répertoires / Terminologie / Terminologie - informatique / Terminologie - Internet / Traduction / Traduction automatique - associations / Traduction automatique - recherche / Traduction automatique - services gratuits sur le Web / Traduction automatique - sociétés]
#Dictionnaires - exemples
= Dictionnaire universel francophone en ligne
Publié par Hachette et l'AUPELF-UREF (Agence francophone pour l'enseignement supérieur et la recherche). "Voici enfin présentés, sur un pied d'égalité, le français dit "standard" et les mots et expressions en français tel qu'on le parle sur les cinq continents." [français]
= The Internet Dictionary Project (IDP)
Créé en 1995 par Tyler Chambers, un projet coopératif en cours pour la constitution de dictionnaires en accès libre sur le Web - de l'anglais vers d'autres langues (allemand, espagnol, français, italien, latin et portugais). Tout internaute peut y participer. A suivre pour juger de la qualité. [menu en anglais]
= The Logos Dictionary
Un dictionnaire multilingue d'environ 7,5 millions d'entrées géré par Logos, une société de traduction internationale dont le siège est à Modène (Italie) et qui met en accès libre sur son site tous les outils utilisés par ses traducteurs. Outre le Logos Dictionary, on a aussi la Wordtheque, une base de données multilingue de 400 millions de mots présentés dans leur contexte (le texte de romans, documents techniques et écrits divers), Linguistic Resources (Ressources linguistiques), qui regroupe 650 glossaires, et enfin le Universal Conjugator (Conjugaison universelle), qui propose des tableaux de conjugaison dans 17 langues différentes. [anglais]
= Merriam-Webster Online: The Language Center
Un grand éditeur américain de dictionnaires met en accès libre deux ouvrages de référence, le Webster Dictionary et le Webster Thesaurus. [anglais]
#Dictionnaires - répertoires
= Dictionnaires électroniques
Préparé par la Section française des Services linguistiques centraux (SLC-f) de la Chancellerie fédérale suisse. Propose cinq rubriques: dictionnaires monolingues, dictionnaires bilingues, dictionnaires multilingues, abréviations et acronymes, et informations géographiques. [français]
= OneLook Dictionaries
Créé en avril 1996 par Robert Ware, un moteur de recherche rapide puisant dans 2,5 millions de mots disponibles dans 530 dictionnaires traitant des domaines suivants: affaires, informatique/Internet, médecine, religion, sciences, sports, technologie, généralités et argot. [anglais]
= Travlang's Translating Dictionaries
Sur le site de Michael C. Martin, dédié à la fois aux voyages et aux langues, une section donnant accès à des dictionnaires gratuits dans diverses langues (afrikaans, allemand, danois, espagnol, espéranto, finnois, français, frison, hollandais, hongrois, italien, latin, norvégien, portugais et tchèque). [anglais]
= A Web of Online Dictionaries
Oeuvre de Robert Beard, un index des dictionnaires en ligne dans plus de 170 langues différentes, auquel s'ajoutent d'autres sections: dictionnaires multilingues, dictionnaires anglophones spécialisés, thésaurus et vocabulaires, grammaires en ligne, et outils linguistiques pour non spécialistes. [anglais]
#Ingénierie de la langue
= HLTCentral (HLT: Human Language Technologies)
Lancé en janvier 1999 par le projet LINGLINK de la Commission européenne, HLTCentral veut rassembler les ressources en technologies des langues présentes sur le Web: informations, actualités, fichiers à télécharger, liens, événements, groupes de discussion et études commissionnées (commerce électronique, télécommunications, localisation, etc.). HLT fait partie du programme IST (Information Society Technologies) lancé par la Commission européenne pour la période 1999-2002, et qui succède au programme Ingénierie linguistique (1992-1998). [anglais]
= Multilingual Application Interface for Telematic Services (MAITS)
Consortium formé pour développer un API (applications programming interface = interface de programmation d'application) pour les applications multilingues des services télématiques. [français, résumés dans plusieurs langues]
= FRANCIL
FRANCIL (Réseau francophone de l'ingénierie de la langue) est un programme mis en place en juin 1994 par l'Agence universitaire de la francophonie (AUPELF-UREF) pour renforcer ses activités dans le domaine du génie linguistique, notamment le traitement automatique des langues. [français]
#Internationalisation et localisation
= Babel
Projet conjoint d'Alis Technologies et de l'Internet Society traitant de l'internationalisation d'Internet. Propose deux grands secteurs: 1) Langues (Les langues du monde - Glossaire typographique et linguistique - La Francophonie), 2) Internet et multilinguisme (Développer votre site web multilingue - Le codage des écritures du monde). [allemand, anglais, espagnol, français, italien, portugais et suédois]
= Localisation Industry Standards Association (LISA)
Le site d'une organisation qui oeuvre pour l'industrie de localisation et d'internationalisation. Ses 130 membres comprennent des éditeurs de logiciels, des fabricants de matériel, des vendeurs de services de localisation, et un nombre croissant de sociétés venant des secteurs voisins des technologies de l'information. LISA procure un mécanisme et des services permettant aux sociétés d'échanger et partager l'information dans le développement de processus, outils, technologies et modèles de sociétés. [anglais]
= W3C Internationalization / Localization
Un secteur du World Wide Web Consortium (W3C), consortium industriel international fondé en 1994 pour développer les protocoles communs du World Wide Web. Le site donne notamment une définition des protocoles utilisés pour l'internationalisation et la localisation: HTML (hypertext markup language), HTTP (hypertext transfer protocol), URL (uniform resource locator) et autres identificateurs incluant des caractères non-ASCII (American standard code for information interchange), etc. Donne aussi des conseils pour créer un site multilingue. [anglais]
#Langue française - promotion et recherche
= Agence de la francophonie
Créée en 1970 pour regrouper 21 états francophones, l'Agence de la Francophonie en compte aujourd'hui 47. "Instrument de coopération multilatérale née d'un idéal, celui de créer une communauté qui fasse entendre sa voix dans le concert des nations, elle participe aujourd'hui à l'avènement d'un Secrétariat général de la Francophonie." [français]
= Agence universitaire de la Francophonie
Opérateur direct du Sommet des Chefs d'Etat et de gouvernement des pays ayant le français en partage, cet organisme a le mandat officiel de contribuer à la construction francophone en consolidant un espace scientifique de langue française animé par ses principaux acteurs, les établissements, les enseignants, les chercheurs et les étudiants. [français]
##Belgique
= Maison de la Francité
Association belge à but non lucratif subventionnée par la Commission communautaire française, la Maison de la Francité présente la réalité socio-linguistique de Bruxelles, seconde capitale internationale de langue française après Paris, et elle agit pour la défense et la promotion de la langue française à Bruxelles et au sein de la Communauté française Wallonie-Bruxelles. [français]
##France
= Délégation générale à la langue française (DGLF)
La DGLF a pour mission de veiller à l'emploi et à la promotion du français sur le territoire national, favoriser son utilisation comme langue de communication internationale et développer le plurilinguisme, garant de la diversité culturelle. [français]
= Institut national de la langue française (INaLF)
L'INaLF est une branche du CNRS (Centre national de la recherche scientifique). Ses recherches portent sur la langue française sous tous ses aspects, notamment le discours littéraire du 14e au 20e siècle (contenu, sémantique et thématique), la langue courante (langue écrite, langue parlée et argot), le discours scientifique et technique et ses ressources terminologiques. [français]
##Québec
= Centre d'expertise et de veille inforoutes et langues (CEVEIL)
Créé en 1995, un organisme québécois à but non lucratif dont la mission est de mieux cerner la problématique de l'utilisation et du traitement des langues sur les inforoutes - dans une optique plus spécifiquement francophone - via l'institution d'activités de veille stratégique et la création d'un réseau d'échanges et d'expertise. [français]
= Office de la langue française (OLF)
Organisme gouvernemental québécois dont le mandat est d'une part de veiller à l'implantation et au maintien du français dans le monde du travail et des affaires et dans les services administratifs, d'autre part de définir et conduire la politique québécoise en matière de linguistique et de terminologie. [français, anglais]
#Langues - enseignement
= CTI Centre for Modern Languages
Inclus dans l'Institut des langues de l'Université d'Hull (Royaume-Uni), le CTI Centre for Modern Languages (CTI: Computer in Teaching Initiative) vise à promouvoir l'utilisation des ordinateurs dans l'apprentissage et l'enseignement des langues. Le Centre procure des informations sur la manière dont l'apprentissage des langues assisté par ordinateur peut être intégré à des cours existants, et il offre un soutien aux professeurs utilisant l'informatique dans l'enseignement qu'ils dispensent. Voir aussi la très intéressante rubrique: Internet Resources for Language Teachers and Learners. [anglais]
= EUROCALL
EUROCALL (European Association for Computer-Assisted Language Learning = Association européenne pour l'apprentissage des langues assisté par ordinateur) regroupe des professionnels de l'enseignement des langues exerçant en Europe et dans le monde entier. Le prochain congrès annuel, EUROCALL'99, aura lieu du 15 au 18 septembre 1999 à l'Université de Franche-Comté (Besançon, France). Comme chaque année, il fera le point sur les recherches et les applications informatiques dans le domaine de l'apprentissage des langues. [anglais]
= WELL (Web Enhanced Language Learning)
Un projet anglais en cours (1997-2000), qui est en train de mettre sur pied: a) un vaste programme de séminaires, b) une liste d' études de cas sur l'apprentissage et l'enseignement des langues par le biais du Web, c) un répertoire complet de ressources web de qualité dans douze langues différentes. [anglais]
#Langues - répertoires
= Ethnologue: Languages of the World
Edité par Barbara F. Grimes, la version web d'un catalogue très documenté répertoriant 6.700 langues, avec de multiples critères de recherche. Cet ouvrage de référence (13e édition) est également disponible sur papier et sur CD-ROM. [anglais]
= European Minority Languages
Gérée par Caoimhín P. Ó Donnaíle sur le site de l'Institut Sabhal Mór Ostaig (Ile de Skye, Ecosse), une liste de langues minoritaires - ou rendues minoritaires - disponible par ordre alphabétique et par famille linguistique. Ce site procure aussi des liens avec d'autres répertoires dans le monde entier (Other Directories Worldwide). [anglais, gaélique]
= The Languages of the World by Computers and the Internet
Créé en décembre 1995 par Yoshi Mikami, de Asia Info Network, ce site est connu aussi sous le nom de Logos Home Page ou Kotoba Home Page. Il donne, pour chaque langue, un bref historique, les caractéristiques, le système d'écriture, le jeu de caractères et la configuration du clavier pour l'utilisation de l'ordinateur et d'Internet. [anglais, japonais]
#Langues appliquées
= Language today
Un magazine passionnant pour ceux qui travaillent dans les langues appliquées: traducteurs, interprètes, terminologues, lexicographes et rédacteurs techniques. Ce magazine est une réalisation commune de Logos, qui procure le site web, et Praetorius, société de traduction et service d'expertise britannique. [anglais]
#Linguistique computationnelle
= The Association for Computational Linguistics (ACL)
Un organisme international à la fois scientifique et professionnel rassemblant ceux qui travaillent sur les problèmes de la langue naturelle et de la computation. Publiée par la MIT Press, la revue trimestrielle de l'ACL, Computational Linguistics (ISSN 0891-2017) est un forum de premier plan dans le domaine de la linguistique computationnelle et du traitement de la langue naturelle. La branche européenne de l'ACL est l'European Chapter of the Association for Computational Linguistics (EACL). [anglais]
= Institut Dalle Molle pour les études sémantiques et cognitives (ISSCO)
Rattaché à l'Université de Genève (Suisse), l'ISSCO mène des recherches théoriques et appliquées en linguistique computationnelle et en intelligence artificielle. Il est spécialisé dans le traitement de la langue naturelle et, en particulier, dans le traitement multilingue des langues en traduction automatique, environnement linguistique, génération multilingue, traitement du discours, collecte des données, etc. [anglais]
= International Committee on Computational Linguistics (ICCL) / COLING
Créé pour organiser des conférences internationales en linguistique computationnelle - dénommées COLING (Computational Linguistics) - "d'une manière originale, sans secrétariat permanent, inscriptions ou financement propre. Pour ces raisons et d'autres, cette démarche était en avance sur son temps. Les COLINGs ont toujours été des lieux de rendez-vous caractérisés par une atmosphère agréable, plutôt que des rassemblements à l'efficacité clinique se déroulant dans un hôtel d'aéroport. "Les compte-rendus de conférences sont réalisés avec l'aide de l'Association for Computational Linguistics. [allemand, anglais, français, italien, polonais, portugais, romanche]
= Le Laboratoire de recherche appliquée en linguistique informatique (RALI)
Basé à Montréal (Québec), le RALI réunit des informaticiens et des linguistes qui étudient le traitement automatique de la langue tant par des méthodes symboliques "classiques" que par de nouvelles méthodes probabilistes. Ses domaines de compétence sont les suivants: outils d'aide à la traduction, appariement automatique de textes, génération automatique de texte, réaccentuation automatique, recherche d'information aidée par des outils linguistiques, extraction d'information, identification de la langue et du codage, transducteurs à états finis, et corpus de texte enrichis. [français, anglais]
= Natural Language Group (NLG) at USC/ISI
Un département de l'Information Sciences Institute (ISI) de l'University of Southern California (USC). Traite de plusieurs aspects du traitement de la langue naturelle: traduction automatique, résumé automatique de texte, accès multilingue aux verbes et gestion du texte, développement de taxonomies de concepts (ontologies), discours et génération de texte, élaboration de grands lexiques pour plusieurs langues, et communication multimédia. [anglais]
= Text Encoding Initiative (TEI)
Un projet international pour mettre au point des directives sur l'encodage des textes électroniques à destination de la recherche. Un consortium a été formé récemment par les trois sponsors de ce projet (Association for Computers and the Humanities, Association for Literary and Linguistic Computing, Association for Computational Linguistics). [anglais]
= University of Essex - CL/MT Research Group
Le CL/MT Research Group (CL/MT: Computational Linguistics / Machine Translation) est un groupe de recherche du Département des langues et de linguistique de l'Université d'Essex (Royaume-Uni). [anglais]
= Xerox Palo Alto Research Center (PARC)
Le centre de recherche de la société Xerox dans la Silicon Valley (Californie) mène au moins deux projets relatifs aux langues: Inter-Language Unification (ILU) et Natural Language Theory and Technology (NLTT). [anglais]
= Xerox Research Centre Europe (XRCE)
Le centre de recherche européen de la société Xerox, basé à Cambridge (Royaume-Uni) et Grenoble (France). Les travaux menés ont pour but d'améliorer la productivité sur le lieu de travail, grâce à la mise en oeuvre de nouvelles technologies centrées sur le document, notamment dans le programme Théories et technologies multilingues (MLTT). [allemand, anglais, français, italien]
[Voir aussi la section: Traduction automatique - recherche]
#Multilinguisme - chiffres
= Global Reach
Sur le site de Global Reach, qui traduit les sites web commerciaux tout en les adaptant aux besoins de chaque pays, des statistiques détaillées sur la répartition des langues sur le Web. [anglais]
= Palmarès des langues de la Toile
Menée par Babel, un projet conjoint d'Alis Technologies et de l'Internet Society, la première étude d'ensemble sur la répartition réelle des langues sur Internet. Comme elle date de juin 1997, on attend impatiemment une nouvelle version... [français, anglais]
#Le multilinguisme en Europe
= Association européenne pour les ressources linguistiques (ELRA)
Etablie à Luxembourg en février 1995, une association à but non lucratif qui a pour but d'une part de fournir une organisation centralisée pour la validation, la gestion et la distribution des ressources et outils en parole, texte et terminologie, d'autre part de promouvoir leur utilisation au sein de la section européenne de recherche et développement en télématique. [français, anglais]
= European Network in Language and Speech (ELSNET)
Regroupe plus d'une centaine d'institutions universitaires et industrielles. L'objectif technologique commun aux participants de l'ELSNET est de construire des systèmes multilingues pour la parole et le langage naturel, avec couverture illimitée de la langue parlée et écrite. [anglais]
= Language Futures Europe
Paul Treanor propose des répertoires sur la politique linguistique, le multilinguisme, les structures linguistiques globales, la domination de l'anglais, la politique européenne, les politiques nationales, les sites de recherche et le "mouvement monolingue" émergeant aux Etats-Unis. [anglais]
= Multilingual Information Society (MLIS)
Un programme de la Commission européenne lancé en novembre 1996 à destination des entreprises, des organismes du secteur public, des industries des langues et des citoyens. Ses objectifs: soutenir la réalisation d'une infrastructure favorisant des ressources linguistiques européennes, stimuler le développement des industries des langues, et favoriser l'utilisation d'outils linguistiques dans le secteur public européen. [français, disponible dans les onze langues de la Communauté européenne]
#Outils linguistiques - répertoires
= The Human-Languages Page (H-LP)
Créé par Tyler Chambers en mai 1994, un catalogue détaillé de 1.800 ressources linguistiques dans plus de 100 langues différentes, réparties en différentes sections: langues et littérature, écoles et institutions, ressources linguistiques, produits et services, organismes, emplois et stages, dictionnaires et cours de langues. [anglais]
= The LINGUIST List