Entretiens / Interviews / Entrevistas

Chapter 23

Chapter 233,666 wordsPublic domain

Pour équilibrer ces deux tendances, je pense que l'information à l'état brut - et certaines ressources à l'état brut: langages de programmation ou moyens d'accès à l'information de base comme les navigateurs web - doivent être disponibles gratuitement. Ceci crée un marché et permet aux gens de les utiliser. Par contre l'information traitée et les systèmes vous permettant d'obtenir et structurer très exactement ce dont vous avez besoin doivent être payants. Cela permet de financer ceux qui développent ces nouvelles technologies.

Prenons un exemple: à l'heure actuelle, un dictionnaire n'est pas disponible gratuitement. Les sociétés éditrices de dictionnaires refusent de les mettre librement à la disposition des chercheurs et de toute personne intéressée, et elles avancent l'argument que ces dictionnaires ont demandé des siècles de travail (j'ai eu plusieurs discussions à ce sujet avec des sociétés de dictionnaires). Mais de nos jours les dictionnaires sont des instruments stupides: on doit connaître le mot avant de le trouver! J'aimerais avoir un outil qui me permette de donner une définition approximative, ou peut-être une phrase ou deux incluant un espace pour le mot que je cherche, ou même l'équivalent de ce mot dans une autre langue, et que la réponse me revienne avec le(s) mot(s) que je cherche. Un tel outil n'est pas compliqué à construire, mais il faut d'abord le dictionnaire de base. Je pense que ce dictionnaire de base devrait être en accès libre. Par contre on pourrait facturer l'utilisation du moteur de recherche ou du service permettant d'entrer une information - partielle ou non - qui soit très "ciblée", afin d'obtenir le meilleur résultat.

Voici un deuxième exemple. On devrait avoir accès librement à la totalité du web, et à tous les moteurs de recherche "de base" du type de ceux qu'on trouve aujourd'hui. Pas de copyright et pas de licence. Mais si on a besoin d'un moteur de recherche qui procure une réponse très "ciblée" et très fiable, je pense qu'il ne serait pas déraisonnable que ce service soit facturé.

Le créateur d'une encyclopédie ne va naturellement pas aimer ma proposition. Mais je lui suggérerais d'équiper son encyclopédie d'un système d'accès performant. Sans ce système, l'information brute donnée par cette encyclopédie n'est qu'un stock d'informations et rien d'autre, et ce stock peut aisément se perdre dans une masse considérable d'informations qui augmente tous les jours.

*Entretien du 2 septembre 2000 (entretien original en anglais)

= Quoi de neuf depuis notre dernier entretien?

Je vois de plus en plus de petites sociétés utiliser d'une manière ou d'une autre les technologies liées aux langues, pour procurer des recherches, des traductions, des rapports ou d'autres services permettant de communiquer. Le nombre de créneaux dans lesquels ces technologies peuvent être utilisées continue de me surprendre, et cela va des rapports financiers et leurs mises à jour aux communications d'une société à l'autre en passant par le marketing.

En ce qui concerne la recherche, la principale avancée que je vois est due à Kevin Knight, un collègue de l'ISI (Institut des sciences de l'information de l'Université de Californie du Sud), ce dont je suis très honoré. L'été dernier, une équipe de chercheurs et d'étudiants de l'Université Johns Hopkins (Maryland) a développé une version à la fois meilleure et plus rapide d'une méthode développée à l'origine par IBM (et dont IBM reste propriétaire) il y a douze ans environ. Cette méthode permet de créer automatiquement un système de traduction automatique, dans la mesure où on lui fournit un volume suffisant de texte bilingue. Tout d'abord la méthode trouve toutes les correspondances entre les mots et la position des mots d'une langue à l'autre, et ensuite elle construit des tableaux très complets de règles entre le texte et sa traduction, et les expressions correspondantes.

Bien que la qualité du résultat soit encore loin d'être satisfaisante - personne ne pourrait considérer qu'il s'agit d'un produit fini, et personne ne pourrait utiliser le résultat tel quel - l'équipe a créé en vingt-quatre heures un système (élémentaire) de traduction automatique du chinois vers l'anglais. Ceci constitue un exploit phénoménal, qui n'avait jamais été réalisé avant. Les détracteurs du projet peuvent bien sûr dire qu'on a besoin dans ce cas de trois millions de phrases disponibles dans chaque langue, et qu'on ne peut se procurer une quantité pareille que dans les parlements du Canada, de Hong-Kong ou d'autres pays bilingues. Ils peuvent bien sûr arguer également de la faible qualité du résultat. Mais le fait est que, tous les jours, on met en ligne des textes bilingues au contenu à peu près équivalent, et que la qualité de cette méthode va continuer de s'améliorer pour atteindre au moins celle des logiciels de traduction automatique actuels, qui sont conçus manuellement. J'en suis absolument certain.

D'autres développements sont moins spectaculaires. On observe une amélioration constante des résultats dans les systèmes pouvant décider de la traduction opportune d'un terme (homonyme) qui a des significations différentes (par exemple père, pair et père, ndlr). On travaille beaucoup aussi sur la recherche d'information par recoupement de langues (qui vous permettront bientôt de trouver sur le web des documents en chinois et en français même si vous tapez vos questions en anglais). On voit également un développement rapide des systèmes qui répondent automatiquement à des questions simples (un peu comme le populaire AskJeeves utilisé sur le web, mais avec une gestion par ordinateur et non par des êtres humains). Ces systèmes renvoient à un grand volume de texte permettant de trouver des "factiodes" (et non des opinions ou des motifs ou des chaînes d'événements) en réponse à des questions telles que: "Quelle est la capitale de l'Ouganda?", ou bien: "Quel âge a le président Clinton?", ou bien: "Qui a inventé le procédé Xerox?", et leurs résultats obtenus sont plutôt meilleurs que ce à quoi je m'attendais.

= Quelle est votre opinion sur le livre électronique?

Je ne crois pas au livre électronique. Encore plus que d'assister à un concert en public ou d'aller voir un film au cinéma, j'aime l'expérience physique d'avoir un livre sur les genoux et de prendre plaisir à son odeur, son contact et son poids. Les concerts à la télévision, les films à la télévision et les livres électroniques font qu'on perd un peu de ce plaisir. Et, pour les livres particulièrement, je ne suis pas prêt à cette perte. Après tout, dans mon domaine d'activité, il est beaucoup plus facile et beaucoup plus économique de se procurer un livre qu'une place de concert ou de cinéma. Tous mes souhaits vont aux fabricants de livres électroniques, mais je suis heureux avec les livres imprimés. Et je ne pense pas changer d'avis de sitôt, et me ranger dans la minorité qui utilise les livres électroniques. Je crains beaucoup moins la disparition des livres que je n'ai craint autrefois la disparition des cinémas.

= Comment définissez-vous le cyberespace?

Pour moi, le cyberespace est représenté par la totalité des informations auxquelles nous pouvons accéder par l'internet et les systèmes informatiques en général. Il ne s'agit bien sûr pas d'un espace, et son contenu est sensiblement différent de celui des bibliothèques. Par exemple, bientôt mon réfrigérateur, ma voiture et moi-même seront connus du cyberespace, et toute personne disposant d'une autorisation d'accès (et d'une raison pour cela) pourra connaître précisément le contenu de mon réfrigérateur et la vitesse de ma voiture (ainsi que la date à laquelle je devrai changer les amortisseurs), et ce que je suis en train de regarder maintenant.

En fait, j'espère que la conception de la publicité va changer, y compris les affiches et les présentations que j'ai sous les yeux en marchant, afin que cette publicité puisse correspondre à mes connaissances et à mes goûts, tout simplement en ayant les moyens de reconnaître que "voici quelqu'un dont la langue maternelle est l'anglais, qui vit à Los Angeles et dont les revenus sont de tant de dollars par mois". Ceci sera possible du fait de la nature dynamique d'un cyberespace constamment mis à jour (contrairement à une bibliothèque), et grâce à l'existence de puces informatiques de plus en plus petites et bon marché.

Tout comme aujourd'hui j'évolue dans un "espace social" (socialspace) qui est un réseau de normes sociales, d'expectations et de lois, demain, j'évoluerai aussi dans un cyberespace composé d'informations sur lesquelles je pourrai me baser (parfois), qui limiteront mon activité (parfois), qui me réjouiront (souvent, j'espère) et qui me décevront (j'en suis sûr).

= Et la société de l'information?

Une société de l'information est une société dans laquelle la majorité des gens a conscience de l'importance de cette information en tant que produit de base, et y attache donc tout naturellement du prix. Au cours de l'histoire, il s'est toujours trouvé des gens qui ont compris combien cette information était importante, afin de servir leurs propres intérêts. Mais quand la société, dans sa majorité, commence à travailler avec et sur l'information en tant que telle, cette société peut être dénommée société de l'information. Ceci peut sembler une définition tournant un peu en rond ou vide de sens, mais je vous parie que, pour chaque société, les anthropologues sont capables de déterminer quel est le pourcentage de la société occupé au traitement de l'information en tant que produit de base. Dans les premières sociétés, ils trouveront uniquement des professeurs, des conseillers de dirigeants et des sages. Dans les sociétés suivantes, ils trouveront des bibliothécaires, des experts à la retraite exerçant une activité de consultants, etc.

Les différentes étapes de la communication de l'information - d'abord verbale, puis écrite, puis imprimée, puis électronique - ont chaque fois élargi (dans le temps et dans l'espace) le champ de propagation de cette information, en rendant de ce fait de moins en moins nécessaire le réapprentissage et la répétition de certaines tâches difficiles. Dans une société de l'information très évoluée, je suppose, il devrait être possible de formuler votre objectif, et les services d'information (à la fois les agents du cyberespace et les experts humains) oeuvreraient ensemble pour vous donner les moyens de réaliser cet objectif, ou bien se chargeraient de le réaliser pour vous, et réduiraient le plus possible votre charge de travail en la limitant au travail vraiment nouveau ou au travail nécessitant vraiment d'être refait à partir de documents rassemblés pour vous dans cette intention.

CHRISTIANE JADELOT [FR, EN]

[FR] Christiane Jadelot (Nancy)

#Ingénieur d'études à l'INaLF (Institut national de la langue française)

Laboratoire du CNRS (Centre national de la recherche scientifique), l'INaLF a pour mission de développer des programmes de recherche sur la langue française, tout particulièrement son lexique. Les données, traitées par des systèmes informatiques spécifiques et originaux, constamment enrichies et renouvelées, portent sur tous les registres du français: langue littéraire (du 14e au 20e siècle), langue courante (écrite, parlée), langue scientifique et technique (terminologies), et régionalismes. Ces données, qui constituent un matériau d'étude considérable, sont progressivement mises à la disposition de tous ceux que la langue française intéresse (enseignants et chercheurs, mais aussi industriels, secteur tertiaire et grand public), soit par des publications, soit par la consultation de banques et bases de données.

Le domaine de compétence de Christiane Jadelot est la lexicographie informatisée. Elle est actuellement chargée de la mise en ligne de la huitième édition du Dictionnaire de l'Académie française (1932-1935).

[Entretien 08/06/1998 // Entretien 10/08/1999]

*Entretien du 8 juin 1998

= Quel est l'historique du site web de l'INaLF?

Les premières pages sur l'INaLF ont été mises sur l'internet au milieu de l'année 1996, à la demande de Robert Martin, directeur de l'INaLF. Je peux en parler, car j'ai participé à la mise sous internet de ces pages, avec des outils qui ne sont pas comparables à ceux que l'on utilise aujourd'hui. J'ai en effet travaillé avec des outils sous Unix, qui n'étaient pas très faciles d'utilisation. Nous avions peu d'expérience de la chose, à l'époque, et les pages étaient très verbeuses. Mais la direction a senti la nécessité urgente de nous faire connaître par l'internet, que beaucoup d'autres entreprises utilisaient déjà pour promouvoir leurs produits. Nous sommes en effet "Unité de recherche et de service" et nous avons donc à trouver des clients pour nos produits informatisés, le plus connu d'entre eux étant la base textuelle Frantext. Il me semble que la base Frantext était déjà sur internet (depuis début 1995, ndlr), ainsi qu'une maquette du tome 14 du TLF (Trésor de la langue francaise, dictionnaire en 16 volumes publié par le CNRS entre 1971 et 1994, et dont le 14e volume a été consultable en ligne pendant quelque temps, ndlr). Il était donc nécessaire de faire connaître l'ensemble de l'INaLF par ce moyen. Cela correspondait à une demande générale.

= Quel est l'apport de l'internet dans votre vie professionnelle?

J'ai commencé à utiliser vraiment l'internet en 1994, je crois, avec un logiciel qui s'appelait Mosaic. J'ai alors découvert un outil précieux pour progresser dans mes connaissances en informatique, linguistique, littérature... Tous les domaines sont couverts. Il y a le pire et le meilleur, mais en consommateur averti, il faut faire le tri de ce que l'on trouve. J'ai surtout apprécié les logiciels de courrier, de transfert de fichiers, de connexion à distance. J'avais à cette époque des problèmes avec un logiciel qui s'appelait Paradox et des polices de caractères inadaptées à ce que je voulais faire. J'ai tenté ma chance et posé la question dans un groupe de News approprié. J'ai reçu des réponses du monde entier, comme si chacun était soucieux de trouver une solution à mon problème! Je n'étais pas habituée à ce type de solidarité. Les habitudes en France sont plutôt de travailler avec des cloisons étanches.

= Comment voyez-vous l'avenir?

Je pense qu'il faut équiper de plus en plus de laboratoires avec du matériel de pointe, qui permette d'utiliser tous ces médias. Nous avons des projets en direction des lycées et des chercheurs. Le ministère de l'Education nationale a promis de câbler tous les établissements, c'est plus qu'une nécessité nationale. J'ai vu à la télévision une petite école dans un village faisant l'expérience de l'internet. Les élèves correspondaient avec des écoles de tous les pays, ceci ne peut être qu'une expérience enrichissante, bien sûr sous le contrôle des adultes formés pour cela. Voilà ma petite expérience. Je me suis équipée maintenant à domicile dans un but plus ludique, en espérant convaincre ma fille d'utiliser au mieux tous ces outils.

*Entretien du 10 août 1999

= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?

L'INaLF est au coeur des problèmes de droits d'auteur et d'éditeur avec sa base de textes Frantext. Il me semble que les règles devraient s'assouplir, car pour le moment cette base a un accès restreint, ce qui est dommageable pour sa diffusion et la diffusion de la langue française en général.

= Comment voyez-vous l'évolution vers un internet multilingue?

Personnellement je n'ai pas d'état d'âme par rapport à l'usage de la langue anglaise. On doit la prendre comme un banal outil de communication. Cela dit, les sites doivent proposer un accès par l'anglais et par la langue du pays d'origine.

= Quel est votre meilleur souvenir lié à l'internet?

Mon meilleur souvenir est celui évoqué en 1998, lorsque, pour mon problème de polices de caractères, qui était très local, j'ai reçu des réponses du monde entier!

= Et votre pire souvenir?

Celui d'avoir envoyé un courrier électronique à une personne qui n'était pas destinataire. Ce mode de communication doit être utilisé avec prudence parfois. Il va plus vite que la pensée elle-même, et peut être utilisé de manière très perverse, après coup, par le destinataire.

[EN] Christiane Jadelot (Nancy, France)

#Researcher at the INALF (Institut national de la langue française - National Institute of the French Language)

The purpose of the INaLF -- part of the France's National Centre for Scientific Research (Centre national de la recherche scientifique, CNRS) -- is to design research programmes on the French language, particularly its vocabulary. The INaLF's constantly expanding and revised data, processed by special computer systems, deal with all aspects of the French language: literary discourse (14th-20th centuries), everyday language (written and spoken), scientific and technical language (terminologies), and regional languages. This data, which is an very important study resource, is made available to people interested in the French language (teachers and researchers, business people, the service sector and the general public) through publications and databases.

Christiane Jadelot is an expert in computerized lexicography. She is currently in charge of putting the eighth version of the Dictionnaire de l'Académie française (Dictionary of the French Academy) (1932-1935) online.

[Interview 08/06/1998 // Interview 10/08/1999]

*Interview of June 8, 1998 (original interview in French)

= What is the history of the INaLF website?

At the request of Robert Martin, the head of INaLF, our first pages were posted on the Internet in mid-1996. I helped set up these web pages with tools that cannot be compared to the ones we have nowadays. I was working with tools on Unix, which were not very easy to use. We had little practical experience then, and the pages were very cluttered. But the INaLF thought it was very important to make ourselves known through the Internet, which many firms were already using to sell their products. As we are a "research and services" organization, we have to find customers for our computer products, the best known being the text database Frantext. I think Frantext was already on the Internet (since early 1995), and there was also a draft version of volume 14 of the TLF (Trésor de la langue française). So we had to publicize INaLF activities in this way. It met a general need.

= How did using of the Internet change your professional life?

I began to really use it in 1994, with a browser called Mosaic. I found it a very useful way of improving my knowledge of computers, linguistics, literature... everything. I was finding the best and the worst, but as a discerning user, I had to sort it all out and make choices. I particularly liked the software for e-mail, file transfers and dial-up connections. At that time I had problems with a programme called Paradox and character sets that I couldn't use. I tried my luck and threw out a question in a specialist news group. I got answers from all over the world. Everyone seemed to want to solve my problem! I wasn't used to this kind of support. The French are more used to working alone, without reaching out.

= What do you see the future?

I think we have to equip more and more laboratories with high-tech hardware and software so we can use all these new media. We have got projects for schools and research centers. The French education ministry has promised to give all schools cable line access, which is a pressing national need. I saw a TV programme about a small rural primary school's experience of the Internet. The pupils were communicating by e-mail with schools all over the world. This is very enriching, especially when supervised by specially-trained teachers. So that is how I see the Internet. Now I am equipped at home, more for fun, and I hope to convince my daughter to use all these tools to the fullest.

*Interview of August 10, 1999 (original interview in French)

= What do you think of the debate about copyright on the Web?

With its text database Frantext, the INaLF is greatly affected by problems of copyright and publisher's rights. I think the rules should be more flexible. At the moment, use of the database is restricted, which reduces its influence and the spread of French in general.

= How do you see the growth of a multilingual Web?

Personally I have no problem about the use of English, which has to be regarded as a shared communication tool. But websites should offer access both in English and in the language of their country of origin.

= What is your best experience with the Internet?

It was the one I recalled in 1998, when I got responses from all over the world to my very trivial question about type-faces.

= And your worst experience?

When I sent an email to someone by mistake. Sometimes this communication tool has to be used carefully. It goes faster than the human brain and can then be used by the recipient in a very ugly way.

GERARD JEAN-FRANCOIS [FR]

[FR] Gérard Jean-François (Caen)

#Directeur du centre de ressources informatiques de l'Université de Caen

Directeur du centre de ressources informatiques de l'Université de Caen (CRIUC), Gérard Jean-François est chargé de l'exploitation et du développement des technologies de la communication pour la recherche et la pédagogie.

*Entretien du 13 mars 2001

= Pouvez-vous décrire l'activité de votre organisme?

L'Université de Caen Basse-Normandie compte 24.000 étudiants. Elle est unique, donc pluridisciplinaire pour la région. De ce fait, elle est répartie sur une douzaine de sites. Les activités principales sont évidemment l'enseignement et la recherche.

= En quoi consiste exactement votre activité professionnelle?

Mon activité professionnelle consiste à effectuer la veille technologique et à mettre en place les moyens nécessaires à l'activité de l'établissement. Ces moyens sont essentiellement le réseau de communication, les serveurs et les équipements individuels. Sur ces équipements sont mis en place les services (messageries, bases de données, visioconférence...) nécessaires aux utilisateurs (étudiants, enseignants/chercheurs, personnels techniques et administratifs).

= Et votre activité liée à l'internet?

Par rapport à internet, je me dois de fournir l'accès internet à l'ensemble de l'établissement mais également de rendre visible l'établissement sur internet, ceci dans le strict respect de la législation en appliquant toutes les mesures de sécurité qui incombent à mon rôle de responsable sécurité du système informatique.

= Comment voyez-vous l'avenir?

Pour l'avenir, les évolutions suivantes se précisent à l'horizon :

- les développements techniques pour la prise en compte des différents médias,

- la "démocratisation" de l'internet, qui amènera la mise en place de réseaux professionnels,

- la multiplication des problèmes de sécurité liés à la dématérialisation de l'information.

= Utilisez-vous encore beaucoup de documents papier?

Pour mon activité professionnelle, j'utilise encore le papier pour travailler hors de mon bureau, de même que pour des livres autres que techniques. En effet, si des documents techniques (qui sont des bases de données) sont facilement consultables sous forme électronique, il n'en est pas de même pour des ouvrages de fond. Au sujet de la presse, il est hors de question de la supprimer pour la lecture, mais pour l'archivage oui.

= Le papier a-t-il encore de beaux jours devant lui?

La réponse est oui mais les usages changeront.

= Quelle est votre opinion sur le livre électronique?