Chapter 8
Sur le site de la Bibliothèque électronique, le travail se poursuit chaque mois avec la mise en ligne de textes. J'ai suspendu provisoirement la fabrication de hiboux (e-books, ndlr) au format Microsoft Reader ou Mobipocket. Il faudrait que je trouve un partenariat avec un autre site pour que les textes disponibles en HTML sur notre bibliothèque électronique soient aussi proposés ailleurs dans un format hiboux multi-plateforme.
A titre personnel j'ai ouvert une autre bibliothèque électronique, Miscellanées, encore en devenir.
CHRISTIAN BOITET (Grenoble)
#Directeur du GETA (Groupe d'étude pour la traduction automatique), qui participe à l'UNLP (Universal Networking Language Programme)
Au sein du Laboratoire CLIPS (Communication langagière et interaction personne-système) de l'IMAG (Institut d'informatique et mathématiques appliquées de Grenoble), le GETA (Groupe d'étude pour la traduction automatique), dirigé par Christian Boitet, est une équipe pluridisciplinaire formée d'informaticiens et de linguistes. Les thèmes de recherche du GETA concernent tous les aspects théoriques, méthodologiques et pratiques de la traduction assistée par ordinateur (TAO), et plus généralement de l'informatique multilingue.
*Entretien du 24 septembre 1998
= En quoi consiste l'UNLP (Universal Networking Language Programme), auquel le GETA participe?
Il s'agit non de TAO (traduction assistée par ordinateur) habituelle, mais de communication et recherche d'information multilingue. Quatorze groupes ont commencé le travail sur douze langues (plus deux annexes) depuis début 1997. L'idée est de:
- développer un standard, dit UNL (Universal Networking Language), qui serait le HTML du contenu linguistique,
- pour chaque langue, développer un générateur (dit "déconvertisseur") accessible sur un ou plusieurs serveurs, et un "enconvertisseur".
L'Université des Nations Unies (UNU) (Tokyo) finance 50% du coût. D'après notre évaluation sur la première année, c'est plutôt 30 à 35%, car le travail (linguistique et informatique) est énorme, et le projet passionnant: les permanents des laboratoires s'y investissent plus que prévu.
Un énoncé en langue naturelle est représenté par un hypergraphe dont chaque noeud contient une "UW" (universal word, comme match_with(icl>event) ou match(icl>thing), formés à partir de mots anglais et dénotant des ensembles plus ou moins fins d'acceptions), ou un autre graphe, le tout muni d'attributs booléens (pluralité, modalité, aspects) - chaque arc porte une relation sémantique (agt, tim, objs). On en est à la version 1.5 de ce standard, il reste pas mal à faire, mais au moins douze groupes ont construit chacun une centaine de graphes pour le tester.
La déconversion tourne pour le japonais, le chinois, l'anglais, le portugais, l'indonésien, et commence à tourner pour le français, l'allemand, le russe, l'italien, l'espagnol, l'hindi, l'arabe, et le mongol.
Chaque langue a une base lexicale de 30.000 à 120.000 liens UW - lexème.
L'enconversion n'est pas (si on veut de la qualité pour du tout venant) une analyse classique. C'est une méthode de fabrication de graphes UNL qui suppose une bonne part d'interaction, avec plusieurs possibilités:
- analyse classique multiple suivie d'une désambiguisation interactive en langue source,
- entrée sous langage contrôlé,
- encore plus séduisant (et encore pas clair, au niveau recherche pour l'instant), entrée directe via une interface graphique reliée à la base lexicale et à la base de connaissances.
Les applications possibles sont:
- courriel multilingue,
- informations multilingues,
- dictionnaires actifs pour la lecture de langues étrangères sur le web,
- et bien sûr TA (traduction automatique) de mauvaise qualité (ce qu'on trouve actuellement, mais pour tous les couples à cause de l'architecture à pivot) pour le surf web et la veille.
On travaille actuellement sur les informations sportives sur le web, surtout sur le foot. On construit une base de documents, où chaque fichier est structuré (à la HTML) et contient, pour chaque énoncé, l'énoncé original, sa structure UNL, et autant de traductions qu'on en a obtenu. Un tel document peut être recherché dans une base en traduisant la question en UNL, puis affiché (le UNL viewer existe depuis un an) dans autant de fenêtres d'un navigateur web que de langues sélectionnées.
= Quelles sont les perspectives?
Le projet a un problème de volume: grande surface, pas assez d'épaisseur. Il faudrait trois à cinq fois plus de monde partout pour que ça avance assez vite (pour que Microsoft et d'autres ne finissent par tout reprendre et revendre, alors qu'on vise une utilisation ouverte, du type de ce qu'on fait avec les serveurs et clients web). Les subventions des sociétés japonaises à l'UNU pour ce projet (et d'autres) se tarissent à cause de la crise japonaise. Le groupe central est beaucoup trop petit (quatre personnes qui font le logiciel, le japonais, l'anglais, l'administration, c'est peu même avec de la sous-traitance).
De plus, le plan général est d'ouvrir aux autres langues de l'ONU en 2000. Il faudrait arriver à un état satisfaisant pour les douze autres avant.
Du point de vue politique et culturel, ce projet est très important, en ce qu'il montre pour la première fois une voie possible pour construire divers outils soutenant l'usage de toutes les langues sur internet, qu'elles soient majoritaires ou minoritaires. En particulier, ce devrait être un projet majeur pour la francophonie.
Dans l'état actuel des choses, je pense que l'élan initial a été donné, mais que la première phase (d'ici 2000) risque de retomber comme un soufflé si on ne consolide pas très vite le projet, dans chaque pays participant.
L'UNU cherche donc comment monter un soutien puissant à la mesure de cette ambition. Je pense que, pour la Francophonie par exemple, il faudrait un groupe d'une dizaine de personnes ne se consacrant qu'à ce projet pendant au moins dix ans, plus des stagiaires et des collaborateurs sur le réseau, bénévoles ou intéressés par la mise à disposition gratuite de ressources et d'outils.
BERNARD BOUDIC (Rennes)
#Responsable éditorial du serveur internet du quotidien Ouest-France
Bernard Boudic, 51 ans, 32 ans de presse écrite régionale, a d'abord été localier à Brest (1969-1978), puis secrétaire de rédaction au service économique et social (1978-1984), puis chef-adjoint de ce service (1984-1987), puis chef de service des informations générales (1987-1996), et enfin chargé de mission internet auprès de TC-Multimédia, filiale d'Ouest-France. Il a mis fin à ses fonctions en décembre 2000.
*Entretien du 17 juin 1998
= Quel est l'historique de votre site web?
A l'origine (en juillet 1996, ndlr), l'objectif était de présenter et relater les grands événements de l'Ouest en invitant les internautes à une promenade dans un grand nombre de pages consacrées à nos régions (tourisme, industrie, recherche, culture). Très vite, nous nous sommes aperçus que cela ne suffisait pas. Nous nous sommes tournés vers la mise en ligne de dossiers d'actualité, puis d'actualités tout court.
= Quelle est son activité présente?
Aujourd'hui nous avons quatre niveaux d'infos: quotidien, hebdo (tendant de plus en plus vers un rythme plus rapide), événements et dossiers. Et nous offrons des services (petites annonces, guide des spectacles, presse-école, boutique, etc.). Nous travaillons sur un projet de journal électronique total: mise en ligne automatique chaque nuit de nos quarante éditions (450 pages différentes, 1.500 photos) dans un format respectant typographie et hiérarchie de l'information et autorisant la constitution par chacun de son journal personnalisé (critères géographiques croisés avec des critères thématiques).
= Quel est l'apport de l'internet dans votre vie professionnelle?
Internet a changé ma vie professionnelle d'abord parce que je suis devenu le responsable éditorial du site... Les retombées sur le travail quotidien des journalistes d'Ouest-France sont encore minces. Nous commençons seulement à offrir un accès internet à chacun (rédaction d'Ouest-France = 370 journalistes répartis dans soixante rédactions, sur douze départements... pas simple). Certains utilisent internet pour la messagerie électronique (courrier interne ou externe, réception de textes de correspondants à l'étranger, envoi de fichiers divers) et comme source d'informations. Mais cette pratique demande encore à s'étendre et à se généraliser. Bien sûr, nous réfléchissons aussi à tout ce qui touche à l'écriture multimédia et à sa rétroaction sur l'écriture imprimée, aux changements d'habitudes de nos lecteurs, etc.
= Comment voyez-vous l'avenir?
Internet est à la fois une menace et une chance. Menace sur l'imprimé, très certainement (captation de la pub et des petites annonces, changement de réflexes des lecteurs, perte du goût de l'imprimé, concurrence d'un média gratuit, que chacun peut utiliser pour diffuser sa propre info, etc.). Mais c'est aussi l'occasion de relever tous ces défis et de rajeunir la presse imprimée.
*Entretien du 19 janvier 2001
= Pouvez-vous décrire l'activité de TC-Multimédia?
TC-Multimédia a été créée en 1986. Elle prennait la suite de l'Association télématique de l'ouest qui avait expérimenté le minitel (créé à Rennes). D'abord spécialisée exclusivement dans les services vidéotex, elle a fait aussi de l'internet à partir de juillet 1996. Elle est chargée d'exploiter sur ce média l'ensemble de la production du journal Ouest-France.
TC-Multimédia exploite sept sites:
http://www.ouest-france.fr
http://www.maville.com
http://www.ouestemploi.com
http://www.ouestfrance-immobilier.com
http://www.ouestfrance-automobile.com
http://www.ouestfrance.affaires.com
http://www.abcvacances.com
Les deux premiers cités sont les plus fréquentés (environ quatre millions de pages vues par mois) bien qu'ils ne proposent qu'une sélection de nos informations.
= En quoi consiste exactement votre activité professionnelle?
J'avais (jusqu'en décembre 2000) la responsabilité éditoriale des sites d'information (www.ouest-france.fr et www.maville.com) et du développement éditorial (accords extérieurs, partenariats).
= Comment voyez-vous l'avenir?
Nous avons la chance de disposer d'un gisement d'informations déjà utilisées pour le papier (Ouest-France publie dans ses 42 éditions 550 pages différentes toutes les nuits) et de petites annonces. Nous avons une marque connue et respectée. Mais le modèle économique n'est pas trouvé. Nous pensons développer un service payant à destination des centres de documentation qui leur permettrait de rechercher dans les 42 éditions n'importe quel article correspondant à une requête par mots-clés.
= Utilisez-vous encore beaucoup de documents papier?
Bien sûr!
= Les jours du papier sont comptés?
Mon avis est que le journal-papier est menacé à terme (vingt ans?) s'il ne se renouvelle pas dans la forme et dans le fond. La prise en mains du journal se fera de plus en plus tard (40-45 ans?). Il y aura des arbitrages avec la télévision (satellite, câble, numérique hertzien), avec l'internet rapide (ADSL, câble, boucle locale radio, satellite?). Il n'y aura pas de publicité disponible pour faire vivre tout le monde.
= Quelle est votre opinion sur le livre électronique?
Hors de prix!
= Quel est votre avis sur les débats relatifs au respect du droit d'auteur sur le web?
Les internautes ont tendance à penser que c'est un droit d'obtenir tout gratuitement. Non! Le droit d'auteur doit être respecté.
BAKAYOKO BOURAHIMA (Abidjan)
#Documentaliste à l'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée)
L'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan assure la formation des statisticiens pour les pays africains d'expression française. Cette formation est délivrée à travers quatre filières distinctes, conçues en fonction du niveau de recrutement des élèves: la filière ISE (ingénieurs statisticiens économistes), la filière ITS (ingénieurs des travaux statistiques), la filière AD (adjoints techniques) et la filière AT (agents techniques). A ce jour, l'ENSEA est le seul établissement de formation statistique en Afrique au Sud du Sahara qui délivre simultanément ces quatre types de formation à tous les pays francophones de la région. L'ENSEA propose par ailleurs des actions de recyclage et de perfectionnement destinées aux cadres des administrations publiques et privées, et développe progressivement des programmes d'étude et de recherche.
*Entretien du 12 juillet 2000
= Pouvez-vous présenter le site web de l'ENSEA?
Notre école a un site web depuis un peu plus d'un an. Le site a été créé à la faveur d'un colloque international sur les "Enquêtes et systèmes d'information" organisé par l'école en avril 1999. La conception et la maintenance du site ont été assurées par un coopérant français, enseignant d'informatique. Le site est actuellement hébergé par l'agence locale du Syfed (du réseau Refer de l'AUPELF-UREF - Agence universitaire de la francophonie). Le site a connu quelques difficultés de mise à jour, en raison des nombreuses occupations pédagogiques et techniques du webmestre. A ce propos, mon service, celui de la bibliothèque, a eu récemment des séances de travail avec l'équipe informatique pour discuter de l'implication de la bibliothèque dans l'animation du site. Et le service de la bibliothèque travaille aussi à deux projets d'intégration du web pour améliorer ses prestations.
= En quoi consiste exactement votre activité professionnelle?
Je suis le responsable du service de la bibliothèque. A ce titre, je m'occupe donc de la gestion de l'information scientifique et technique et de la diffusion des travaux publiés par l'école.
Mon activité professionnelle liée à l'internet, comme je le signalais plus haut, est plus au stade de projet. En fait, j'espère à la rentrée prochaine pouvoir mettre à la disposition de mes usagers un accès internet pour l'interrogation de bases de données. Par ailleurs, j'ai en projet de réaliser et de mettre sur l'intranet et sur le web un certain nombre de services documentaires (base de données thématique, informations bibliographiques, service de références bibliographiques, bulletin analytique des meilleurs travaux d'étudiants...) Il s'agit donc pour la bibliothèque, si j'obtiens les financements nécessaires pour ces projets, d'utiliser pleinement l'internet pour donner à notre école une plus grand rayonnement et de renforcer sa plate-forme de communication avec tous les partenaires possibles.
= Comment voyez-vous l'avenir?
En intégrant cet outil au plan de développement de la bibliothèque, j'espère améliorer la qualité et élargir la gamme de l'information scientifique et technique mise à la disposition des étudiants, des enseignants et des chercheurs, tout en étendant considérablement l'offre des services de la bibliothèque.
= Que pensez-vous des débats liés au respect du droit d'auteur sur le web?
J'avoue que ce débat suscite en moi quelques inquiétudes quant à mes attentes légitimes vis à vis de l'internet. J'estime que, par rapport à ma vision professionnelle, le grand espoir qu'apporte l'internet à l'Afrique, c'est de lui permettre de profiter pleinement et à moindre coût du "brain trust" mondial et de réduire sa marginalisation économique, technologique et culturelle.
La légitimité des droits d'auteur ne devra donc pas faire perdre de vue la nécessité de prendre en compte les besoins et les contraintes particulières des pays moins nantis. Autrement, dans ce domaine plus qu'ailleurs, on aboutira fatalement et très vite sûrement à une situation de marginalisation et de fronde, comme celle qui oppose actuellement les autorités sanitaires d'Afrique du Sud à certaines grandes firmes pharmaceutiques, au sujet des licences des thérapies contre le Sida.
= Comment voyez-vous l'évolution vers un internet multilingue?
Je pense que l'évolution vers un internet multilingue ne peut être qu'une source réelle d'enrichissement culturel et scientifique sur la toile. Pour nous les Africains francophones, le diktat de l'anglais sur la toile représente pour la masse un double handicap d'accès aux ressources du réseau. Il y a d'abord le problème de l'alphabétisation qui est loin d'être résolu et que l'internet va poser avec beaucoup plus d'acuité, ensuite se pose le problème de la maîtrise d'une seconde langue étrangère et son adéquation à l'environnement culturel. En somme, à défaut de multilinguisme, l'internet va nous imposer une seconde colonisation linguistique avec toutes les contraintes que cela suppose. Ce qui n'est pas rien quand on sait que nos systèmes éducatifs ont déjà beaucoup de mal à optimiser leurs performances en raison, selon certains spécialistes, des contraintes de l'utilisation du français comme langue de formation de base. Il est donc de plus en plus question de recourir aux langues vernaculaires pour les formations de base, pour "désenclaver" l'école en Afrique et l'impliquer au mieux dans la valorisation des ressources humaines.
Comment faire? Je pense qu'il n y a pas de chance pour nous de faire prévaloir une quelconque exception culturelle sur la toile, ce qui serait de nature tout à fait grégaire. Il faut donc que les différents blocs linguistiques s'investissent beaucoup plus dans la promotion de leur accès à la toile, sans oublier leurs différentes spécificités internes.
= Quel est votre meilleur souvenir lié à l'internet?
Mon meilleur souvenir lié à l'internet, c'est quand j'ai pu tirer d'embarras un de mes amis, thésard en médecine, qui n'arrivait pas à boucler sa bibliographie sur un sujet sur lequel il n'y avait pratiquement aucune référence au plan local.
= Et votre pire souvenir?
Les méls indésirables, tous ces trucs bidons qu'on peut vous faire suivre, avec cinq correspondants ou plus qui vous envoient le même message.
*Entretien du 16 janvier 2001
= Utilisez-vous encore beaucoup de documents papier?
Oui, nous utilisons encore beaucoup de papier dans l'administration et notre fonds documentaire est exclusivement "papier". Nous comptons bien y intégrer des supports multimédia, dès que les moyens nous le permettront. Le service informatique pense déjà à une numérisation partielle du fonds documentaire, mais bon, le problème ici c'est que les idées vont nettement plus vite que les moyens.
= Le papier a-t-il encore de beaux jours devant lui?
Pour ce qui est de l'Afrique en général, je pense que le papier a encore de beaux jours devant lui. Pour s'en convaincre, il n'y a qu'à voir le développement très marginal du multimédia surtout dans les institutions productrices de papier (les administrations) et dans les institutions où, comme on dit ici, on "fait papier" (les écoles). Par ailleurs, il faut compter aussi avec la lente évolution des usages. Je me rappelle que, pour les travaux de rédaction de ma thèse, après avoir stocké un certain nombre d'articles en ligne sur mon ordinateur, j'ai jugé plus pratique pour moi de les imprimer intégralement pour pouvoir les exploiter. J'ai donc eu l'impression de mieux bosser en grattant du papier, habitude oblige.
= Quelle est votre opinion sur le livre électronique?
Je constate que c'est aujourd'hui une réalité. Il faut voir pour la suite comment cela se développera et quelles en seront surtout les incidences sur la production, la diffusion et la consommation du livre. A coup sûr cela va entraîner de profonds bouleversements dans l'industrie du livre, dans les métiers liés au livre, dans l'écriture, dans la lecture, etc.
= Comment définissez-vous le cyberespace?
Il y a encore un peu de fantasme autour de ce mot. Quand j'ai fait connaissance avec ce mot (utilisé par Jean-Claude Guédon et Nicholas Négroponte), il m'avait d'abord laissé l'illusion d'un espace extra-terrestre où les ordinateurs et leurs utilisateurs se transportaient pour échanger des données et communiquer. Depuis que je navigue moi-même, je me rends compte qu'il s'agit tout simplement d'un espace virtuel traduisant le cadre de communication qui rassemble les internautes à travers le monde.
= Et la société de l'information?
La société de l'informatique et de l'internet.
MARIE-AUDE BOURSON (Lyon)
#Créatrice de la Grenouille Bleue et de Gloupsy, sites littéraires destinés aux nouveaux auteurs
*Entretien du 27 décembre 2000
= Pouvez-vous vous présenter?
Marie-Aude Bourson, 24 ans le 17 janvier 2001 ;o), vit à Lyon. Licence de sciences économiques et gestion développeur internet. Ecrivain amateur ;o) J'ai créé en septembre 1999 le site littéraire de la Grenouille Bleue, dans le but de créer un jour une véritable maison d'édition dédiée aux jeunes auteurs francophones. Il n'y a aucun organisme derrière le nouveau site Gloupsy.com (continuation de la Grenouille Bleue): il s'agit d'un site géré à titre perso ;o)
= Pouvez-vous décrire la Grenouille Bleue et Gloupsy?
Grenouille Bleue: création le 3 septembre 1999. 1.950 lecteurs au 21 décembre 2000. Objectif: faire connaître de jeunes auteurs francophones, pour la plupart amateurs. Chaque semaine, une nouvelle complète est envoyée par e-mail aux abonnés de la lettre. Les lecteurs ont ensuite la possibilité de donner leurs impressions sur un forum dédié. Egalement, des jeux d'écriture ainsi qu'un atelier permettent aux auteurs de "s'entraîner" ou découvrir l'écriture. Un annuaire recense les sites littéraires. Un agenda permet de connaître les différentes manifestations littéraires. 18 décembre 2000: fermeture du site pour problème de marque.
Janvier 2001: ouverture d'un nouveau site, Gloupsy.com, qui fonctionnera selon le même principe que la Grenouille Bleue, mais avec plus de "services" pour les jeunes auteurs ;o) Le but étant de mettre en place une véritable plate-forme pour "lancer" les auteurs.
= En quoi consiste exactement votre activité professionnelle?
Je suis chargée du développement de sites web. La littérature et l'écriture sont des passions. En vivre serait un rêve ;o)
= Comment voyez-vous l'avenir?
Pour Gloupsy: en faire un jour une véritable maison d'édition avec impression papier des auteurs découverts. Pour internet : une concentration des sites commerciaux mais une explosion des sites persos qui seront regroupés par communautés d'intérêt.
= Utilisez-vous encore beaucoup de documents papier?
Je n'aime lire un roman que sur papier! On ne remplacera jamais un bon vieux bouquin par un écran tout froid qui vous coupe votre lecture à cause d'une panne de pile. Par contre, je lis la presse quotidienne presque uniquement sur le web.
= Les jours du papier sont-ils comptés?
Le support papier devrait être plus rationnalisé: tout ce qui est d'ordre administratif devrait s'informatiser d'ici quelques années. Par contre, côté littérature, je pense qu'on ne pourra remplacer le livre papier: facile à transporter, objet d'échange, lien affectif, collection... Le livre électronique sera plus utile pour des documentations techniques ou encore les livres scolaires.
= Que pensez-vous des débats relatifs au respect du droit d'auteur sur le web?
Ces débats sont nécessaires car il s'agit là d'une véritable question de fond. Il est évident que toute création portée sur support électronique est copiable. Malgré toutes les protections techniques qui seront inventées, il y aura toujours un petit malin qui découvrira la clef pour copier le fichier. Aussi, je ne crois pas qu'on puisse réellement protéger une oeuvre sur internet, qu'il s'agisse d'un texte, d'une image ou d'une application. D'autre part, on assiste à une réelle "révolution" dans le domaine informatique: l'avènement du logiciel libre qui marque un changement dans les mentalités et qui s'étend au monde de l'internet. Celui-ci se traduit à tous les niveaux: côté développeur de logiciels et côté utilisateur. Les utilisateurs sont de plus en plus réticents à payer un logiciel ou de l'info qu'ils peuvent trouver gratuitement ailleurs.