Le Livre 010101: Enquête

Chapter 13

Chapter 133,401 wordsPublic domain

"Le site a été créé à la faveur d'un colloque international sur les enquêtes et systèmes d'information organisé par l'école en avril 1999, explique Bakayoko Bourahima, documentaliste. La conception et la maintenance du site ont été assurées par un coopérant français, enseignant d'informatique. Le site est actuellement hébergé par l'agence locale du Syfed (du réseau Refer de l'AUPELF-UREF - Agence universitaire de la francophonie). Le site a connu quelques difficultés de mise à jour, en raison des nombreuses occupations pédagogiques et techniques du webmestre. A ce propos, mon service, celui de la bibliothèque, a eu récemment des séances de travail avec l'équipe informatique pour discuter de l'implication de la bibliothèque dans l'animation du site. Et le service de la bibliothèque travaille aussi à deux projets d'intégration du web pour améliorer ses prestations."

Bakayoko Bourahima est responsable du service de la bibliothèque. "Je m'occupe de la gestion de l'information scientifique et technique et de la diffusion des travaux publiés par l'école, écrit-il. (...) J'espère bientôt pouvoir mettre à la disposition de mes usagers un accès internet pour l'interrogation de bases de données. Par ailleurs, j'ai en projet de réaliser et de mettre sur l'intranet et sur le web un certain nombre de services documentaires (base de données thématique, informations bibliographiques, service de références bibliographiques, bulletin analytique des meilleurs travaux d'étudiants...) Il s'agit donc pour la bibliothèque, si j'obtiens les financements nécessaires pour ces projets, d'utiliser pleinement l'internet pour donner à notre école une plus grand rayonnement et de renforcer sa plate-forme de communication avec tous les partenaires possibles. En intégrant cet outil au plan de développement de la bibliothèque, j'espère améliorer la qualité et élargir la gamme de l'information scientifique et technique mise à la disposition des étudiants, des enseignants et des chercheurs, tout en étendant considérablement l'offre des services de la bibliothèque."

= L'association Juriconnexion (documentation juridique)

Emmanuel Barthe est documentaliste juridique et responsable informatique chez Coutrelis & Associés, un cabinet d'avocats. "Les principaux domaines de travail du cabinet sont le droit communautaire, le droit de l'alimentation, le droit de la concurrence et le droit douanier, explique-t-il. Je fais de la saisie indexation, et je conçois et gère les bases de données internes. Pour des recherches documentaires difficiles, je les fais moi-même ou bien je conseille le juriste. Je suis aussi responsable informatique et télécoms du Cabinet: conseils pour les achats, assistance et formation des utilisateurs. De plus, j'assure la veille, la sélection et le catalogage de sites web juridiques: titre, auteur et bref descriptif. Je suis également formateur internet juridique aussi bien à l'intérieur de mon entreprise qu'à l'extérieur lors de stages de formation. Auparavant, j'ai été responsable pendant cinq ans de la documentation du cabinet d'avocat Stibbe Simont Monahan Duhot & Giroux, dont j'ai mis en place les structures et les collections. J'ai également effectué une mission de six mois chez Korn/Ferry International, un important cabinet de recrutement, à l'occasion de sa fusion avec Vuchot & Associés. J'ai alors travaillé sur l'installation du nouveau système informatique et la fusion des bases de candidats gérées par les deux cabinets.

Membre du conseil d'administration de Juriconnexion, je m'y suis spécialisé dans les CD-Rom puis l'internet juridique. Depuis l'automne 1999, je m'occupe de modérer et d'animer la liste de discussion Juriconnexion. L'association Juriconnexion a pour but la promotion de l'électronique juridique, c'est à dire la documentation juridique sur support électronique et la diffusion des données publiques juridiques. Elle organise des rencontres entre les utilisateurs et les éditeurs juridiques et de bases de données, ainsi qu'une journée annuelle sur un thème. Celle du 23 novembre 2000 portait sur les sites juridiques francophones. Vis-à-vis des autorités publiques, Juriconnexion a un rôle de médiateur et de lobbying à la fois. L'association, notamment, est favorable à la diffusion gratuite sur internet des données juridiques produites par le Journal officiel et les tribunaux. Les bibliothécaires-documentalistes juridiques représentent la majorité des membres de l'association, suivis par certains représentants des éditeurs et des juristes. Juriconnexion a créé la liste de discussion du même nom, qui traite des mêmes sujets mais reste ouverte aux non-membres." En mai 2001, l'association approche les 400 membres.

= La médiathèque de l'Institut français de Londres

L'Institut français de Londres est un organisme officiel français destiné à faire connaître la langue et la culture françaises dans la capitale britannique. 5.000 étudiants environ suivent les cours de langue chaque année, ce qui fait de cet institut l'un des plus importants instituts français au monde. Le centre culturel inclut une bibliothèque multimédia, un cinéma, une salle de conférence et un restaurant.

Anissa Rachef est bibliothécaire dans cet organisme. "Je suis chargée du catalogage du fonds documentaire qui est constitué de livres, de vidéos, de disques compacts et de disques optiques ainsi que de périodiques, écrit-elle. Avant mon installation à Londres, soit de 1980 à 1983, j'ai travaillé à la bibliothèque universitaire d'Alger en qualité d'attachée de recherche. C'est d'Alger et en deux ans que j'ai préparé le DSB (diplôme supérieur des bibliothèques), diplôme de conservateur assimilé à celui de l'ENSB de Lyon (Ecole nationale supérieure des bibliothèques, devenue ensuite l'ENSSIB - Ecole nationale supérieure des sciences de l'information et des bibliothèques, ndlr). Recrutée selon un statut local depuis septembre 1987 à l'Institut français de Londres, j'y exerce le métier de bibliothécaire au sein d'une équipe de huit membres. Par ailleurs, titulaire d'un diplôme de FLE (français langue étrangère), j'assure des heures d'enseignement de français dans le même institut.

La médiathèque de l'Institut français de Londres fut inaugurée en mai 1996. L'objectif est double: servir un public s'intéressant à la culture et la langue françaises et 'recruter' un public allophone en mettant à disposition des produits d'appel tels que vidéos documentaires, livres audio, CD-Rom. La mise en place récente d'un espace multimédia sert aussi à fidéliser les usagers. L'installation d'un service d'information rapide a pour fonction de répondre dans un temps minimum à toutes sortes de questions posées via courrier électronique, ou par fax. Ce service exploite les nouvelles technologies pour des recherches très spécialisées. Nous élaborons également des dossiers de presse destinés aux étudiants et professeurs préparant des examens de niveau secondaire. Je m'occupe essentiellement de catalogage, d'indexation et de cotation. Je suis chargée également du service de prêt inter-bibliothèques. J'anime des ateliers in situ de catalogage UNIMARC (MARC: machine readable catalogue) ainsi que des ateliers d'indexation RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié). J'élabore ponctuellement des aménagements de vedettes matières propres à notre catalogue. J'utilise internet pour des besoins de base. Recherches bibliographiques, commande de livres, courrier professionnel, prêt inter-bibliothèques. C'est grâce à internet que la consultation de catalogues collectifs, tels SUDOC (Système universitaire de documentation) et OCLC (Online Computer Library Center), a été possible. C'est ainsi que que j'ai pu mettre en place un service de fourniture de documents extérieurs à la médiathèque. Des ouvrages peuvent désormais être acheminés vers la médiathèque pour des usagers ou bien à destination des bibliothèques anglaises."

11.2. Numérisation en mode texte et en mode image

La numérisation du document imprimé, c'est-à-dire sa conversion sous une forme chiffrée binaire, peut être effectuée soit en mode texte, soit en mode image.

La numérisation en mode texte consiste à scanner le livre puis à contrôler le résultat à l'écran en relisant le tout. Les documents originaux manquant de clarté - certains livres anciens par exemple - sont saisis ligne après ligne. Ce mode de numérisation est long, et la notion de livre ou de page n'est pas conservée, puisque le texte apparaît en continu à l'écran. Cette méthode est nettement plus coûteuse que la numérisation en mode image, mais très préférable, puisqu'elle permet la recherche textuelle, l'indexation, les recherches séquentielles, les analyses, les comparaisons, etc. C'est la méthode utilisée par le Projet Gutenberg (11.1.1), la Bibliothèque électronique de Lisieux (11.1.3), et bien d'autres.

La numérisation en mode image correspond à la "photographie" du livre page après page. La notion de livre est conservée. La version informatique est en quelque sorte le fac-similé de la version imprimée. On peut donc "feuilleter" le texte page après page sur l'écran. C'est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, bibliothèque numérique de la Bibliothèque nationale de France (BnF). Même si, pour des raisons de coût, la BnF a choisi la numérisation en mode image, elle utilise le mode texte pour les tables des matières, les sommaires et les légendes des corpus iconographiques, afin de faciliter la recherche plein-texte. Pourquoi ne pas tout numériser en mode texte ? La BnF répond sur le site de Gallica: "Le mode image conserve l'aspect initial de l'original y compris ses éléments non textuels. Si le mode texte autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR (optical character recognition), implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation. Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 35.000 documents (représentant presque 15 millions de pages) mis en ligne."

Selon Pierre Schweitzer, l'architecte designer qui a conçu @folio, support numérique de lecture nomade, "le mode image permet d'avancer vite et à très faible coût. C'est important car la tâche de numérisation du domaine public est immense. Il faut tenir compte aussi des différentes éditions: la numérisation du patrimoine a pour but de faciliter l'accès aux oeuvres, il serait paradoxal qu'elle aboutisse à focaliser sur une édition et à abandonner l'accès aux autres. Chacun des deux modes de numérisation s'applique de préférence à un type de document, ancien et fragile ou plus récent, libre de droit ou non (pour l'auteur ou pour l'édition), abondamment illustré ou pas. Les deux modes ont aussi des statuts assez différents: en mode texte ça peut être une nouvelle édition d'une oeuvre, en mode image c'est une sorte d''édition d'édition', grâce à un de ses exemplaires (qui fonctionne alors comme une fonte d'imprimerie pour du papier: une trace optique sur un support, numérique, c'est assez joli à réaliser). En pratique, le choix dépend bien sûr de la nature du fonds à numériser, des moyens et des buts à atteindre. Difficile de se passer d'une des deux façons de faire."

L'équipe d'@folio travaille notamment sur le logiciel Mot@Mot, une passerelle entre @folio (voir 8.1) et les fonds numérisés en mode image. "La plus grande partie du patrimoine écrit existant est fixé dans des livres, sur du papier, explique Pierre Schweitzer. Pour rendre ces oeuvres accessibles sur la toile, la numérisation en mode image est un moyen très efficace. Le projet Gallica en est la preuve. Mais il reste le problème de l'adaptation des fac-similés d'origine à nos écrans de lecture aujourd'hui: réduits brutalement à la taille d'un écran, les fac-similés deviennent illisibles. Sauf à manipuler les barres d'ascenseur, ce qui nécessite un ordinateur et ne permet pas une lecture confortable. La solution proposée par Mot@mot consiste à découper le livre, mot à mot, du début à la fin (enfin, les pages scannées du livre...). Ces mots restent donc des images, il n'y a pas de reconnaissance de caractères, donc pas d'erreur possible. On obtient une chaîne d'images-mots liquide, qu'on peut remettre en page aussi facilement qu'une chaîne de caractères. Il devient alors possible de l'adapter à un écran de taille modeste, sans rien perdre de la lisibilité du texte. La typographie d'origine est conservée, les illustrations aussi."

11.3. Les bibliothèques traditionnelles sont-elles menacées?

Face à un web encyclopédique et des bibliothèques numériques de plus en plus nombreuses, les jours des bibliothèques traditionnelles sont-ils comptés? Ou bien, au contraire, l'internet joue-t-il un rôle de catalyseur pour les relancer?

En fait, il n'est peut-être pas très opportun d'opposer bibliothèque traditionnelle et bibliothèque numérique. Nombre de bibliothèques numériques sont créées par des bibliothèques traditionnelles à partir de leurs propres fonds. Grâce à quoi la consultation de ces fonds devient facile. Ce qui n'était pas le cas jusque-là, pour des raisons diverses: souci de conservation des documents rares et fragiles, heures d'ouverture réduites, nombreux formulaires à remplir, longs délais de communication, pénurie de personnel. Autant de barrières à franchir qui demandaient souvent au lecteur une patience à toute épreuve et une détermination hors du commun pour arriver jusqu'au document. A présent, si on tient absolument à consulter l'original, on le fait en connaissance de cause, après avoir "feuilleté" le fac-similé numérique sur le web.

Autre élément à prendre en compte, la bibliothèque numérique peut enfin rendre comptatibles deux objectifs qui ne l'étaient guère, à savoir la conservation des documents et leur prêt. Dorénavant le document ne quitte son rayonnage qu'une seule fois pour être scanné, et le grand public y a facilement accès.

Un exemple parmi d'autres: depuis décembre 2000, le site web de la Bibliothèque municipale de Lyon donne accès à la plus importante collection française d'enluminures médiévales, à savoir 12.000 images scannées dans 457 documents appartenant à la bibliothèque: manuscrits allant du 5e au 16e siècle, incunables ou livres de la Renaissance. Les documents sont à dominante religieuse (bibles, missels, bréviaires, pontificaux, livres d'heures, droit canon) ou profane (philosophie, histoire, littérature, sciences, etc.). Les images qui ont été numérisées - plusieurs centaines pour certains documents - sont les peintures en pleine page et les miniatures, ainsi que les initiales ornées et les décors des marges.

Autre exemple significatif, depuis novembre 2000, la version numérique de la Bible de Gutenberg, premier ouvrage à avoir jamais été imprimé, est en accès libre sur le site de la British Library. Cette Bible date de 1454-1455, et elle aurait été imprimée par Gutenberg en 180 exemplaires dans son atelier de Mayence (Allemagne). 48 exemplaires, dont certains incomplets, existeraient toujours. La British Library en possède deux versions complètes, et une partielle. En mars 2000, dix chercheurs et experts techniques de l'Université Keio de Tokyo et de NTT (Nippon Telegraph and Telephone Communications) sont venus travailler sur place pendant deux semaines pour numériser ces deux Bibles, légèrement différentes, à l'aide de matériels hautement sophistiqués.

La bibliothèque numérique menace-t-elle pour autant la bibliothèque traditionnelle? Il y a quelques années, sur leur site web, alors que l'internet en était encore à ses débuts, plusieurs grandes bibliothèques insistaient sur la nécessité de garder son importance à la communication physique des imprimés, manuscrits, partitions musicales, bandes sonores, etc., tout en affirmant avoir conscience de la nécessité du développement parallèle des documents numériques. Ce type de commentaires a disparu. Les rôles respectifs des bibliothèques traditionnelles et des bibliothèques numériques semblent assez clairs maintenant.

Les bibliothèques nationales et autres grandes bibliothèques de conservation ont pour mission de préserver un patrimoine pluricentenaire - manuscrits, incunables, livres imprimés, collections de journaux, partitions musicales, gravures, images, photos, films, documents électroniques, etc. - accumulé au fil des siècles grâce au dépôt légal. Si le fait de disposer de supports numériques favorise à la fois la conservation et la communication, il faut bien un endroit pour stocker les documents physiques originaux, à commencer par les Bibles de Gutenberg.

Les bibliothèques publiques ne semblent pas près de disparaître non plus. A l'heure actuelle, malgré l'engouement suscité par le livre électronique, pratiquement personne n'est prêt à lire Zola ou Proust à l'écran. Mais c'est peut-être une question de génération. Et la mise sur le marché d'un livre électronique bon marché, suivi du papier électronique dans quelques années, risque de changer bien des choses.

Pour les bibliothèques spécialisées, par contre, le changement est nettement plus radical. Dans nombre de domaines où l'information la plus récente est primordiale, on s'interroge maintenant sur l'utilité d'aligner des documents imprimés sur des rayonnages, alors qu'il est tellement plus pratique de rassembler, stocker, archiver, organiser, cataloguer et diffuser des documents électroniques, et de les imprimer seulement à la demande.

L'avenir sera-t-il les bases de données numériques décrites dans les dernières pages de Chaos et cyberculture (éditions du Lézard, 1997) de Timothy Leary, philosophe et visionnaire? "Toute l'information du monde est à l'intérieur. Et grâce au cyberespace, tout le monde peut y avoir accès. Tous les signaux humains contenus jusque-là dans les livres ont été numérisés. Ils sont enregistrés et disponibles dans ces banques de données, sans compter tous les tableaux, tous les films, toutes les émissions de télé, tout, absolument tout." Reste à savoir si la consultation sera gratuite ou payante.

12. APPRENDRE ET ENSEIGNER

[Dans ce chapitre:]

[12.1. Dictionnaires et encyclopédies en ligne // 12.2. Bases de données en ligne // 12.3. L'université et le numérique / L'Université de Caen / La Webster University de Genève / L'Université de Lausanne / L'Université de Tokyo / L'Université de Toronto // 12.4. Les perspectives]

12.1. Dictionnaires et encyclopédies en ligne

Un des premiers dictionnaires disponibles gratuitement sur le web est le Dictionnaire universel francophone en ligne, qui correspond à la partie "noms communs" de la version imprimée du dictionnaire du même nom, issu de la collaboration d'Hachette avec l'AUPELF-UREF (Agence universitaire de la francophonie), et publié par Hachette Edicef. Cette partie "noms communs" répertorie 45.000 mots et 116.000 définitions. Elle présente "sur un pied d'égalité, le français dit 'standard' et les mots et expressions en français tel qu'on le parle sur les cinq continents". Pour la langue anglaise, le site Merriam-Webster OnLine permet l'accès libre au Collegiate Dictionary et au Collegiate Thesaurus, deux ouvrages de référence.

La fin 1999 marque le saut du papier au numérique pour plusieurs encyclopédies de renom. En décembre 1999, les éditions Atlas mettent en ligne gratuitement sur le web leur encyclopédie WebEncyclo. La recherche est possible par mots-clefs, thèmes, médias (cartes, liens internet, photos, illustrations) et idées. Depuis les débuts du site, un appel à contribution incite les spécialistes d'un sujet donné à envoyer des articles.

Décembre 1999 voit aussi la mise en ligne du site Britannica.com, qui propose en accès libre et gratuit l'équivalent des 32 volumes de la 15e édition de l'Encyclopaedia Britannica (dont la version imprimée est toujours disponible au prix de 1.250 $US, soit 1.320 euros). Le site propose aussi l'actualité mondiale, une sélection d'articles de 70 magazines, un guide des meilleurs sites web (plus de 125.000 sites), une sélection de livres, etc., le tout étant accessible à partir d'un moteur de recherche unique. Depuis septembre 2000, le site fait partie des cent sites les plus visités au monde. En ligne aussi, l'ensemble du fonds documentaire de l'Encyclopaedia Universalis, soit 28.000 articles signés par 4.000 auteurs. La consultation est payante sur la base d'un abonnement annuel, mais de nombreux documents sont également en accès libre. Disponible depuis mars 2000 en consultation payante, la version en ligne des 20 volumes du célèbre Oxford English Dictionary bénéficie d'une mise à jour trimestrielle d'environ 1.000 entrées nouvelles ou révisées. Le Quid, encyclopédie en un volume réactualisée une fois par an depuis 1963, met de nombreux documents en accès libre sur le web. Encarta, la fameuse encyclopédie de Microsoft, est en accès libre et gratuit depuis septembre 2000.

Toujours en accès libre, Eurodicautom, proposé par le Service de traduction de la Commission européenne, est un dictionnaire multilingue de termes économiques, scientifiques et techniques, juridiques, etc., relatifs aux divers champs d'activité de l'Union européenne. Il permet des combinaisons entre ses onze langues officielles (allemand, anglais, danois, espagnol, finnois, français, grec, hollandais, italien, portugais et suédois), ainsi que le latin.

Réalisé par l'Office de la langue française du Québec, Le Signet est dénommé à juste titre "la référence branchée en terminologie". Il donne accès à six mille fiches bilingues français-anglais dans le secteur des technologies de l'information. TERMITE est la base de données quadrilingue (anglais, espagnol, français et russe) de la Section de traduction de l'Union internationale des télécommunications (UIT). Composée de 59.000 entrées, elle est alimentée à la fois par les traducteurs de l'UIT et des spécialistes des télécommunications extérieurs à l'UIT.

Moins d'un an après la mise en ligne gratuite d'encyclopédies générales de renom, autre évènement: la mise en ligne gratuite en septembre 2000 du Grand dictionnaire terminologique (GDT), qui rassemble un fonds terminologique de 3 millions de termes français et anglais du vocabulaire industriel, scientifique et commercial, dans 2.000 domaines d'activité. Ce fonds équivaudrait à 3.000 ouvrages de référence imprimés. Sa mise en ligne est le résultat d'un partenariat entre l'Office de la langue française du Québec, auteur du dictionnaire, et la société Semantix, spécialisée dans la mise au point de solutions logicielles pour l'intégration de fonctions linguistiques. Cette mise en ligne est un succès: un mois plus tard, le GDT a été consulté par 1,3 million de personnes, avec des pointes de 60.000 requêtes quotidiennes. "Nous croyons que la nouvelle de l'accessibilité à un dictionnaire terminologique bilingue gratuit dans internet s'est répandue comme une traînée de poudre parmi les internautes, qui se communiquent très rapidement les nouvelles, explique Francis Malka, fondateur et chef de la direction technologique de Semantix (cité par l'AFP). Nous recevons des requêtes de partout à travers le globe, même si la grande majorité des requêtes provient du Canada."