Chapter 12
Projet pionnier, le Projet Gutenberg a inspiré bien d'autres bibliothèques numériques depuis. Il débute en 1971 quand Michael Hart, étudiant à l'Université d'Illinois, reçoit un compte de 100 millions de dollars de "temps machine" dans le laboratoire informatique (Materials Research Lab) de son université. Il décide aussitôt de consacrer ce crédit à la recherche et au stockage des oeuvres du domaine public disponibles dans les bibliothèques. Il décide aussi de stocker les textes électroniques de la manière la plus simple possible, au format ASCII, avec des lettres capitales pour les termes en italique, gras ou soulignés, afin qu'ils puissent être lus sans problème quels que soient la machine et le logiciel utilisés. Peu après, il définit la "mission" du Projet Gutenberg: mettre à la disposition de tous le plus grand nombre possible d'oeuvres du domaine public. Travailleur acharné, il décide de dédier toute sa vie à son projet, qu'il voit comme étant à l'origine d'une révolution néo-industrielle.
Lorsque l'utilisation du web se généralise, le projet trouve un second souffle, et un rayonnement international. Les collections se chiffrent maintenant à 3.700 oeuvres (chiffres de juillet 2001) qui, au fil des années, ont été patiemment numérisées en mode texte par des volontaires de nombreux pays (600 volontaires actifs en 2000). Un total de 1.000 nouveaux livres devrait être traité en 2001. Cinquante heures environ sont nécessaires pour sélectionner, scanner, corriger et mettre en page un texte électronique. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est composé de deux fichiers ASCII. Si certains documents anciens sont parfois saisis ligne après ligne, le plus souvent parce que le texte original manque de clarté, les oeuvres sont en général scannées en utilisant un logiciel OCR (optical character recognition), puis elles sont relues et corrigées à double reprise, parfois par deux personnes différentes. D'abord essentiellement anglophones, les collections deviennent peu à peu multilingues.
"Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier, explique Michael Hart. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d'enseignement. (...) Ma carrière n'aurait pas existé sans l'internet, et le Projet Gutenberg n'aurait jamais eu lieu... Vous savez sûrement que le Projet Gutenberg a été le premier site d'information sur l'internet. Mon projet est de mettre 10.000 textes électroniques sur l'internet. Si je pouvais avoir des subventions importantes, j'aimerais aller jusqu'à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d'un milliard seulement. (...) J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible."
= The On-Line Books Page
Autre projet pilote à l'époque, The On-Line Books Page répertorie plus de 12.000 textes électroniques d'oeuvres anglophones en accès libre sur le web. John Mark Ockerbloom, qui est à l'époque étudiant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie), débute ce répertoire en 1993 dans le cadre du site web du département d'informatique, dont il est le webmestre.
"J'étais webmestre ici pour la section informatique du CMU (Carnegie Mellon University), et j'ai débuté notre site local en 1993, raconte John Mark Ockerbloom en septembre 1998. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l'origine The On-Line Books Page était une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des versions web de certains textes du Projet Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d'autres sites. J'ai remarqué que de nombreux sites (et pas seulement le Project Gutenberg ou Wiretap) proposaient des livres en ligne, et qu'il serait utile d'en avoir une liste complète qui permette de télécharger ou de lire des livres où qu'ils soient sur l'internet. C'est ainsi que mon index a débuté. J'ai quitté mes fonctions de webmestre en 1996, mais j'ai gardé The On-Line Books Page, parce que, entre temps, je m'étais passionné pour l'énorme potentiel qu'a l'internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j'ai du mal à rester à jour (en fait j'ai beaucoup de retard). Mais je pense pourtant continuer cette activité d'une manière ou d'une autre. Je suis très intéressé par le développement de l'internet en tant que médium de communication de masse dans les prochaines années. J'aimerais aussi rester impliqué d'une manière ou d'une autre dans la mise à disposition gratuite pour tous de livres sur l'internet, que ceci fasse partie intégrante de mon activité professionnelle ou que ceci soit une activité bénévole menée sur mon temps libre."
John Mark Ockerbloom obtient son doctorat en informatique en 1998. En 1999, il rejoint le département des bibliothèques et de l'informatique de l'Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique. A la même époque, il transfère The On-Line Books Page dans cette bibliothèque numérique. La présentation est toujours la même et les mises à jour sont régulières.
= La Bibliothèque électronique de Lisieux
La Bibliothèque électronique de Lisieux ouvre en juin 1996. "Ce site est entièrement consacré et exclusivement réservé à la mise à disposition sur le réseau (librement et gratuitement) de textes littéraires et documentaires du domaine public français afin de constituer une bibliothèque virtuelle qui complète celles déjà existantes", explique Olivier Bogros, son créateur, qui est aussi directeur de la bibliothèque municipale de Lisieux (Normandie). Dès sa création, ce site pionnier suscite beaucoup d'intérêt dans la communauté francophone parce qu'il montre ce qui est faisable sur le web avec beaucoup de détermination et des moyens limités. D'abord hébergé sur les pages du compte CompuServe d'Olivier Bogros, il est depuis juin 1998 installé sur un nouveau serveur avec un espace disque plus important (30 Mo) et un nom de domaine.
Quel est l'historique du site? La première étape est la "création d'un bulletin électronique d'informations bibliographiques locales (Les Affiches de Lisieux) en 1994 dont la diffusion locale ne rencontre qu'un très faible écho", raconte Olivier Bogros lors d'un premier entretien. Les étapes suivantes sont "en 1995 la numérisation de nos collections de cartes postales en vue de constituer une photothèque numérique" puis "la saisie de nouvelles d'auteurs d'origine normande courant 1995 en imitation (modeste) du projet de l'ABU (Association des bibliophiles universels) avec diffusion sur un BBS (bulletin board service) spécialisé. L'idée du site internet vient d'Hervé Le Crosnier, enseignant à l'Université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens (habitants de Lisieux, ndlr). Depuis cette date, un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année (deuxième semestre 1998, ndlr) la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement.... ainsi que la création d'un emploi jeune pour le développement des nouvelles technologies."
En juillet 1999, Olivier Bogros relate: "Nous réfléchissons, toujours dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie... - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand. (...) Les oeuvres à diffuser sont choisies à partir d'exemplaires conservés à la bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage (370 oeuvres sont actuellement disponibles en ligne). La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux...). De même nous laissons à d'autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne des textes excentriques et improbables. (...) La création et la maintenance du site ne sont encore que des activités marginales de la bibliothèque municipale (...) En fait, et pour les deux années à venir, l'essentiel de notre temps est consacré à la mise en place de la nouvelle médiathèque (avec une réelle intégration des nouvelles technologies) [et pour le quotidien] à l'enrichissement et la communication sur place des ressources locales (c'est-à-dire des informations physiquement localisées à la bibliothèque), le développement de la lecture dans les quartiers... La salle multimédia ouverte en octobre 1996 doit encore trouver son rythme de croisière, la consultation des cédéroms et la bureautique devançant souvent l'utilisation d'internet."
En août 2000, Olivier Bogros écrit: "La médiathèque n'ouvrira ses portes qu'en janvier 2002 et ce chantier va encore mobiliser l'essentiel de mon temps. Nous poursuivons modestement l'enrichissement du corpus de textes de la bibliothèque électronique. Une collaboration vient de s'engager entre la bibliothèque électronique de Lisieux et le site 'Langue du 19e siècle" à l'Université de Toronto. Les textes en ligne à Lisieux sont interrogeables en ligne à Toronto sous forme de bases de données interactives. L'initiative de ce projet, baptisé LexoTor, revient à M. Russon Wooldridge à la suite d'un colloque organisé en mai dernier par son université."
Lancé officiellement le 27 août 2000, LexoTor est une base de données qui fonctionne sous le logiciel TACTweb et qui permet l'interrogation en ligne des textes de la bibliothèque classés en différentes rubriques: oeuvres littéraires, notamment du 19e siècle; brochures et opuscules documentaires ; manuscrits, livres et brochures sur la Normandie; conférences et exposés transcrits par des élèves du Lycée Marcel Gambier. L'interrogation permet aussi les analyses et comparaisons textuelles. Le projet est issu de la rencontre d'Olivier Bogros avec Russon Wooldridge, professeur au département d'études françaises de l'Université de Toronto, lors d'un colloque international que ce dernier a organisé les 12 et 13 mai 2000 dans son université sur le thème: "Les études françaises valorisées par les nouvelles technologies d'information et de communication".
En mai 2001, Olivier Bogros poursuit: "La base Lexotor devrait pouvoir bénéficier dès ce mois-ci de la dernière version du logiciel TACTweb, ce qui rendra beaucoup plus riches et pertinentes les interrogations faites. Pour ce qui concerne Lisieux, le bâtiment de la médiathèque est sorti de terre, le gros oeuvre sera fini fin juin, la livraison est prévue pour novembre. Par contre l'ouverture initialement prévue pour janvier 2002 sera sans doute effective fin mars. Sur le site de la bibliothèque électronique, le travail se poursuit chaque mois avec la mise en ligne de textes. J'ai suspendu provisoirement la fabrication de hiboux (e-books, ndlr) au format Microsoft Reader ou Mobipocket. Il faudrait que je trouve un partenariat avec un autre site pour que les textes disponibles en HTML sur notre bibliothèque électronique soient aussi proposés ailleurs dans un format hiboux multiplateforme. A titre personnel, j'ai ouvert une autre bibliothèque électronique, Miscellanées, encore en devenir."
= La médiathèque de l'Institut Pasteur
Basé à Paris et dans plusieurs régions du monde, l'Institut Pasteur est une fondation privée dont la mission est de contribuer à la prévention et au traitement des maladies, en priorité infectieuses, par la recherche, l'enseignement, et des actions de santé publique.
"Le site web de la bibliothèque a pour vocation principale de servir la communauté pasteurienne, explique Bruno Didier, son webmestre. Il est le support d'applications devenues indispensables à la fonction documentaire dans un organisme de cette taille: bases de données bibliographiques, catalogue, commande de documents et bien entendu accès à des périodiques en ligne (un peu plus d'une centaine actuellement). C'est également une vitrine pour nos différents services, en interne mais aussi dans toute la France et à l'étranger. Il tient notamment une place importante dans la coopération documentaire avec les instituts du réseau Pasteur à travers le monde. Enfin j'essaie d'en faire une passerelle adaptée à nos besoins pour la découverte et l'utilisation d'internet. Il existe dans sa forme actuelle depuis 1996 et son audience augmente régulièrement."
En quoi consiste exactement son activité? "Je développe et maintiens les pages du serveur, ce qui s'accompagne d'une activité de veille régulière. Par ailleurs je suis responsable de la formation des usagers, ce qui se ressent dans mes pages. Le web est un excellent support pour la formation, et la plupart des réflexions actuelles sur la formation des usagers intègrent cet outil. C'est à la fois dans nos rapports avec l'information et avec les usagers que les changements ont eu lieu. Nous devenons de plus en plus des médiateurs, et peut-être un peu moins des conservateurs. Mon activité actuelle est typique de cette nouvelle situation: d'une part dégager des chemins d'accès rapides à l'information et mettre en place des moyens de communication efficaces, d'autre part former les utilisateurs à ces nouveaux outils. Je crois que l'avenir de notre métier passe par la coopération et l'exploitation des ressources communes. C'est un vieux projet certainement, mais finalement c'est la première fois qu'on dispose enfin des moyens de le mettre en place."
= Le centre de documentation de l'Organisation de coopération et de développement économiques (OCDE)
L'OCDE (Organisation de coopération et de développement économiques) regroupe trente pays membres "au sein d'une organisation qui, avant tout, offre aux gouvernements un cadre pour examiner, élaborer et perfectionner les politiques économiques et sociales", lit-on sur le site web de l'organisation. "Ils y comparent leurs expériences respectives, s'y efforcent d'apporter des réponses aux problèmes qui leur sont communs et s'y emploient à coordonner des politiques intérieures et internationales qui, dans le contexte actuel de mondialisation des économies, doivent former un ensemble de plus en plus homogène. (...) L'OCDE est un club de pays qui partagent les mêmes idées. C'est un club de riches en ce sens que ses membres produisent les deux tiers des biens et services du monde, mais ce n'est pas un club privé. En fait, l'exigence essentielle pour en devenir membre est qu'un pays soit attaché aux principes de l'économie de marché et de la démocratie pluraliste. Au noyau d'origine, constitué de pays d'Europe et d'Amérique du Nord, sont venus s'ajouter le Japon, l'Australie, la Nouvelle-Zélande, la Finlande, le Mexique, la République tchèque, la Hongrie, la Pologne et la Corée. De plus, l'OCDE a établi de nombreux contacts avec le reste du monde dans le cadre de programmes avec des pays de l'ancien bloc soviétique, d'Asie et d'Amérique latine, contacts qui pourraient, dans certains cas, déboucher sur une adhésion."
Situé dans un des bâtiments de son siège parisien et réservé aux agents de l'OCDE, le centre de documentation et d'information (CDI) permet la consultation de 60.000 monographies imprimées et 2.500 périodiques. Le CDI fournit aussi nombre de documents électroniques émanant du web, de bases de données et de CD-Rom. Peter Raggett, son directeur, a d'abord été en poste dans les bibliothèques gouvernementales du Royaume-Uni avant de devenir fonctionnaire international à l'OCDE en 1994, comme sous-directeur puis directeur du CDI. Il utilise l'internet depuis 1996. Les pages intranet du CDI, dont il est l'auteur, sont devenues une des principales sources d'information du personnel de l'organisation.
"Je dois filter l'information pour les usagers de la bibliothèque, ce qui signifie que je dois bien connaître les sites et les liens qu'ils proposent, explique Peter Raggett en juin 1998. J'ai sélectionné plusieurs centaines de sites pour en favoriser l'accès à partir de l'intranet de l'OCDE, et cette sélection fait partie du bureau de référence virtuel proposé par la bibliothèque à l'ensemble du personnel. Outre les liens, ce bureau de référence contient des pages de références aux articles, monographies et sites web correspondant aux différents projets de recherche en cours à l'OCDE, l'accès en réseau aux CD-Rom, et une liste mensuelle des nouveaux titres." En août 1999, il relate: "Notre site intranet va être complètement remanié d'ici la fin de l'année, et nous allons y mettre le catalogue de la bibliothèque, ce qui permettra à nos usagers d'y avoir accès directement de leur écran. Ce catalogue sera conforme à la norme Z3950 (une norme définissant un protocole pour la recherche documentaire d'un ordinateur à un autre, ndlr)." Depuis octobre 1999, le catalogue du CDI est disponible sur l'intranet.
Comment Peter Raggett voit-il l'avenir de la profession? "L'internet offre aux chercheurs un stock d'informations considérable. Le problème pour eux est de trouver ce qu'ils cherchent. Jamais auparavant on n'avait senti une telle surcharge d'informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur l'internet. A mon avis, les bibliothécaires auraient un rôle important à jouer pour améliorer la recherche et l'organisation de l'information sur l'internet. Je prévois aussi une forte expansion de l'internet pour l'enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l'autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois devenir de plus en plus un bibliothécaire virtuel. Je n'aurai pas l'occasion de rencontrer les usagers, ils me contacteront plutôt par courrier électronique, par téléphone ou par fax, j'effectuerai la recherche et je leur enverrai les résultats par voie électronique."
= Le centre de documentation de l'Institut d'études politiques (IEP) de Grenoble
Pierre Le Loarer est directeur du centre de documentation de l'Institut d'études politiques (IEP) de Grenoble. Conçu dès février 1998, le site web de l'IEP ouvre trois mois après, en mai. "J'étais le chef de projet, explique Pierre Le Loarer, d'autant que j'ai une formation multimédia, outre ma formation initiale en philosophie, documentation-bibliothèques et informatique. Il y avait un comité de pilotage (au sein de notre Institut) et également plusieurs partenaires: un graphiste (qui venait de créer le logo de l'Institut) à qui j'ai demandé de décliner des éléments cohérents pour le site, en liaison avec la société de multimédia; une société de création multimédia à qui j'ai demandé de créer une 'maquette' de page d'accueil et deux modèles de pages (page de rubrique principale, page de sous-rubrique) pour disposer d'une ligne graphique; une ergonome qui avait pour objet de tester et surtout de faire tester la version 1 (maquette) du site, pour ensuite réaliser une version 2 opérationnelle, ce qui a été fait; une rédactrice qui, avec moi-même, a repris, sélectionné les informations et même partiellement réécrit certains textes et surtout organisé avec moi les rubriques et sous-rubriques, créé les libellés d'intitulés, etc., ce travail étant soumis au comité de pilotage; le CRI (centre de recherche en informatique) de l'université pour réaliser les pages HTML en suivant les modèles, une fois validés, des pages de différents niveaux et également pour héberger le site. Dans un second temps, un professeur d'anglais m' a aidé à créer quelques pages en anglais. Aujourd'hui, le site est maintenu à jour par moi-même et une personne qui m'aide grandement pour cette tâche."
En quoi consiste exactement l'activité de Pierre Le Loarer? "Elle est très variée. Je ne reviens pas sur mes fonctions de directeur d'un centre de documentation, sinon pour insister sur deux facteurs: l'importance de la formation des étudiants à la recherche documentaire, à la connaissance des sources d'information, imprimées et électroniques, et à la production de documents sous forme numérique; la conception, que je reprends à mon compte, de la 'bibliothèque hybride' qui gère, donne accès à la fois aux documents imprimés et aux documents électroniques. Il me semble que l'on peut même parler de 'lecture hybride' où l'on passe de l'écran à divers supports imprimés et l'inverse.
Mes fonctions de chargé de mission TICE (technologies de l'information et de la communication pour l'éducation) visent à mettre ces TICE au service de la stratégie de l'Institut, pour son développement, pour renforcer encore la qualité de son enseignement, faciliter des accompagnements pédagogiques, aider au développement des relations internationales grâce aux facilités de l'échange électronique. Les TICE ne sont pas un but en soi, mais bien un outil au service d'objectifs stratégiques. Ceci passe, entre autres, par la création d'intranets pédagogiques, un renforcement de la formation en bureautique communicante pour les étudiants, les enseignants et le personnel administratif.
Quant à mon activité internet, elle a divers aspects, qui sont assez différents: gestionnaire de site, formateur pour un usage à la fois réfléchi et professionnel du web, animateur, participant à des séminaires, réunions diverses sur l'internet (et l'éducation, les collectivités territoriales, etc.). Membre de l'ISOC (Internet Society), je participe aux rencontres d'Autrans."
= La bibliothèque de l'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan
L'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan assure la formation des statisticiens pour les pays africains d'expression française. Cette formation est délivrée à travers quatre filières distinctes, conçues en fonction du niveau de recrutement des élèves: la filière ISE (ingénieurs statisticiens économistes), la filière ITS (ingénieurs des travaux statistiques), la filière AD (adjoints techniques) et la filière AT (agents techniques). A ce jour, l'ENSEA est le seul établissement de formation statistique qui délivre simultanément ces quatre types de formation à tous les pays francophones situés au sud du Sahara. L'ENSEA propose par ailleurs des actions de recyclage et de perfectionnement destinées aux cadres des administrations publiques et privées, et développe progressivement des programmes d'étude et de recherche.