Chapter 13
Gérée par Knight-Ridder Information, la Dialog Corporation comprend un certain nombre de bases documentaires dont la plus connue, Dialog, regroupe 450 bases de données sur le monde des affaires, l'industrie, l'actualité, les droits et brevets, la chimie, l'environnement, les sciences et techniques et les outils de référence. Une recherche par mots-clés permet d'opérer une sélection dans les dizaines de milliers de documents disponibles. Le serveur donne ensuite une liste bibliographique de tous les documents correspondant à la recherche lancée.
Les avantages de cette recherche automatisée sont énormes si on pense aux centaines de tables des matières ou d'index qu'il faudrait parcourir pour arriver au même résultat. A partir de cette bibliographie, on peut ensuite sélectionner quelques documents et demander leur envoi par voie informatique. Là aussi, le service est très coûteux. C'est la raison pour laquelle les services documentaires contrôlent de près les requêtes de leurs usagers sur Dialog.
LEXIS-NEXIS est un fournisseur international de services d'information et d'outils de gestion (en ligne, sur Internet, sur CD-ROM et sur support papier) à l'intention des professionnels du droit, de l'actualité et des affaires. Avec des clients dans plus de 60 pays, la société fait partie de Reed Elsevier (Londres), grande société d'édition et d'information.
Proposé par la CARL Corporation, UnCover permet de se procurer des articles provenant de 17.000 périodiques couvrant tous les domaines depuis 1988. Si l'envoi d'articles est payant, la recherche dans la base de données, les tables des matières des périodiques et l'index par mots-clés est gratuite.
Coût excepté, ces trois bases commerciales sont un exemple de ce que peuvent être les catalogues de demain, qui trouveront tout leur sens quand ils donneront accès aux documents numérisés.
8.3. Catalogues collectifs mondiaux
Internet, réseau mondial, rend possible la gestion de catalogues à l'échelle internationale. C'est ce que font deux associations basées aux Etats-Unis, le OCLC Online Computer Library Center et le Research Library Information Network (RLIN), qui gèrent des "réservoirs" de notices alimentés par les bibliothèques adhérentes, ce qui permet aux bibliothécaires d'unir leurs forces par-delà les frontières.
Le OCLC Online Computer Library Center est une association à but non lucratif proposant à ses membres - le plus souvent des bibliothèques et centres de documentation - toute une gamme de services avec deux objectifs: favoriser l'accès à l'information à l'échelon international et réduire les coûts correspondants.
Mais, dans l'esprit de nombreux bibliothécaires et documentalistes, le sigle OCLC est d'abord synonyme de catalogue. Depuis 1971, OCLC gère le OCLC Online Union Catalog, qui est devenu le plus grand catalogue collectif mondial avec ses 38 millions de notices en 370 langues (avec translitération pour les caractères non-romains) et ses 25.000 bibliothèques adhérentes. L'accroissement annuel est de 2 millions de notices. Les huit formats bibliographiques utilisés correspondent aux types de documents suivants: livres, périodiques, documents visuels, cartes et plans, documents mixtes, enregistrements sonores, partitions et documents informatiques.
Le but du OCLC Online Union Catalog part d'une idée simple propre à tous les catalogues collectifs: gagner du temps en évitant à de multiples catalogueurs de cataloguer la même publication au même moment. L'idée géniale était d'utiliser Internet et d'étendre le catalogue collectif au monde entier. Si le catalogueur trouve la notice, il la copie pour sa propre base. S'il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs suivants. La même règle vaut pour les catalogueurs de Paris (France), Tokyo (Japon) ou Canberra (Australie).
Contrairement à RLIN qui, lui, propose plusieurs notices pour le même document dans la mesure où celui-ci a été catalogué par différentes bibliothèques, OCLC enregistre seulement la première notice et demande instamment à ses adhérents de ne pas créer de double. Ceux-ci sont tenus d'utiliser la notice existante quand un document a déjà été catalogué, et ils ne créent une notice sur le réseau qu'après avoir vérifié l'absence d'une notice pour le document en question. Les notices sont créées en format USMARC (US machine readable catalog) selon les normes de catalogage AACR2 (Anglo-American cataloguing rules, version 2). Les notices de base disponibles sur le réseau ne peuvent être modifiées que par les bibliothèques habilitées à le faire parce qu'elles disposent d'une équipe de catalogueurs très expérimentés.
OCLC vit le jour en 1967. En 1967, les présidents des collèges et universités de l'Ohio fondèrent le Ohio College Library Center (OCLC) afin de développer un système informatisé permettant aux bibliothèques des institutions universitaires du même Etat de partager leurs ressources et de réduire ainsi leurs coûts de fonctionnement. Les premiers bureaux d'OCLC furent installés dans la bibliothèque centrale de la Ohio State University (OSU), et le OSU Research Center hébergea la première salle informatique d'OCLC. C'est à partir de cette implantation dans le monde universitaire que Frederick G. Kilgour, le premier président d'OCLC, fit passer OCLC d'un système informatique régional à destination de 54 établissements universitaires appartenant au même Etat à un réseau informatique couvrant le monde entier. En 1981, tout en gardant le même sigle, le Ohio College Library Center devint le OCLC Online Computer Library Center.
Une forte proportion des 25.000 bibliothèques participantes est située en Amérique du Nord. Ces bibliothèques appartiennent à des réseaux régionaux regroupant chacun plusieurs états pour les Etats-Unis ou plusieurs provinces pour le Canada. OCLC vise maintenant à développer le nombre de ses adhérents dans d'autres pays et continents. Les bibliothèques adhérentes recoivent les services d'OCLC grâce à OCLC Asie et Pacifique, OCLC Europe, OCLC Amérique Latine et Caraïbes, ou bien par le biais de distributeurs internationaux.
Outre la gestion du OCLC Online Union Catalog, OCLC propose des services tels que le catalogage, la gestion des acquisitions, le contrôle d'autorités, l'envoi de documents suite à une demande de prêt interbibliothèques, la référence en ligne, la recherche spécialisée dans les nouvelles technologies, le microfilmage et la scannérisation des documents. OCLC dispose aussi d'une maison d'édition, Forest Press, et d'une filière commerciale, Information Dimensions. Forest Press publie notamment la Dewey Decimal Classification, classification utilisée dans les bibliothèques publiques pour le classement des documents. Information Dimensions fournit des logiciels de gestion documentaire et éditoriale et des logiciels d'archivage électronique.
OCLC dispose également d'un service appelé NetFirst, qui répertorie, classe, catalogue et indexe les ressources disponibles sur Internet (articles complets, journaux électroniques, lettres d'information, sites gopher et catalogues de bibliothèques) et donne un résumé pour chacune d'elles. Les URL (uniform resource locators) des sites, les adresses électroniques et les forums de discussions sont formatés en liens hypertextes.
A la fois complémentaire et différent du catalogue d'OCLC, le gigantesque catalogue du Research Libraries Information Network (RLIN) comprend 82 millions de notices. Il est géré par le Research Libraries Group (RLG), une association à but non lucratif qui rassemble les organismes souhaitant améliorer l'accès à l'information dans les domaines de l'enseignement et de la recherche.
Des centaines de bibliothèques de recherche, dépôts d'archives, musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques et bibliothèques d'entreprise utilisent RLIN pour le catalogage, le prêt interbibliothèques et le contrôle des archives et des manuscrits. Catalogue collectif en ligne regroupant les notices de tous les organismes adhérents, RLIN est à la fois un système de recherche documentaire et une base de données internationale d'information bibliographique. 365 langues y sont représentées, et les notices sont également disponibles dans les alphabets des langues JACKPHY (japonais, arabe, chinois, coréen, persan, hébreu et yiddish) et du cyrillique.
RLIN inclut aussi l'English Short Title Catalogue (ESTC) et des fichiers d'autorités.
L'English Short Title Catalogue (ESTC) donne les descriptifs des publications anglaises ou de langue anglaise publiées entre 1473 et 1800. Ce catalogue "contient les notices de tous types de documents publiés en Grande-Bretagne ou dans ses colonies ou publiés en langue anglaise n'importe où dans le monde, et qui vont des oeuvres de Shakespeare et de La Bible du roi Jacques aux ballades et écrits anonymes". Précédemment appelée Eighteenth-Century Short Title Catalogue, la base, qui s'est fortement accrue en 1994 avec l'ajout de 75.000 notices de documents publiés avant 1701, a été rebaptisée English Short Title Catalogue. Ce catalogue d'environ 500.000 notices s'enrichit tous les jours de nouvelles notices provenant principalement de l'ESTC/Amérique du Nord et de la British Library.
Les fichiers d'autorités de RLIN comprennent le thésaurus d'art et d'architecture, le fichier d'autorités des auteurs personnels et collectifs de la Library of Congress et le fichier d'autorités des sujets, constitué des mots-clés et des renvois établis par la Library of Congress.
RLIN est notamment très prisé dans le domaine de l'histoire de l'art. Il rassemble les 65 bibliothèques américaines spécialisées dans les mêmes domaines, y compris des bibliothèques de musées. Le réseau compte 100.000 notices de catalogues d'expositions et 168.500 enregistrements de documents tels que photographies, diapositives, dessins, estampes ou affiches. Il inclut aussi les 110.000 notices de la base bibliographique Scipio, consacrée aux catalogues de ventes. Relié à d'autres bases de données, il permet par exemple de consulter la liste des thèses américaines.
8.4. L'avenir des catalogues en ligne
L'avenir des catalogues en réseau tient à l'harmonisation du format MARC (machine readable catalogue), qui est la norme utilisée pour le stockage et l'échange de notices bibliographiques. Le terme "catalogue" prête ici à confusion puisque le format MARC n'est ni un type de catalogue, ni une méthode de catalogage, mais seulement un ensemble de codes correspondant à chaque partie de la notice bibliographique pour permettre son traitement informatique.
Une vingtaine de versions MARC a vu le jour depuis le début des années soixante-dix: INTERMARC en France, UKMARC au Royaume-Uni, USMARC aux Etats-Unis, CAN/MARC au Canada, etc., correspondant chacune aux pratiques nationales de catalogage. Toutes ces versions posent de nombreux problèmes pour les échanges de données, si bien qu'on a créé UNIMARC pour disposer d'un format intermédiaire international. Les notices dans le format MARC d'origine sont d'abord converties en UNIMARC avant d'être converties à nouveau dans le format MARC de destination.
Dans le monde anglophone, la British Library (qui utilise UKMARC), la Library of Congress (qui utilise USMARC) et la Bibliothèque nationale du Canada (qui utilise CAN/MARC) sont en train d'harmoniser leurs formats MARC nationaux. Un programme de trois ans a été instauré en décembre 1995 pour mettre au point un format MARC commun aux trois bibliothèques.
Parallèlement, dans le contexte du Programme des bibliothèques lancé par l'Union européenne, l'accent a été mis en 1996 sur l'utilisation du format UNIMARC comme format commun d'échange entre tous les formats MARC utilisés par les bibliothèques européennes. Le groupe de travail constitué a étudié aussi les problèmes posés par les différentes polices de caractères, ainsi que la relation entre le format bibliographique et le format du document quand celui-ci sera disponible en ligne.
Certains préconisent l'utilisation de SGML (standard generalized markup language) comme format commun aux notices bibliographiques et aux documents hypertextuels et multimédias correspondants.
Comme la plupart des éditeurs stockent déjà des documents en format SGML, on songe à faire converger MARC et SGML. La Library of Congress a réalisé la DTD (definition of type of document, qui en définit la structure logique) pour le format USMARC, parce qu'elle sera sans doute de plus en plus amenée à vendre des données à la fois en SGML et en USMARC. Une DTD pour le format UNIMARC est également développée dans le cadre d'un projet de l'Union européenne. Dans son mémoire L'accès aux catalogues des bibliothèques par Internet, Thierry Samain mentionne l'adoption du format SGML par certaines bibliothèques pour encoder leurs données bibliographiques. Dans le catalogue collectif belge par exemple, l'utilisation de SGML permet d'ajouter des éléments descriptifs issus du format MARC et d'autres types de formats. Elle permet aussi de faciliter la production du CD-ROM annuel.
Dans Digital Literacy (New York, Wiley, 1997), Paul Gilster se demande si les moteurs de recherche d'Internet seront les catalogues de demain, ce qui n'est guère possible à l'heure actuelle: contrairement au système commun d'indexation propre aux bibliothèques américaines, chaque engin de recherche a sa propre méthode d'indexation, et l'usager doit se familiariser avec elle afin d'en tirer le meilleur parti.
Ceci dit, les remarques que fait Paul Gilster sur les engins de recherche d'Internet sont applicables aussi aux catalogues des bibliothèques vus à l'échelon mondial. Pour indexer leurs documents, un certain nombre de bibliothèques tentent d'harmoniser leurs mots-matière en utilisant par exemple ceux de la Library of Congress dans le monde anglophone ou ceux de RAMEAU (répertoire d'autorités matières encyclopédique et alphabétique unifié) ou de la Bibliothèque nationale du Canada dans le monde francophone. Malgré ces tentatives d'harmonisation, on ne compte pas le nombre de thésaurus utilisés de par le monde. Le meilleur test est une recherche par sujets dans le OCLC Union Library Catalog pour être persuadé du fait que l'absence d'un thésaurus universel est vraiment problématique.
Les bibliothèques auraient un gigantesque effort à fournir pour harmoniser leurs thésaurus ou leurs listes de mots-matière. En Europe, un thésaurus multilingue serait également indispensable, puisque chacun indexe en général ses publications dans sa propre langue. Le travail est titanesque. Puisque les bibliothèques et Internet sont destinés à collaborer étroitement, pourquoi ne pas envisager une liste multilingue commune à partir des meilleurs outils existant dans les deux domaines?
Un autre problème est celui de l'harmonisation des logiciels. En Europe, l'Union européenne a lancé le projet OPAC Network in Europe (ONE), pour un meilleur accès des OPAC (online public access catalogues) et des catalogues nationaux des bibliothèques européennes.
Réalisé entre janvier et décembre 1997, ONE a rassemblé 15 organismes dans 8 pays européens. Son objectif était de produire un logiciel permettant l'interaction entre les logiciels existants, de façon à n'avoir qu'un seul point d'accès par lequel les usagers d'un pays donné puissent se connecter aux catalogues des bibliothèques d'autres pays. Le but était à la fois d'encourager l'interconnexion entre les bibliothèques européennes pour une plus grande coopération et de résoudre les problèmes liés aux divers formats de notices et aux différentes polices de caractères. Le projet était également basé sur l'utilisation de protocoles internationaux comme la norme Z39.50.
Comme c'est eux qui, à terme, permettront l'accès au documents, les catalogues informatiques doivent être aussi parfaits que possible. On peut même rêver à des catalogues communs aux bibliothèques, aux librairies et aux éditeurs. Du fait de la rigueur et du professionnalisme qu'il implique, le catalogage est devenu un métier à part entière. La notice minimale: auteur, titre, éditeur fait maintenant place à une notice plus complexe régie par des normes internationales permettant un meilleur échange de données. Ce n'est d'ailleurs pas un hasard si la réputation d'une bibliothèque s'appuie en partie sur la qualité de son catalogue. Il est sa colonne vertébrale, et le sera de plus en plus avec le développement des cyberbibliothèques.
9. PERSPECTIVES
[Dans ce chapitre:]
[9.1. Propriété intellectuelle / 9.2. Droit du cyberespace / 9.3. Document imprimé et/ou électronique / 9.4. Numérisation et convergence multimédia / 9.5. La société de l'information]
Plutôt qu'une conclusion, difficile à envisager pour un sujet aussi neuf, on parlera plutôt de perspectives puisque, comme on l'a vu dans les chapitres précédents, Internet ouvre de nombreuses perspectives - avec son lot de problèmes à résoudre - dans tous les secteurs de l'imprimé.
Tout auteur a désormais la possibilité de faire connaître ses oeuvres en créant un site web, sans attendre de trouver un éditeur pour être publié, et il peut facilement échanger avec ses lecteurs grâce au courrier électronique.
Les cyberlibraires ont non seulement la possibilité de vendre les livres publiés dans leur propre pays, mais aussi celle de vendre des livres étrangers ou bien de vendre à l'étranger des livres publiés dans leur propre pays. Il leur faut encore convaincre les associations d'éditeurs ou de libraires dits "traditionnels" pour faire disparaître les frontières dans la vente de livres. Les lecteurs ont à leur disposition des extraits ou parfois même le texte intégral des nouveautés, qu'ils peuvent "feuilleter" tout à loisir à domicile. Plusieurs cyberlibrairies offrent aussi un véritable magazine littéraire avec un contenu éditorial chaque jour différent.
Les gestionnaires de catalogues peuvent enfin voir se concrétiser la possibilité de donner accès au texte du document à partir de sa notice bibliographique. Ceci est déjà vrai pour quelques milliers d'oeuvres appartenant au domaine public et, les cyberbibliothèques continuant de se développer rapidement, le mouvement ira en s'amplifiant. On étudie aussi la possibilité d'accéder au texte intégral de documents dits commerciaux moyennant une taxe correspondant au droit d'auteur, sans avoir recours à des prestataires aux tarifs souvent prohibitifs.
Les bibliothèques ont un nouvel outil de travail pour faire connaître leurs collections et développer des projets permettant de tisser davantage de liens avec leurs usagers réels et potentiels. Grâce à Internet, elles disposent aussi de la plus grande encyclopédie qui soit pour leur personnel et leurs lecteurs.
De nombreux journaux et magazines sont maintenant en ligne, avec des extraits ou l'intégrale de leur dernier numéro, ainsi que des dossiers sur les sujets d'actualité et les archives des numéros précédents. On assiste aux balbutiements d'une presse en ligne qui se voudrait différente de la presse papier. Quant aux périodiques spécialisés, rejoints par les éditeurs d'ouvrages universitaires et de recherche, ils songent à Internet comme une solution possible pour sortir de la crise éditoriale.
En plus de l'encyclopédie bouillonnante et multilingue que constitue Internet, tous les professionnels du livre ont désormais la possibilité d'un échange accru avec autant de correspondants qu'ils le souhaitent grâce au courrier électronique et aux forums de discussion.
Dans son courrier électronique du 8 juin 1998, Christiane Jadelot, ingénieur d'études à l'INaLF-Nancy (INaLF: Institut national de la langue française), racontait ses premiers pas sur Internet:
"J'ai commencé à utiliser vraiment l'Internet en 1994, je crois, avec un logiciel qui s'appelait Mosaic. J'ai alors découvert un outil précieux pour progresser dans ses connaissances en informatique et linguistique, littérature... Tous les domaines sont couverts. Il y a le pire et le meilleur, mais en consommateur averti, il faut faire le tri de ce que l'on trouve. J'ai surtout apprécié les logiciels de courrier, de transfert de fichiers, de connexion à distance. J'avais à cette époque des problèmes avec un logiciel qui s'appelait Paradox et des polices de caractères inadaptées à ce que je voulais faire. J'ai tenté ma chance et posé la question dans un groupe de News approprié. J'ai reçu des réponses du monde entier, comme si chacun était soucieux de trouver une solution à mon problème! Je n'étais pas habituée à ce type de solidarité! Les habitudes en France sont plutôt de travailler avec des cloisons étanches!"
Pour une fois, un nouvel outil (relativement) économique abolit à la fois les frontières et les distances puisque, que le cybernaute soit connecté à Paris, à Cuba ou à Hong-Kong, le tarif de connexion est celui d'une communication téléphonique locale. Nombreux sont les professionnels qui assistent ou participent à la création d'une toile artistique, scientifique ou littéraire francophone et multilingue abolissant les barrières de la distance et du temps.
Le bouleversement du monde de l'imprimé par Internet entraîne des perspectives nouvelles pour la propriété intellectuelle, le droit du cyberespace et l'édition électronique. La convergence multimédia entraîne elle aussi des changements majeurs dans les métiers du livre. Que nous réserve la société de l'information dont nous vivons les premières années?
9.1. Propriété intellectuelle
Qu'est-ce qu'un texte du domaine public? L'Association des bibliophiles universels (ABU), qui propose une cyberbibliothèque d'oeuvres du domaine public francophone, répond à cette question sur son site web: en France, un texte tombe dans le domaine public cinquante ans après la mort de son auteur. Les années de guerre (1914-1919 et 1938-1948) comptent double. Quand un texte appartient au domaine public, il peut être diffusé et reproduit, mais non mutilé ou déformé puisque le droit moral de l'auteur (paternité et respect de l'oeuvre) est intemporel. Même si une oeuvre est du domaine public, une édition donnée de cette oeuvre n'est pas pour autant libre de reproduction si elle est récente. La traduction, l'appareil critique (notes, préface, etc.) et l'appareil éditorial (tables, index, pagination) sont soumis au droit d'auteur.
Les sites web sont également soumis au droit d'auteur. Sur le site consacré à sa bibliothèque électronique Gallica, inaugurée en 1997, la Bibliothèque nationale de France donne les précisions suivantes:
"En application de la loi française 92-597 du 1er juillet 1992, portant code de la propriété intellectuelle, la Bibliothèque nationale de France est titulaire des droits d'auteur sur le site dénommé 'Gallica' et la base de données ainsi constituée. Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de la Bibliothèque nationale de France est illicite, et constitue une contrefaçon sanctionnée pénalement."
Le texte de la loi 92-597 du 1er juillet 1992, qui régit le droit d'auteur français, précise notamment que "l'auteur jouit sa vie durant du droit exclusif d'exploiter son oeuvre sous quelque forme que ce soit et d'en tirer un profit pécuniaire. Au décès de l'auteur, ce droit persiste au bénéfice de ses ayants droit, pendant l'année civile en cours et les cinquante années qui suivent."
Michael Hart, fondateur du Projet Gutenberg, grande cyberbibliothèque anglophone, explique aux volontaires fournissant des textes quelles sont les règles à suivre pour déterminer si un document appartient au domaine public et s'il peut donc faire partie des collections de la bibliothèque.