Le Livre 010101, Tome 2 (1998-2003)
Chapter 6
Dès novembre 1995, Pascal Chartier, gérant de la librairie du Bât d’Argent (Lyon), crée Livre-rare-book, un site professionnel de livres d’occasion, anciens et modernes. En juin 1998, il définit l’internet comme "peut-être la pire et la meilleure des choses. La pire parce qu’il peut générer un travail constant sans limite et la dépendance totale. La meilleure parce qu’il peut s’élargir encore et permettre surtout un travail intelligent!" En août 2003, Livre-rare-book propose un catalogue de plus d’un million de livres émanant de quelque 320 librairies, et un annuaire électronique international recensant près de 4.000 librairies.
Autre réalisation, celle du Syndicat national de la librairie ancienne et moderne (SLAM), un syndicat professionnel regroupant 220 librairies françaises. Le SLAM met en ligne un premier site web en 1997, puis le remplace en juillet 1999 par un deuxième site d’une conception plus dynamique. Alain Marchiset, président du SLAM, explique en juillet 2000: "Ce site intègre une architecture de type 'base de données', et donc un véritable moteur de recherche, qui permet de faire des recherches spécifiques (auteur, titre, éditeur, et bientôt sujet) dans les catalogues en ligne des différents libraires. Le site contient l’annuaire des libraires avec leurs spécialités, des catalogues en ligne de livres anciens avec illustrations, un petit guide du livre ancien avec des conseils et les termes techniques employés par les professionnels, et aussi un service de recherche de livres rares. De plus, l’association organise chaque année en novembre une foire virtuelle du livre ancien sur le site, et en mai une véritable foire internationale du livre ancien qui a lieu à Paris et dont le catalogue officiel est visible aussi sur le site. (...)
Les libraires membres proposent sur le site du SLAM des livres anciens que l’on peut commander directement par courrier électronique et régler par carte de crédit. Les livres sont expédiés dans le monde entier. Les libraires de livres anciens vendaient déjà par correspondance depuis très longtemps au moyen de catalogues imprimés adressés régulièrement à leurs clients. Ce nouveau moyen de vente n’a donc pas été pour nous vraiment révolutionnaire, étant donné que le principe de la vente par correspondance était déjà maîtrisé par ces libraires. C’est simplement une adaptation dans la forme de présentation des catalogues de vente qui a été ainsi réalisée. Dans l’ensemble, la profession envisage assez sereinement ce nouveau moyen de vente."
Résolument optimiste en 1999 et 2000, la profession revoit ensuite ses espérances à la baisse. En juin 2001, Alain Marchiset écrit: "Après une expérience de près de cinq années sur le net, je pense que la révolution électronique annoncée est moins évidente que prévue, et sans doute plus 'virtuelle' que réelle pour le moment. Les nouvelles technologies n’ont pas actuellement révolutionné le commerce du livre ancien. Nous assistons surtout à une série de faillites, de rachats et de concentrations de sociétés de services (principalement américaines) autour du commerce en ligne du livre, chacun essayant d’avoir le monopole, ce qui bien entendu est dangereux à la fois pour les libraires et pour les clients qui risquent à la longue de ne plus avoir de choix concurrentiel possible. Les associations professionnelles de libraires des 29 pays fédérées autour de la Ligue internationale de la librairie ancienne (LILA) ont décidé de réagir et de se regrouper autour d’un gigantesque moteur de recherche mondial sous l’égide de la LILA. Cette fédération représente un potentiel de 2.000 libraires indépendants dans le monde, mais offrant des garanties de sécurité et de respect de règles commerciales strictes. Ce nouveau moteur de recherche de la LILA (en anglais ILAB) en pleine expansion est déjà référencé par AddALL et BookFinder.com."
4.2. Librairies en ligne
Apparues au milieu des années 1990, les librairies en ligne ont pour vitrine un site web, et toutes leurs transactions s’effectuent sur le réseau. Le site web permet de consulter le catalogue et de passer commande. Il permet aussi de lire des résumés, des extraits et des critiques de livres. En 2003, les principales librairies en ligne francophones ont pour nom Alapage, Chapitre.com et Amazon.fr. Fondée en 1996 par Patrice Magnard, Alapage rejoint le groupe France Télécom en septembre 1999 puis devient en juillet 2000 une filiale à part entière de Wanadoo (le fournisseur d'accès internet de France Télécom). Librairie indépendante créée en 1997 par Juan Pirlot de Corbion, Chapitre.com comprend plusieurs secteurs: livres neufs, livres neufs à prix réduit, livres anciens, revues anciennes ou épuisées, gravures et affiches. Amazon.fr est la filiale que le grand libraire américain ouvre en août 2000 dans l’hexagone.
Amazon.com est le pionnier des librairies en ligne. Son histoire est donc intéressante à ce titre. Fondé par Jeff Bezos, Amazon voit le jour en juillet 1995 à Seattle, sur la côte ouest des Etats-Unis. Quinze mois auparavant, au printemps 1994, Jeff Bezos fait une étude de marché pour décider du meilleur produit de consommation à vendre sur l’internet. Dans sa liste de vingt produits marchands, qui comprennent entre autres les vêtements et les instruments de jardinage, les cinq premiers du classement se trouvent être les livres, les CD, les vidéos, les logiciels et le matériel informatique.
"J’ai utilisé tout un ensemble de critères pour évaluer le potentiel de chaque produit, relate Jeff Bezos dans le kit de presse d’Amazon. Le premier critère a été la taille des marchés existants. J’ai vu que la vente des livres représentait un marché mondial de 82 milliards de dollars. Le deuxième critère a été la question du prix. Je voulais un produit bon marché. Mon raisonnement était le suivant: puisque c’était le premier achat que les gens allaient faire en ligne, il fallait que la somme à payer soit modique. Le troisième critère a été la variété dans le choix: il y avait trois millions de titres de livres alors qu’il n’y avait que 300.000 titres pour les CD, par exemple."
La vente de livres en ligne débute en juillet 1995, avec dix salariés et trois millions d’articles. Amazon devient vite une référence dans le commerce électronique, et son évolution rapide est suivie de près par des analystes de tous bords. En novembre 2000, la société compte 7.500 salariés, 28 millions d’articles, 23 millions de clients et quatre filiales (Royaume-Uni, Allemagne, France et Japon), auxquelles s’ajoute en juin 2002 une cinquième filiale au Canada. La maison mère diversifie progressivement ses activités. Elle vend non seulement des livres, des vidéos, des CD et des logiciels, mais aussi des produits de santé, des jouets, des appareils électroniques, des ustensiles de cuisine, des outils de jardinage, etc. En novembre 2001, la vente des livres, disques et vidéos ne représente plus que 58% du chiffre d’affaires. Admiré par certains, le modèle économique d'Amazon est violemment contesté par d’autres, notamment en matière de gestion du personnel.
La présence européenne d’Amazon débute en 1998. Les deux premières filiales sont implantées en Allemagne et au Royaume-Uni. En août 2000, avec 1,8 million de clients en Grande-Bretagne, 1,2 million de clients en Allemagne et quelques centaines de milliers de clients en France, la librairie réalise 23% de ses ventes hors des Etats-Unis. A la même date, elle ouvre sa filiale française.
A son ouverture, Amazon.fr compte quatre rivaux de taille: Fnac.com, librairie en ligne de la Fnac, Alapage, BOL.fr (fermé depuis), succursale de BOL.com, et Chapitre.com, librairie en ligne indépendante. Un mois après son lancement, Amazon.fr est à la seconde place des sites de biens culturels français, après Fnac.com. La société de mesure d’audience Media Metrix Europe donne les chiffres suivants pour septembre 2000: 401.000 requêtes individuelles pour Fnac.com, 217.000 requêtes pour Amazon.fr, 209.000 requêtes pour Alapage et 74.000 requêtes pour BOL.fr.
Contrairement à leurs homologues anglophones, les libraires en ligne français sont soumis à la loi sur le prix unique du livre. Ils ne peuvent se permettre les réductions substantielles proposées par leurs collègues situés aux Etats-Unis ou au Royaume-Uni, pays dans lesquels le prix du livre est libre. En revanche, les libraires en ligne français sont optimistes sur le développement d’un marché francophone international. Le nombre de librairies en ligne s’avère toutefois trop élevé par rapport au marché existant. En juillet 2001, BOL.com (BOL: Bertelsmann on line) annonce la fermeture de BOL.fr, succursale créée deux ans auparavant par les deux géants des médias Bertelsmann et Vivendi. A la même date, les difficultés rencontrées par d’autres libraires en ligne montrent la nécessité de revoir à la baisse des prévisions quelque peu optimistes, afin de laisser à la clientèle le temps de s’habituer à ce nouveau mode d’achat.
4.3. Librairies numériques
Dernière-née sur le web, la librairie numérique apparaît courant 2000, lorsque la vente de livres numériques commence à se généraliser. Comme son nom l'indique, la librairie numérique est une librairie vendant uniquement des livres numériques, le plus souvent par téléchargement, ou alors envoyés en pièce jointe à un courrier électronique. Les livres numériques sont diffusés dans plusieurs formats, les principaux formats étant le format PDF (lu par l’Acrobat Reader et l’Acrobat eBook Reader), le format LIT (lu par le Microsoft Reader), le format PRC (lu par le Mobipocket Reader) et le format PDB (lu par le Palm Reader).
Les grandes librairies en ligne Amazon.com et Barnes & Noble.com ouvrent toutes deux un secteur numérique à quelques mois d’intervalle. Barnes & Noble.com ouvre son secteur eBooks en août 2000, suite à un accord passé avec Microsoft en janvier 2000 pour la vente de livres lisibles sur le Microsoft Reader. Amazon.com suit son concurrent de peu. Après avoir conclu une alliance avec Microsoft en août 2000, Amazon ouvre son service eBooks en novembre 2000, avec 1.000 titres disponibles au départ. En septembre 2001, Yahoo! leur emboîte le pas en créant son eBook Store, suite à des accords passés avec plusieurs éditeurs (Penguin Putnam, Simon & Schuster, Random House et HarperCollins).
Mais les librairies numériques ne sont pas l’apanage des mastodontes du métier, comme en témoigne l’activité de Numilog, librairie numérique française qui ouvre ses portes en septembre 2000.
En février 2001, Denis Zwirn, PDG de Numilog, relate: "Dès 1995, j’avais imaginé et dessiné des modèles de lecteurs électroniques permettant d’emporter sa bibliothèque avec soi et pesant comme un livre de poche. Début 1999, j’ai repris ce projet avec un ami spécialiste de la création de sites internet, en réalisant la formidable synergie possible entre des appareils de lecture électronique mobiles et le développement d’internet, qui permet d’acheminer les livres dématérialisés en quelques minutes dans tous les coins du monde. (...) Nous avons créé une base de livres accessible par un moteur de recherche. Chaque livre fait l’objet d’une fiche avec un résumé et un extrait. En quelques clics, il peut être acheté en ligne par carte bancaire, puis reçu par e-mail ou téléchargement." Quelques semaines plus tard, le site offre "des fonctionnalités nouvelles, comme l’intégration d’une 'authentique vente au chapitre' (les chapitres vendus isolément sont traités comme des éléments inclus dans la fiche-livre, et non comme d’autres livres) et la gestion très ergonomique des formats de lecture multiples".
Fondée en avril 2000 par Denis Zwirn, Hervé Zwirn et Patrick Armand, la société Numilog a une triple activité. Elle est à la fois une librairie en ligne, un studio de fabrication et un diffuseur. "Numilog est d’abord une librairie en ligne de livres numériques, explique Denis Zwirn. Notre site internet est dédié à la vente en ligne de ces livres, qui sont envoyés par courrier électronique ou téléchargés après paiement par carte bancaire. Il permet aussi de vendre des livres par chapitres. Numilog est également un studio de fabrication de livres numériques: aujourd’hui, les livres numériques n’existent pas chez les éditeurs, il faut donc d’abord les fabriquer avant de pouvoir les vendre, dans le cadre de contrats négociés avec les éditeurs détenteurs des droits. Ce qui signifie les convertir à des formats convenant aux différents 'readers' du marché. (...) Enfin Numilog devient aussi progressivement un diffuseur. Car, sur internet, il est important d’être présent en de très nombreux points du réseau pour faire connaître son offre. Pour les livres en particulier, il faut les proposer aux différents sites thématiques ou de communautés, dont les centres d’intérêt correspondent à leur sujet (sites de fans d’histoire, de management, de science-fiction...). Numilog facilitera ainsi la mise en oeuvre de multiples 'boutiques de livres numériques' thématiques."
Répartis en trois grandes catégories - savoir, guides pratiques et littérature - les livres sont disponibles dans plusieurs formats: format PDF (portable document format) avec lecture en pleine page sans défilement et sans zoom, format PDF avec mise en page reproduisant celle du livre imprimé, format LIT (abrégé du terme anglais: literature) pour le Microsoft Reader et format PRC (Palm resource) pour le Mobipocket Reader. Seront ajoutés progressivement les nouveaux formats utiles sur le marché.
En 2003, le catalogue comprend 3.500 ebooks (livres et périodiques) en français et en anglais, grâce à un partenariat avec une quarantaine d’éditeurs. Le but à long terme étant de "permettre à un public d’internautes de plus en plus large d’avoir progressivement accès à des bases de livres numériques aussi importantes que celles des livres papier, mais avec plus de modularité, de richesse d’utilisation et à moindre prix".
5. LE RESEAU DES BIBIOTHEQUES NUMERIQUES
[5.1. Numérisation: mode texte et mode image / 5.2. Bibliothèques pionnières / 5.3. Du bibliothécaire au cyberthécaire / 5.4. De la conservation à la communication]
Appelée aussi bibliothèque électronique ou bibliothèque virtuelle, la bibliothèque numérique semble être le principal apport de l’internet au monde du livre, et réciproquement. Au fil des ans sont mis en ligne des centaines puis des milliers d’oeuvres du domaine public, documents littéraires et scientifiques, articles, travaux universitaires et de recherche, images et bandes sonores sont disponibles à l’écran. Nombre d'entre eux sont en accès libre.
5.1. Numérisation: mode texte et mode image
Les bibliothèques numériques sont souvent constituées à partir de collections imprimées. La première étape est donc la numérisation de ces dernières. Cette numérisation peut être effectuée soit en mode texte, soit en mode image.
Comme son nom l’indique, la numérisation en mode texte implique la saisie d’un texte. Elle consiste à scanner le livre, puis à contrôler le résultat à l’écran en relisant intégralement le texte scanné et en le corrigeant si nécessaire. Quand les documents originaux manquent de clarté, pour les livres anciens par exemple, ils sont saisis ligne après ligne, de la première page à la dernière. Suite au scannage ou à la saisie, le texte numérisé apparaît en continu à l’écran, et la présentation de la page originale n’est pas conservée. A cause du temps passé au traitement de chaque livre, ce mode de numérisation est assez long, et donc nettement plus coûteux que la numérisation en mode image. Dans de nombreux cas, il est toutefois très préférable, puisqu’il permet l’indexation, la recherche et l’analyse textuelles, une étude comparative entre plusieurs textes ou plusieurs versions du même texte, etc. C’est la méthode utilisée par exemple par le Projet Gutenberg, fondé dès 1971, ou encore la Bibliothèque électronique de Lisieux, créée en 1996.
La numérisation en mode image correspond à la photographie du livre. La version informatique est le fac-similé numérique de la version imprimée. La présentation originale étant conservée, on peut feuilleter le texte page après page à l’écran. C’est la méthode employée pour les numérisations à grande échelle, par exemple pour la constitution de Gallica, le secteur numérique de la Bibliothèque nationale de France (BnF). Ne sont numérisés en mode texte que les tables des matières, les sommaires et les légendes des corpus iconographiques, ce afin de faciliter la recherche textuelle. Pourquoi ne pas tout numériser en mode texte? La BnF répond sur le site de Gallica: "Le mode image conserve l’aspect initial de l’original y compris ses éléments non textuels. Si le mode texte autorise des recherches riches et précises dans un document et permet une réduction significative du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR (optical character recognition), implique des coûts de traitement environ dix fois supérieurs à la simple numérisation. Ces techniques, parfaitement envisageables pour des volumes limités, ne pouvaient ici être économiquement justifiables au vu des 50.000 documents (représentant presque 15 millions de pages) mis en ligne." En 2003, Gallica donne accès à tous les documents libres de droit du fonds numérisé de la BnF, à savoir 70.000 ouvrages et 80.000 images allant du Moyen-Age au début du 20e siècle.
Concepteur de Mot@mot, un logiciel de remise en page de fac-similés numériques, Pierre Schweitzer insiste sur l’utilité des deux modes de numérisation. "Le mode image permet d’avancer vite et à très faible coût, explique-t-il en janvier 2001. C’est important car la tâche de numérisation du domaine public est immense. Il faut tenir compte aussi des différentes éditions: la numérisation du patrimoine a pour but de faciliter l’accès aux oeuvres, il serait paradoxal qu’elle aboutisse à se focaliser sur une édition et à abandonner l’accès aux autres. Chacun des deux modes de numérisation s’applique de préférence à un type de document, ancien et fragile ou plus récent, libre de droit ou non (pour l’auteur ou pour l’édition), abondamment illustré ou pas. Les deux modes ont aussi des statuts assez différents: en mode texte ça peut être une nouvelle édition d’une oeuvre, en mode image c’est une sorte d’'édition d’édition', grâce à un de ses exemplaires (qui fonctionne alors comme une fonte d’imprimerie pour du papier). En pratique, le choix dépend bien sûr de la nature du fonds à numériser, des moyens et des buts à atteindre. Difficile de se passer d’une des deux façons de faire."
Si une bibliothèque numérique est d’abord une bibliothèque d’oeuvres numérisées, ce terme s’applique aussi par extension à une collection organisée de liens vers des oeuvres numérisées disponibles sur le web. C’est le cas de The Online Books Page, un répertoire d’œuvres anglophones en accès libre créé en 1993 par John Mark Ockerbloom. C’est également le cas de The Internet Public Library (IPL), qui se définit comme la première bibliothèque publique de l’internet sur l’internet, à savoir une bibliothèque sélectionnant, organisant et cataloguant les ressources disponibles sur le réseau, et n’existant elle-même que sur celui-ci. Créée en mars 1995, cette bibliothèque publique d’un genre nouveau devient vite une référence. D’autres bibliothèques numériques proposent à la fois des textes numérisés par l’équipe en place et un ensemble de liens vers des oeuvres disponibles ailleurs. C’est le cas d’Athena, bibliothèque numérique fondée en 1994 par Pierre Perroud et hébergée sur le site de l’Université de Genève.
5.2. Bibliothèques pionnières
Objectif poursuivi par des générations de bibliothécaires, la diffusion d’oeuvres du domaine public devient enfin possible à très vaste échelle, d’une part grâce à la numérisation des livres en mode texte, dans un format simple qui puisse être lu sur toutes les machines et par tous les systèmes, d’autre part grâce au fait que, via l’internet, ces fichiers puissent être téléchargés librement par tout lecteur potentiel.
= Le Projet Gutenberg
Le Projet Gutenberg naît en juillet 1971 lorsque Michael Hart, alors étudiant à l’Université de l’Illinois (Etats-Unis), décide de convertir des oeuvres du domaine public au format électronique pour les mettre gratuitement à la disposition de tous. Le Projet Gutenberg est le premier site d’information sur un internet encore embryonnaire, qui débute véritablement en 1974 et prend son essor en 1983. Vient ensuite le web (sous-ensemble de l’internet), opérationnel en 1991, puis le premier navigateur, qui apparaît en novembre 1993. Lorsque l’utilisation du web se généralise, le Projet Gutenberg trouve un second souffle et un rayonnement international. Au fil des ans, des centaines d’oeuvres sont patiemment numérisées en mode texte par des volontaires de nombreux pays. D’abord essentiellement anglophones, les collections deviennent peu à peu multilingues.
Qu’ils aient été numérisés il y a vingt ans ou qu’ils soient numérisés maintenant, tous les textes électroniques sont au format ASCII (American standard code for information interchange), avec des lettres capitales pour les termes en italique, gras ou soulignés, afin que ces textes puissent être lus sans problème quels que soient le système d’exploitation et le logiciel utilisés. Libre à d’autres organismes de les convertir dans des formats différents s’ils le souhaitent.
Cinquante heures environ sont nécessaires pour scanner un livre, le corriger et le mettre en page. Un ouvrage de taille moyenne - par exemple un roman de Stendhal ou de Jules Verne - est en général composé de deux fichiers ASCII. Si certains livres anciens sont parfois saisis ligne après ligne, à cause du manque de clarté du texte original, les livres sont en général scannés en utilisant un logiciel OCR (optical character recognition), qui permet de convertir en fichier texte un fichier d’abord numérisé en mode image, afin de pouvoir corriger son contenu si nécessaire. Les livres numérisés sont ensuite relus et corrigés à deux reprises, parfois par deux personnes différentes.
"Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier, explique Michael Hart en août 1998. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d’enseignement. (...) Mon projet est de mettre 10.000 textes électroniques sur l’internet. Si je pouvais avoir des subventions importantes, j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques au lieu d’un milliard seulement. (...) J’introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible." Michael Hart se définit lui-même comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle.
Comment cette vaste entreprise a-t-elle débuté? Michael Hart numérise son premier texte le 4 juillet 1971. Le 4 juillet étant le jour de la fête nationale, il saisit le texte de la Déclaration de l’Indépendance des Etats-Unis (signée le 4 juillet 1776) sur le clavier de son ordinateur, et il envoie le fichier électronique correspondant à quelques collègues et amis.