Le livre, de l'imprimé au numérique

Chapter 2

Chapter 23,717 wordsPublic domain

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le jour de la fête nationale, à l'instigation de Michael Shepard et David Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une production qui débute en décembre 2007. Les cent premiers livres sont disponibles en mars 2008, avec des livres en anglais, en français et en italien.

Le Projet Gutenberg franchit la barre des 25.000 livres en avril 2008. Le 25.000e livre est English Book Collectors (Collectionneurs de livres anglais) de William Younger Fletcher (publié en 1902). Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.

Le Projet Gutenberg comptabilise 30.000 livres en octobre 2009. Le 30.000e livre est The Bird Book (Le livre des oiseaux), de Chester Albert Reed (publié en 1915).

Principale source des livres du Projet Gutenberg, Distributed Proofreaders (DP) fête ses dix ans en octobre 2010, avec plus de 18.000 livres numérisés, relus et corrigés par les soins de plusieurs milliers de volontaires.

= Du passé vers l'avenir

Le pari fait par Michael Hart en 1971 est donc réussi. Mais les résultats du Projet Gutenberg ne se mesurent pas seulement à des chiffres. Les résultats se mesurent aussi à l'influence du projet, qui est considérable. Premier site d'information sur l'internet et première bibliothèque numérique, le Projet Gutenberg a inspiré bien d'autres bibliothèques numériques au fil des ans, à commencer par le Projekt Runeberg pour la littérature scandinave ou le Projekt Gutenberg-DE pour la littérature allemande.

Le Projekt Runeberg est la première bibliothèque numérique suédoise de livres du domaine public. Elle est créée en décembre 1992 par Lysator, un club informatique d'étudiants, en collaboration avec la bibliothèque de l'Université de Linköping (Suède), pour produire et organiser des versions électroniques gratuites de la littérature nordique classique. 200 oeuvres sont disponibles en 1998, avec une liste de 6.000 auteurs nordiques en tant qu'outil de développement des collections.

Projekt Gutenberg-DE est la première bibliothèque numérique allemande de livres du domaine public. Plusieurs dizaines de textes peuvent être lus en ligne en 1998, avec une page web pour les textes courts et plusieurs pages - une par chapitre - pour les oeuvres plus longues. Une liste alphabétique d'auteurs et de titres est également disponible, ainsi qu'une courte biographie et bibliographie pour chaque auteur.

La structure administrative et financière du Projet Gutenberg se limite au strict minimum, avec une devise qui tient en trois mots: «Less is more.» Michael Hart insiste régulièrement sur la nécessité d'un cadre aussi souple que possible laissant toute initiative aux volontaires, et la porte grande ouverte aux idées nouvelles. Le but est d'assurer la pérennité du projet indépendamment des crédits, des coupures de crédits et des priorités culturelles, financières et politiques du moment. Pas de pression possible donc par le pouvoir et par l'argent. Et respect à l'égard des volontaires, qui sont assurés de voir leur travail utilisé pendant de nombreuses années, si ce n'est pour plusieurs générations, d'où l'intérêt d'un format numérique qui soit toujours valable dans quelques siècles. Le suivi régulier du projet est assuré grâce à une lettre d'information hebdomadaire et mensuelle, des forums de discussion, des wikis et des blogs.

Les dons servent à financer des ordinateurs et des scanners, et à envoyer des CD-ROM et DVD gratuits à tous ceux qui en font la demande. Suite au CD-ROM Best of Gutenberg disponible en août 2003 avec une sélection de 600 titres et à un premier DVD disponible en décembre 2003 avec 9.400 titres, un deuxième DVD est disponible en juillet 2006 avec 17.000 titres. A partir de 2005, CD-ROM et DVD sont disponibles sous forme d'images ISO sur le site de BitTorrent, ces images pouvant être téléchargées pour graver des CD-ROM et DVD sur place à titre personnel. En 2007, le Projet Gutenberg envoie 15 millions de livres par voie postale sous forme de CD-ROM et DVD.

Chose souvent passée sous silence, Michael Hart est le véritable inventeur de l'ebook. Si on considère l'ebook dans son sens étymologique, à savoir un livre numérisé pour diffusion sous forme de fichier électronique, celui-ci aurait donc quarante ans et serait né avec le Projet Gutenberg en juillet 1971. Une paternité beaucoup plus réconfortante que les divers lancements commerciaux dans un format propriétaire ayant émaillé le début des années 2000. Il n'y a aucune raison pour que la dénomination «ebook» ne désigne que l'ebook commercial et soit réservée aux Amazon, Barnes & Noble, 00h00, Gemstar, Google Books et autres. L'ebook non commercial est un ebook à part entière - et non un parent pauvre - tout comme l'édition électronique non commerciale est une forme d'édition à part entière, et tout aussi valable que l'édition commerciale. En 2003, les etexts du Projet Gutenberg deviennent des ebooks, pour coller à la terminologie ambiante.

En juillet 1971, l'envoi d'un fichier de 5 Ko à cent personnes aurait fait sauter l'embryon de réseau disponible à l'époque. En novembre 2002, le Projet Gutenberg peut mettre en ligne les 75 fichiers du Human Genome Project - à savoir le séquençage du génome humain -, chaque fichier se chiffrant en dizaines sinon en centaines de méga-octets. Ceci peu de temps après la parution initiale du Human Genome Project en février 2001, puisqu'il appartient d'emblée au domaine public.

En 2004, la capacité de stockage des disques durs est telle qu'il serait possible de faire tenir l'intégralité de la Library of Congress au format texte sur un support de stockage coûtant 140 dollars US. Et quelques années seulement nous sépareraient d'une clé USB (Universal Serial Bus) permettant de stocker l'intégralité du patrimoine écrit de l'humanité.

La demande est énorme. En témoigne le nombre de téléchargements, qui se comptent désormais en dizaines de milliers par jour.

A la date du 31 juillet 2005, on compte 37.532 fichiers téléchargés dans la journée, 243.808 fichiers téléchargés dans la semaine et 1.154.765 fichiers téléchargés dans le mois.

A la date du 6 mai 2007, on compte 89.841 fichiers téléchargés dans la journée, 697.818 fichiers téléchargés dans la semaine et 2.995.436 fichiers téléchargés dans le mois. Courant mai, ce nombre atteint les 3 millions.

À la date du 15 mars 2010, on compte 103.422 fichiers téléchargés dans la journée, 751.037 fichiers téléchargés dans la semaine et 3.033.824 fichiers téléchargés dans le mois.

Ceci uniquement pour le principal site de téléchargement, ibiblio.org (basé à l'Université de Caroline du Nord, aux États-Unis), qui héberge aussi le site du Projet Gutenberg. Le deuxième site de téléchargement est l'Internet Archive, qui est le site de sauvegarde et qui met à la disposition du Projet Gutenberg une capacité de stockage illimitée.

Un «Top 100» recense les cent titres et les cent auteurs les plus téléchargés dans la journée, dans la semaine et dans le mois.

Le Projet Gutenberg dispose de 38 sites miroirs répartis dans de nombreux pays, et il en cherche d'autres. La circulation des fichiers se fait aussi en mode P2P (Peer-to-Peer), qui permet d'échanger des fichiers directement d'un utilisateur à l'autre.

Les livres du Projet Gutenberg peuvent aider à combler la fracture numérique. Ils sont aisément téléchargeables sur PDA. Un ordinateur ou un PDA d'occasion ne coûte que quelques dollars ou quelques dizaines de dollars, en fonction du modèle. Certains PDA fonctionnent à l'énergie solaire, permettant la lecture dans les régions pauvres ou reculées.

Plus tard, il sera peut-être possible d'envisager une traduction simultanée dans une centaine de langues, en utilisant un logiciel de traduction automatique qui aurait alors un taux de fiabilité de l'ordre de 99%, un pourcentage dont on est encore loin. Ce logiciel de traduction automatique serait relayé par des traducteurs (non pas des machines, mais des êtres humains), sur un modèle comparable à la technologie OCR actuellement relayée par des correcteurs (non pas des logiciels, mais des êtres humains) pour offrir un contenu de grande qualité.

Quelque 40 ans après les débuts du Projet Gutenberg, Michael Hart se définit toujours comme un fou de travail dédiant toute sa vie à son projet, qu'il voit comme étant à l'origine d'une révolution néo- industrielle. Il se définit aussi comme altruiste, pragmatique et visionnaire. Après avoir été traité de toqué pendant de nombreuses années, il force maintenant le respect.

Au fil des ans, la mission du Projet Gutenberg reste la même, à savoir changer le monde par le biais de l'ebook gratuit indéfiniment utilisable et reproductible, et favoriser ainsi la lecture et la culture pour tous à moindres frais. Cette mission se résume en quelques mots: «encourager la création et la distribution d'ebooks», par autant de personnes que possible, et par tous les moyens de diffusion possibles, tout en prenant les virages nécessaires pour intégrer de nouvelles idées, de nouvelles méthodes et de nouveaux supports.

L'ONLINE BOOKS PAGE

[Résumé] L'Online Books Page est créée en janvier 1993 par John Mark Ockerbloom pour répertorier les textes électroniques anglophones du domaine public en accès libre sur le web. À cette date, John Mark est doctorant à l'Université Carnegie Mellon (Pennsylvanie, États-Unis). En 1999, il rejoint l'Université de Pennsylvanie pour travailler à la R&D (recherche et développement) de la bibliothèque numérique. À la même époque, il y transfère l'Online Books Page tout en gardant la même présentation, très sobre, et tout en poursuivant son travail d'inventaire dans le même esprit. Ce répertoire recense plus de 20.000 titres en 2003 (dont 4.000 textes publiés par des femmes), 25.000 titres en 2006, 30.000 titres en 2007 (dont 7.000 textes du Projet Gutenberg) et 35.000 titres en 2009.

= Un répertoire d'oeuvres en accès libre

Alors que certains numérisent les oeuvres littéraires du domaine public, comme le Projet Gutenberg et des projets connexes, d'autres se donnent pour tâche de répertorier celles qui sont en accès libre sur le web, en offrant au lecteur un point d'accès commun. C'est le cas de John Mark Ockerbloom, doctorant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, États-Unis), qui crée l'Online Books Page pour recenser les oeuvres anglophones.

Cinq ans plus tard, en septembre 1998, John Mark relate: «J'étais webmestre ici pour la section informatique de la CMU (Carnegie Mellon University), et j'ai débuté notre site local en 1993. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l'origine l'Online Books Page était l'une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des versions web de certains textes du Projet Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d'autres sites. J'ai remarqué que de nombreux sites (et pas seulement le Projet Gutenberg ou Wiretap) proposaient des livres en ligne, et qu'il serait utile d'en avoir une liste complète qui permette de télécharger ou de lire des livres où qu'ils soient sur l'internet. C'est ainsi que mon index a débuté.

J'ai quitté mes fonctions de webmestre en 1996, mais j'ai gardé la gestion de l'Online Books Page, parce qu'entre temps je m'étais passionné pour l'énorme potentiel qu'a l'internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j'ai du mal à rester à jour. Je pense pourtant poursuivre cette activité d'une manière ou d'une autre. Je suis très intéressé par le développement de l'internet en tant que médium de communication de masse dans les prochaines années. J'aimerais aussi rester impliqué dans la mise à disposition gratuite de livres sur l'internet, que ceci fasse partie intégrante de mon activité professionnelle, ou que ceci soit une activité bénévole menée sur mon temps libre.»

Fin 1998, John Mark Ockerbloom obtient son doctorat en informatique. En 1999, il rejoint l'Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique. À la même époque, il y transfère l'Online Books Page tout en gardant la même présentation, très sobre, et tout en poursuivant son travail d'inventaire dans le même esprit. Ce répertoire recense 12.000 livres en ligne en 1999, 20.000 livres en 2003 (dont 4.000 textes publiés par des femmes), 25.000 livres en 2006, 30.000 livres en 2007 (dont 7.000 textes du Projet Gutenberg) et 35.000 livres en 2009.

= Le durcissement du copyright

En 1999, le débat fait rage sur le durcissement de la loi sur le copyright (qui date de 1976) suite à un amendement de cette loi daté du 27 octobre 1998. De nombreuses oeuvres censées tomber dans le domaine public restent désormais sous copyright, au grand dam de Michael Hart, fondateur du Projet Gutenberg, de John Mark Ockerbloom et de bien d'autres. La législation de 1998 porte un coup très rude aux bibliothèques numériques, en plein essor avec le développement du web. Mais comment faire le poids vis-à-vis des majors de l'édition? Nombre de titres doivent être retirés des collections.

Michael Hart raconte en juillet 1999: «J'ai été le principal opposant aux extensions du copyright, mais Hollywood et les grands éditeurs ont fait en sorte que le Congrès ne mentionne pas mon action en public. Les débats actuels sont totalement irréalistes. Ils sont menés par "l'aristocratie terrienne de l'âge de l'information" et servent uniquement ses intérêts. Un âge de l'information? Et pour qui?»

Pour ne prendre qu'un exemple, le classique mondial Gone With the Wind (Autant en emporte le vent) de Margaret Mitchell, publié en 1939, aurait dû tomber dans le domaine public au bout de 56 ans, en 1995, conformément à la législation de l'époque, libérant ainsi les droits pour les adaptations en tous genres. Suite aux législations de 1976 et 1998, ce classique ne devrait désormais tomber dans le domaine public qu'en 2035.

John Mark Ockerbloom explique en août 1999: «À mon avis, il est important que les internautes comprennent que le copyright est un contrat social conçu pour le bien public - incluant à la fois les auteurs et les lecteurs. Ceci signifie que les auteurs doivent avoir le droit d'utiliser de manière exclusive et pour un temps limité les oeuvres qu'ils ont créées, comme ceci est spécifié dans la loi actuelle sur le copyright. Mais ceci signifie également que leurs lecteurs ont le droit de copier et de réutiliser ce travail autant qu'ils le veulent à l'expiration de ce copyright.

Aux États-Unis, on voit maintenant diverses tentatives visant à retirer ces droits aux lecteurs, en limitant les règles relatives à l'utilisation de ces oeuvres, en prolongeant la durée du copyright (y compris avec certaines propositions visant à le rendre permanent) et en étendant la propriété intellectuelle à des travaux distincts des oeuvres de création (comme on en trouve dans les propositions de copyright pour les bases de données). Il existe même des propositions visant à entièrement remplacer la loi sur le copyright par une loi instituant un contrat beaucoup plus lourd. Je trouve beaucoup plus difficile de soutenir la requête de Jack Valenti, directeur de la MPAA [Motion Picture Association of America], qui demande d'arrêter de copier les films sous copyright, quand je sais que, si ceci était accepté, aucun film n'entrerait jamais dans le domaine public (...). Si l'on voit les sociétés de médias tenter de bloquer tout ce qu'elles peuvent, je ne trouve pas surprenant que certains usagers réagissent en mettant en ligne tout ce qu'ils peuvent. Malheureusement, cette attitude est à son tour contraire aux droits légitimes des auteurs.»

Comment résoudre cela pratiquement? «Ceux qui ont des enjeux dans ce débat doivent faire face à la réalité, et reconnaître que les producteurs d'oeuvres et leurs usagers ont tous deux des intérêts légitimes dans l'utilisation de celles-ci. Si la propriété intellectuelle était négociée au moyen d'un équilibre des principes plutôt que par le jeu du pouvoir et de l'argent que nous voyons souvent, il serait peut-être possible d'arriver à un compromis raisonnable.»

LA PRESSE SE MET EN LIGNE

[Résumé] Ce qui se passe pour la presse en ligne dans les années 1990 préfigure ce qui se passera pour le livre en ligne dans les années 2000, d'où l'intérêt de ce court chapitre. Au début des années 1990, les premières éditions électroniques de journaux sont disponibles par le biais de services commerciaux tels que America Online ou CompuServe. Avec l'apparition du premier navigateur fin 1993 et la croissance rapide du web qui s'ensuit, nombre de zines non commerciaux proposent une version électronique ou bien naissent directement sous forme électronique. À partir de 1995, les grands titres de la presse en ligne lancent leurs propres sites, très différents selon les titres, et ces sites évoluent ensuite rapidement.

= L'E-zine-list

Les premiers titres purement électroniques sont des oeuvres courtes, répertoriées dans l'E-zine-list, une liste créée en été 1993 par John Labovitz. Abrégé de fanzine ou magazine, un zine est généralement l'oeuvre d'une personne ou d'un petit groupe. Quant au e-zine, abrégé de zine électronique, il est uniquement diffusé par courriel ou sur un site web. Le plus souvent, il ne contient pas de publicité, ne vise pas un profit commercial et n'est pas dirigé vers une audience de masse.

Comment l'E-zine-list débute-t-elle? Dans l'historique présent sur le site, John Labovitz relate qu'à l'origine son intention est de faire connaître Crash, un zine imprimé dont il souhaite faire une version électronique. À la recherche de répertoires, il ne trouve que le groupe de discussion Alt.zines et des archives comme The Well et The Etext Archives. Lui vient alors l'idée d'un répertoire organisé. Il commence avec douze titres classés manuellement sur un traitement de texte. Puis il écrit sa propre base de données.

En quatre ans, de 1993 à 1997, les quelques dizaines d'e-zines deviennent plusieurs centaines, et la signification même d'e-zine s'élargit pour recouvrir tout type de publication publiée par voie électronique, même s'«il subsiste toujours un groupe original et indépendant désormais minoritaire qui continue de publier suivant son coeur ou de repousser les frontières de ce que nous appelons un e-zine» (John Labovitz). En été 1998, l'E-zine-list comprend 3.000 titres.

= La presse imprimée

Au début des années 1990, les premières éditions électroniques de journaux sont disponibles par le biais de services commerciaux tels que America Online ou CompuServe. Suite à l'apparition du premier navigateur fin 1993 et à la croissance rapide du web qui s'ensuit, les organes de presse créent leurs propres sites.

Au Royaume-Uni, le Times et le Sunday Times font web commun sur un site dénommé Times Online, avec possibilité de créer une édition personnalisée.

Aux États-Unis, la version en ligne du Wall Street Journal est payante, avec 100.000 abonnés en 1998. Celle du New York Times est disponible sur abonnement gratuit. Le Washington Post propose l'actualité quotidienne en ligne et de nombreux articles archivés, le tout avec images, sons et vidéos. Pathfinder (rebaptisé ensuite Time) est le site web du groupe Time-Warner, éditeur de Time Magazine, Sports Illustrated, Fortune, People, Southern Living, Money, Sunset, etc. On peut y lire les articles «maison» et les rechercher par date ou par sujet. Lancé en 1992 en Californie, Wired, premier magazine imprimé entièrement consacré à la culture cyber, est bien évidemment présent sur le web.

Mis en ligne en février 1995, le site web du mensuel Le Monde diplomatique est le premier site d'un périodique imprimé français. Monté dans le cadre d'un projet expérimental avec l'Institut national de l'audiovisuel (INA), ce site est inauguré lors du forum des images Imagina. Il donne accès à l'ensemble des articles depuis janvier 1994, par date, par sujet et par pays. L'intégralité du mensuel en cours est consultable gratuitement pendant deux semaines suivant sa parution. Un forum de discussion permet au journal de discuter avec ses lecteurs.

Fin 1995, le quotidien Libération met en ligne son site web, peu après le lancement du Cahier Multimédia, un cahier imprimé hebdomadaire inclus dans l'édition du jeudi. Le site propose la Une du quotidien, la rubrique Multimédia (qui regroupe les articles du Cahier Multimédia et les archives des cahiers précédents), le Cahier Livres complété par Chapitre Un (le premier chapitre des nouveautés retenues par le quotidien) et bien d'autres rubriques. La rubrique Multimédia est ensuite rebaptisée Numériques.

Le site du quotidien Le Monde est lancé en 1996. On y trouve des dossiers en ligne, la Une en version graphique à partir de 13 h, l'intégralité du journal avant 17 h, l'actualité en liaison avec l'AFP (Agence France-Presse), et des rubriques sur la Bourse, les livres, le multimédia et le sport. En 1998, le journal complet en ligne coûte 5 FF (0,76 euros) alors que l'édition papier coûte 7,50 FF (1,15 euros). S'ils concernent le multimédia, les articles du supplément imprimé hebdomadaire Télévision-Radio-Multimédia sont disponibles gratuitement en ligne dans la rubrique Multimédia, rebaptisée ensuite Nouvelles technologies.

L'Humanité est le premier quotidien français à proposer la version intégrale du journal en accès libre. Classés par rubriques, les articles sont disponibles entre 10 h et 11 h du matin, à l'exception de L'Humanité du samedi, disponible en ligne le lundi suivant. Tous les articles sont archivés sur le site.

La presse régionale est tout aussi présente sur le web, par exemple Dernières nouvelles d'Alsace et Ouest-France.

Lancé en septembre 1995, le site des Dernières nouvelles d'Alsace propose l'intégrale de l'édition du jour ainsi que des informations pratiques: cours de la Bourse, calcul des impôts, etc., avec 5.500 visites quotidiennes en juin 1998. Il offre aussi une édition abrégée en allemand.

Le site web du quotidien Ouest-France est mis en ligne en juillet 1996. D'abord appelé France-Ouest, le site est ensuite renommé Ouest-France, du nom du journal.

Quelles sont les retombées de l'internet pour les journalistes? Selon Bernard Boudic, le responsable éditorial du site, interviewé en juin 1998, «elles sont encore minces. Nous commençons seulement à offrir un accès internet à chacun (rédaction d'Ouest-France: 370 journalistes répartis dans soixante rédactions, sur douze départements... pas simple). Certains utilisent internet pour la messagerie électronique (courrier interne ou externe, réception de textes de correspondants à l'étranger, envoi de fichiers divers) et comme source d'informations. Mais cette pratique demande encore à s'étendre et à se généraliser. Bien sûr, nous réfléchissons aussi à tout ce qui touche à l'écriture multimédia et à sa rétro-action sur l'écriture imprimée, aux changements d'habitudes de nos lecteurs, etc. (...) Internet est à la fois une menace et une chance. Menace sur l'imprimé, très certainement (captation de la pub et des petites annonces, changement de réflexes des lecteurs, perte du goût de l'imprimé, concurrence d'un média gratuit, que chacun peut utiliser pour diffuser sa propre info, etc.). Mais c'est aussi l'occasion de relever tous ces défis, de rajeunir la presse imprimée.»

Tous sujets que l'on retrouve quelques années plus tard dans les débuts du livre numérique: rapport accru de l'auteur avec ses lecteurs, nécessité d'une formation technique, version payante et/ou version gratuite, version numérique et/ou version imprimée, etc.

AMAZON.COM