40 years / 40 años / 40 ans

Part 3

Chapter 33,867 wordsPublic domain

À l'époque, le Projet Gutenberg s'articule en trois grands secteurs: (a) «Light Literature» (littérature de divertissement), qui inclut par exemple Alice's Adventures in Wonderland, Peter Pan ou Aesop's Fables (Fables d'Ésope); (b) «Heavy Literature» (littérature «sérieuse»), qui inclut par exemple La Bible, les oeuvres de Shakespeare ou Moby Dick; (c) «Reference Literature» (littérature de référence), composée d'encyclopédies et de dictionnaires, par exemple le Roget's Thesaurus. Un classement par rubriques plus détaillé remplacera par la suite ces trois secteurs.

Le Projet Gutenberg se veut universel, aussi bien pour les oeuvres choisies que pour le public visé, le but étant de mettre la littérature à la disposition de tous, en dépassant largement le public habituel des étudiants et des enseignants. Le secteur consacré à la littérature de divertissement est destiné à amener devant l'écran un public très divers, par exemple des enfants et leurs grands-parents recherchant le texte électronique de Peter Pan après avoir vu le film Hook, ou recherchant la version électronique d'Alice au pays des merveilles après avoir regardé l'adaptation filmée à la télévision, ou recherchant l'origine d'une citation littéraire après avoir vu un épisode de Star Trek. Pratiquement tous les épisodes de Star Trek citent des livres ayant leur correspondant numérique dans le Projet Gutenberg.

L'objectif est donc que le public, qu'il soit familier ou non avec le livre imprimé, puisse facilement retrouver des textes entendus dans des conversations, des films, des musiques, ou alors lus dans d'autres livres, journaux et magazines.

Les textes électroniques (appelés "etexts" ou "ebooks") sont stockés de la manière la plus simple possible, au format ASCII (American Standard Code for Information Interchange), pour que ces textes puissent être lus sans problème quels que soient la plateforme et le logiciel utilisés. Des lettres capitales remplacent les termes en italique, en gras et soulignés de la version imprimée. Les fichiers électroniques prennent peu de place et peuvent être facilement téléchargés. La recherche textuelle est tout aussi simple. Il suffit d'utiliser la fonction «rechercher» présente dans n'importe quel logiciel.

Michael Hart écrit en août 1998 lors d'un entretien par courriel: «Nous considérons le texte électronique comme un nouveau médium, sans véritable relation avec le papier. Le seul point commun est que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le papier peut concurrencer le texte électronique une fois que les gens y sont habitués, particulièrement dans les établissements d'enseignement.... Mon projet est de mettre 10.000 textes électroniques sur l'internet. [NDLR: Ce sera chose faite en octobre 2003.] Si je pouvais avoir des subventions importantes, j'aimerais aller jusqu'à un million et étendre aussi le nombre de nos usagers potentiels de 1,x% à 10% de la population mondiale, ce qui représenterait la diffusion de 1.000 fois un milliard de textes électroniques, au lieu d'un milliard seulement.»

# De 1.000 à 10.000 ebooks

Entre 1998 et 2000, la moyenne est constante, avec 36 nouveaux titres par mois. En mai 1999, les collections comptent 2.000 livres numériques. L'eBook #2000 est Don Quijote (Don Quichotte, 1605) de Cervantes, dans sa langue d'origine, en espagnol.

Distributed Proofreaders (DP) est lancé en octobre 2000 par Charles Franks pour permettre la correction partagée des livres entre de nombreux volontaires. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnée. Chacun travaille à son propre rythme. A titre indicatif, il est conseillé de relire une page par jour. C'est peu de temps sur une journée, et c'est beaucoup pour le projet.

Disponible en décembre 2000, l'eBook #3000 est le troisième volume de À l'ombre des jeunes filles en fleurs (1919) de Marcel Proust, dans sa langue d'origine, en français. La moyenne passe à 104 livres par mois en 2001.

Le Project Gutenberg Australia voir le jour en août 2001.

Mis en ligne en octobre 2001, l'eBook #4000 est The French Immortals Series (Collection de textes d'Immortels français), dans sa traduction anglaise. Publié à Paris en 1905 par la Maison Mazarin, ce livre rassemble plusieurs fictions d'écrivains couronnés par l'Académie française, comme Émile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet, etc.

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo da Vinci (Les Carnets de Léonard de Vinci), des carnets datant du début du 16e siècle et traduits de l'italien vers l'anglais. Ces carnets ont constamment été dans le Top 100 des livres téléchargés depuis leur mise en ligne.

En 1991, Michael Hart avait choisi de numériser Alice's Adventures in Wonderland et Peter Pan parce que, dans l'un et l'autre cas, leur version numérisée tenait sur une disquette de 360 Ko, le standard de l'époque. Quinze ans plus tard, en 2002, on dispose de disquettes de 1,44 Mo et on peut aisément compresser les fichiers en les zippant. Un fichier standard peut désormais comporter trois millions de caractères, plus qu'il n'en faut pour un livre de taille moyenne, puisqu'un roman de 300 pages numérisé au format ASCII représente un méga-octet. Un livre volumineux tient sur deux fichiers ASCII, téléchargeables tels quels ou en version zippée.

Cinquante heures environ sont nécessaires pour sélectionner un livre de taille moyenne, vérifier qu'il est bien du domaine public, le scanner, le corriger, le formater et le mettre en page.

Quelques numéros de livres sont réservés pour l'avenir, par exemple le numéro 1984 (eBook #1984) pour le roman éponyme de George Orwell, publié en 1949, et qui est donc loin d'être tombé dans le domaine public.

Au printemps 2002, les collections représentent le quart des oeuvres du domaine public en accès libre sur le web, recensées de manière pratiquement exhaustive par l'Internet Public Library (IPL), un beau résultat dû au patient travail de milliers de volontaires actifs dans de nombreux pays. En 2002, la production est de 203 nouveaux titres par mois.

En novembre 2002, le Projet Gutenberg met en ligne les 75 fichiers du Human Genome Project (Projet du génome humain, à savoir le séquençage du génome humain), ceci peu de temps après sa parution initiale en février 2001, puisqu'il appartient d'emblée au domaine public. Chaque fichier se chiffre en dizaines sinon en centaines de méga-octets.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril 2002, 10.000 livres en octobre 2003. L'eBook #10000 est The Magna Carta, qui fut le premier texte constitutionnel anglais, signé en 1215.

Entre avril 2002 et octobre 2003, les collections doublent, passant de 5.000 à 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348 nouveaux titres en 2003. Cette croissance rapide est due à l'activité de Distributed Proofreaders (DP), un site conçu en octobre 2000 pour permettre la correction partagée des livres entre de nombreux volontaires.

En août 2003, un CD Best of Gutenberg est disponible avec une sélection de 600 ebooks. En décembre 2003, date à laquelle le Projet Gutenberg fête ses 10.000 ebooks, la quasi-totalité de ceux-ci (9.400 ebooks) est gravée sur un DVD. CD et DVD sont envoyés gratuitement à qui en fait la demande. Libre ensuite à chacun de faire autant de copies que possible et de les distribuer autour de soi dans des écoles et des bibliothèques.

En septembre 2003, le Projet Gutenberg lance le Projet Gutenberg Audio eBooks, une collection de livres audio (lus par l'être humain), ainsi que le Sheet Music Subproject (Sous-projet pour les partitions musicales), une collection rassemblant des partitions musicales et des enregistrements musicaux. Un autre sous-projet rassemble des images fixes et animées.

# De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 ebooks. Plusieurs formats sont désormais présents, par exemple les formats HTML, XML et RTF, le format principal - et obligatoire - restant l'ASCII. Le tout représente 46.000 fichiers, soit une capacité totale de 110 Go (giga-octets). Le 13 février 2004, date de la conférence de Michael Hart au siège de l'UNESCO à Paris, les collections comprennent très exactement 11.340 ebooks dans 25 langues. En mai 2004, les 12.500 ebooks disponibles représentent 100.000 fichiers dans une vingtaine de formats, soit une capacité totale de 135 Go, destinée à doubler chaque année avec l'ajout d'environ 300 ebooks par mois (338 ebooks en 2004).

Parallèlement, le Project Gutenberg Consortia Center (PGCC), qui avait été lancé en 1997 pour rassembler des collections de livres numériques déjà existantes et provenant de sources diverses, est officiellement affilié au Projet Gutenberg en 2003.

Le Projet Gutenberg Europe est lancé en janvier 2004 à l'instigation du Projet Rastko, basé à Belgrade, en Serbie. Distributed Proofreaders Europe débute la production de livres numériques à la même date, avec cent livres disponibles en avril 2005. Les livres sont en plusieurs langues pour refléter la diversité linguistique prévalant en Europe.

En janvier 2005, le Projet Gutenberg met en ligne l'eBook #15000, The Life of Reason (La vie de raison, 1906) de George Santayana.

En juin 2005, le nombre de livres s'élève à 16.000. Si 25 langues seulement étaient présentes en février 2004, 42 langues sont représentées en juin 2005, dont le sanscrit et les langues mayas.

Le Project Gutenberg Australia (lancé en août 2001) fête ses 500 livres en juillet 2005.

Un nouveau secteur, dénommé Project Gutenberg PrePrints, est lancé en janvier 2006 pour accueillir de nouveaux documents suffisamment intéressants pour être mis en ligne, mais ne pouvant être intégrés aux collections du Projet Gutenberg sans traitement ultérieur par des volontaires, pour diverses raisons: collections incomplètes, qualité insuffisante, conversion souhaitée dans un autre format, etc. Les PrePrints comprennent 379 ebooks en décembre 2006, et 2.020 ebooks en février 2009.

En décembre 2006, le Projet Gutenberg franchit la barre des 20.000 livres. L'eBook #20000 est un livre audio, Twenty Thousand Leagues Under the Sea, version anglaise du roman Vingt mille lieues sous les mers (1869) de Jules Verne. La moyenne est de 345 nouveaux titres par mois en 2006.

S'il a fallu 32 ans et deux mois, de juillet 1971 à octobre 2003, pour numériser les 10.000 premiers livres, il n'aura fallu que trois ans et deux mois, d'octobre 2003 à décembre 2006, pour numériser les 10.000 livres suivants.

À la même date, le Project Gutenberg Australia approche les 1.500 livres (c'est chose faite en avril 2007) et le Projet Gutenberg Europe compte 400 livres.

En décembre 2006, on compte 50 langues. Les dix langues comprenant plus de cinquante livres sont l'anglais (17.377 livres le 16 décembre 2006), le français (966 livres), l'allemand (412 livres), le finnois (344 livres), le hollandais (244 livres), l'espagnol (140 livres), l'italien (102 livres), le chinois (69 livres), le portugais (68 livres) et le tagalog (51 livres).

# De 20.000 à 30.000 ebooks

Project Gutenberg News, le blog officiel du Projet Gutenberg, débute en novembre 2006 à l'instigation de Mike Cook. Ce blog complète les lettres d'information (hebdomadaire et mensuelle) existant depuis nombre d'années. Le blog offre par exemple les statistiques de production hebdomadaires, mensuelles et annuelles depuis 2001.

La production hebdomadaire est de 24 livres en 2001, 47 livres en 2002, 79 livres en 2003, 78 livres en 2004, 58 livres en 2005 et 80 livres en 2006.

La production mensuelle est de 104 livres en 2001, 203 livres en 2002, 348 livres en 2003, 338 livres en 2004, 252 livres en 2005 et 345 livres en 2006.

La production annuelle est de 1.244 livres en 2001, 2.432 livres en 2002, 4.176 livres en 2003, 4.058 livres en 2004, 3.019 livres en 2005 et 4.141 livres en 2006.

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le jour de la fête nationale, à l'instigation de Michael Shepard et David Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une production qui débute en décembre 2007. Les cent premiers livres sont disponibles en mars 2008, en anglais, en français et en italien.

Le Projet Gutenberg envoie 15 millions de livres sur CD ou DVD par courrier postal en 2007. Le DVD le plus récent (qui date de juillet 2006) comprend 17.000 livres. Le contenu des CD et DVD est également disponible sous forme de fichiers ISO (depuis 2005) peuvant être téléchargés pour graver des CD et DVD.

Le Projet Gutenberg compte 25.000 livres en avril 2008. L'eBook #25000 est English Book Collectors (Collectionneurs de livres anglais, 1902) de William Younger Fletcher.

Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.

Le Projet Gutenberg comptabilise 30.000 livres en octobre 2009. L'eBook #30000 est The Bird Book (Le livre des oiseaux, 1915), de Chester Albert Reed.

# 30.000 ebooks et plus

Principale source des livres du Projet Gutenberg, Distributed Proofreaders (DP) fête son dixième anniversaire en octobre 2010, avec plus de 18.000 livres patiemment numérisés, relus et corrigés pendant dix ans par plusieurs milliers de volontaires.

Le Projet Gutenberg propose plus de 33.000 ebooks de grande qualité en décembre 2010, dans divers formats pour lecture sur ordinateur, PDA, téléphone mobile, smartphone et tablette.

FROM THE PAST TO THE FUTURE [EN]

The results of Project Gutenberg are not only measured in numbers. The results can also be measured in the major influence the project has had.

# Other digital libraries

As the oldest producer of free ebooks on the internet, Project Gutenberg has inspired many other digital libraries, for example Projekt Runeberg for classic Nordic (Scandinavian) literature, and Projekt Gutenberg-DE for classic German literature, which started respectively in 1992 and 1994.

Projekt Runeberg was the first Swedish digital library of books from public domain, and a partner of Project Gutenberg. It was initiated in December 1992 by the students' computer club Lysator, in cooperation with the Linköping University (Sweden), as a volunteer project to create and collect free electronic editions of classic Nordic literature and art. Around 200 ebooks were available in full text in 1998. There was also a list of 6,000 Nordic authors as a tool for further collection development.

Projekt Gutenberg-DE was the first German digital library of books from public domain, created in 1994 as a partner of Project Gutenberg. Texts were available for online reading, with one webpage for short texts and with several webpages - one per chapter - for longer works. There was an alphabetic list of authors and titles, and a short biography and bibliography for each author.

# "Less is more."

Project Gutenberg has kept its administrative and financial structure to the bare minimum. Its motto fits into three words: "Less is more." The goal is to ensure its independence from loans and other funding, and from ephemeral cultural priorities, to avoid pressure from politicians and others. The goal is also to ensure respect for the volunteers, who can be confident their work will be used for decades. Volunteers can network through mailing lists, weekly or monthly newsletters, discussion lists, forums, and wikis. Founded in 2000, the PGLAF (Project Gutenberg Literary Archive Foundation) has only three part-time employees.

Donations are used to buy equipment and supplies, mostly computers, scanners, and blank CDs and DVDs. CDs and DVDs are sent for free to those who request them. After the CD Best of Gutenberg available in August 2003 with a selection of 600 ebooks, and a first DVD available in December 2003 with 9,400 ebooks, a second DVD is available in July 2006 with 17,000 ebooks. Since 2005, CDs and DVDs have been both available on the website of BitTorrent as ISO images that can be downloaded to burn CDs and DVDs for personal use. In 2007, the Project Gutenberg sent 15 million books by snail mail on CDs and DVDs.

More generally, Michael Hart should be given more credit as the inventor of the electronic book (ebook). If we consider the ebook in its etymological sense - i.e. a book that has been digitized to be distributed as an electronic file - it was born with Project Gutenberg in July 1971, 30 years before the various commercial launchings that peppered the early 2000s, with the ebooks of Amazon, Barnes & Noble, Gemstar, and others.

# Tens of thousands of downloads per day

There is a big demand, as confirmed by the tens of thousands of books that are downloaded every day.

For example, on July 31, 2005, there were 37,532 downloads for the day, 243,808 downloads for the week, and 1,154,765 downloads for the month.

On May 6, 2007, there were 89,841 downloads for the day, 697,818 downloads for the week, and 2,995,436 downloads for the month.

On November 15, 2010, there were 130,524 downloads for the day, 888,520 downloads for the week, and 3,582,153 downloads for the month.

These numbers are the downloads from ibiblio.org (at the University of North Carolina, Chapel Hill, United States), the main distribution site, which also hosts the website gutenberg.org. The Internet Archive is the backup distribution site and provides unlimited disk space for storage and processing. Project Gutenberg has 40 mirror sites worldwide, and seeks new ones. It also encourages the use of P2P for sharing its ebooks.

Readers can choose ebooks from the "Top 100?, i.e. the top 100 ebooks and the top 100 authors for the previous day, the last seven days and the last thirty days.

Project Gutenberg ebooks can also help bridge the "digital divide". They can be read on an outdated computer or a second-hand netbook costing just a few dollars.

# Towards the future

It is hoped machine translation software will be able to convert the ebooks from one to another of 100 languages. In ten years from now, machine translation may be judged 99% satisfactory - research is active on that front, and software is improving fast - allowing for the reading of literary classics in a choice of many languages. Project Gutenberg is also interested in combining translation software and human translators, somewhat as OCR software is now combined with the work of proofreaders.

40 years after the beginning of Project Gutenberg, Michael Hart describes himself as a workaholic who has devoted his entire life to his project. He considers himself a pragmatic and farsighted altruist. For years he was regarded as a nut but now he is respected. He wants to change the world through freely-available ebooks that can be used and copied endlessly, and reading and culture for everyone at minimal cost.

Project Gutenberg's mission can be stated in eight words: "To encourage the creation and distribution of ebooks," by everybody, and by every possible means, while implementing new ideas, new methods, and new software.

DESDE EL PASADO HACIA EL FUTURO [ES]

Los resultados del Proyecto Gutenberg no se miden sólo en cifras. Los resultados se miden también por la influencia que ha tenido el proyecto, pues ésta ha sido enorme.

# Otras bibliotecas digitales

El Proyecto Gutenberg - primera página web de información en el internet y primera biblioteca digital -, inspira muchas otras bibliotecas digitales, por ejemplo el Projekt Runeberg para la literatura escandinava o el Projekt Gutenberg-DE para la literatura alemana.

El Projekt Runeberg es la primera biblioteca digital sueca de libros del dominio público, y un socio del Proyecto Gutenberg. Esta biblioteca es creada en diciembre de 1992 por Lysator, un club informático de estudiantes, en colaboración con la biblioteca de la Universidad de Linköping (Suecia), para producir y organizar versiones electrónicas gratuitas de obras de literatura nórdica (escandinava) clásica. 200 obras están disponibles en 1998, con una lista de 6.000 autores nórdicos para el desarrollo de las colecciones futuras.

El Projekt Gutenberg-DE es la primera biblioteca digital alemana de libros del dominio público, y también un socio del Proyecto Gutenberg. Se pueden leer decenas de textos en línea en 1998, con una página web para textos cortos y varias páginas web - uno por capítulo - para obras más largas. Una lista alfabética de autores y de títulos está disponible en el sitio, con una breve biografía y bibliografía para cada autor.

# Una estructura tan simple como posible

La estructura administrativa y financiera del Proyecto Gutenberg se limita al mínimo estricto. Michael Hart insiste frecuentemente sobre la necesidad de preservar un marco lo más flexible posible que deje campo libre a los voluntarios, y la puerta abierta para las nuevas ideas. El objetivo es garantizar la perennidad del proyecto, sin depender ni de créditos y cortes de créditos, ni de las prioridades culturales, financieras y políticas del momento. De este modo no puede ejercerse ninguna forma de presión por el poder o el dinero. Además esto significa respeto para con los voluntarios, quienes pueden estar seguros de que verán su trabajo utilizado durante muchos años. En cuanto a la supervisión regular del proyecto, se garantiza gracias a cartas de información semanales y mensuales, foros de discusión, wikis y blogs.

Las donaciones sirven para financiar ordenadores y escáneres, y para enviar CD y DVD gratuitos a aquéllos que los solicitan. Después del CD "Best of Gutenberg" disponible en agosto de 2003 con una selección de 600 libros y de un primer DVD disponible en diciembre de 2003 con 9.400 libros, un segundo DVD está disponible en julio de 2006 con 17.000 libros. A partir de 2005, CD y DVD ambos están disponibles en el sitio web de BitTorrent, bajo la forma de imágenes ISO que se pueden descargar con el fin de grabar CD y DVD a título personal. En 2007, el Proyecto Gutenberg envía 15 millones de libros por correo postal bajo la forma de CD y DVD.

Aunque demasiadas veces se silencie, cabe recordar que el verdadero inventor del ebook es Michael Hart. Si tomamos la palabra "ebook" en su sentido etimológico - a saber un libro digital para difusión bajo la forma de un archivo electrónico - habría nacido con el Proyecto Gutenberg en julio de 1971, 30 años antés de los diversos lanzamientos comerciales que salpicaron el principio de los años 2000 con los ebooks de Amazon, Barnes & Noble, Gemstar y demás.

# Decenas de miles de descargas al día

La demanda es enorme, a prueba de ello el número de descargas, que se cifran en decenas de miles diarias.

A fecha del 31 de julio de 2005, se cuenta con 37.532 archivos descargados al día, 243.808 archivos a la semana y 1.154.765 archivos al mes.

A fecha del 6 de mayo de 2007, se cuenta con 89.841 archivos descargados al día, 697.818 archivos a la semana y 2.995.436 archivos al mes.

A fecha del 15 de noviembre de 2010, se cuenta con 130.524 archivos descargados al día, 888.520 archivos a la semana y 3.582.153 archivos al mes.

Y esto sólo concierne el sitio web de descargas principal, ibiblio.org (basado en la Universidad de Carolina del Norte, Estados Unidos), que alberga también el sitio web del Proyecto Gutenberg. El segundo sitio web de descargas es el del Internet Archive, que también sirve de copia de seguridad y le proporciona al Proyecto Gutenberg une capacidad de almacenamiento ilimitada.

Un Top 100 inventaria los cien títulos y los cien autores que más han sido descargados durante el día, la semana y el mes.

El Proyecto Gutenberg dispone de 40 sitios web espejo repartidos en toda la planeta, y aún necesita encontrar otros. Los archivos también circulan en modo P2P (peer-to-peer), lo que permite a cualquier utilizador intercambiar directamente archivos con otro utilizador.