40 years / 40 años / 40 ans

Part 5

Chapter 53,762 wordsPublic domain

En febrero de 2004, Michael Hart vuela a Europa con escalas en Bruselas (Bélgica), París (Francia) y Belgrado (Serbia). El 12 de febrero de 2004 da una conferencia en la sede de la UNESCO (Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura) en París. Al día siguiente, anima un debate en la Asamblea Nacional Francesa. La semana siguiente hace un discurso ante el Parlamento Europeo en Bruselas.

Después Michael se va a reúne con el equipo del Proyecto Rastko en Belgrado para apoyar el lanzamiento del Proyecto Gutenberg Europa y de Distributed Proofreaders Europa. El Proyecto Rastko es una organización no gubernamental con vocación cultural y educativa fundada en 1997 como parte de una red cultural regional en la Península de los Balcanes, en el sureste de Europa.

Distributed Proofreaders Europa (DP Europa) utiliza el software y la interfaz de Distributed Proofreaders, un sitio creado en octubre de 2000 por Charles Franks para repartir la revisión de los libros digitales entre muchos voluntarios.

Desde sus inicios, DP Europe es un sitio plurilingüe que toma en cuenta las mayores lenguas nacionales europeas. Traducido por traductores voluntarios, el sitio de DP Europa está disponible en doce idiomas en abril de 2004, con la intención de proponer la interfaz en sesenta idiomas, es decir todos los (mayores) idiomas europeos.

En mayo de 2005, DP Europa completa la corrección de su centésimo libro digital. Estos libros están en varios idiomas con el fin de reflejar la diversidad lingüística que prevalece en Europa. La codificación utilizada es el Unicode para corregir libros en muchos idiomas. DP Europa cuenta con 600 libros en febrero de 2009.

# En 2005

En julio de 2005, 42 lenguas están representadas en el Proyecto Gutenberg, incluyendo el sánscrito y las lenguas mayas. Los siete principales idiomas son el inglés (con 14.548 ebooks el 27 de julio 2005), el francés (577 ebooks), en alemán (349 ebooks), el finlandés (218 ebooks), el holandés (130 ebooks), el español (103 ebooks) y el chino (69 ebooks).

# En 2006

Disponible en diciembre de 2006, el eBook #20000 es Twenty Thousand Leagues Under the Sea (Veinte mil leguas de viaje submarino, 1869), en una versión audio en inglés.

En diciembre de 2006, 50 lenguas están representadas en el Proyecto Gutenberg. Los diez principales idiomas son el inglés (con 17.377 ebooks el 16 de diciembre 2006), el francés (966 ebooks), el alemán (412 ebooks), el finlandés (344 ebooks), el holandés (244 ebooks), el español (140 ebooks), el italiano (102 ebooks), el chino (69 ebooks), el portugués (68 ebooks) y el tagalo (51 ebooks).

# En 2007

El Proyecto Gutenberg Canadá (PGC) es creado el 1 de julio de 2007, el día de la fiesta nacional de Canadá. Distributed Proofreaders Canadá (DPC) inicia su producción de libros en diciembre de 2007, con 100 libros en inglés, en francés y en italiano disponibles en marzo de 2008, y 250 libros disponibles en febrero de 2009.

# En 2010

En octubre de 2010, 59 lenguas están representadas en el Proyecto Gutenberg. Los diez principales idiomas son el inglés (con 28.441 ebooks el 7 de octubre 2010), el francés (1.659 ebooks), el alemán (709 ebooks), el finlandés (536 ebooks), el holandés (496 ebooks), el portugués (473 ebooks), el chino (405 ebooks), el español (295 ebooks), el italiano (250 ebooks) y el griego (101 ebooks). Estos idiomas son seguidos por el latín, el esperanto, el sueco y el tagalo.

# En 2020, quizás

Quizás podamos beneficiar en el futuro de la traducción inmediata de estos libros a una gran variedad de idiomas, a través de un software de traducción automática.

En diez años, la traducción automática podría haber logrado un porcentaje de fiabilidad del 99% - la investigación es muy activa en este campo, y los softwares son cada vez mejores - con capacidad de leer obras literarias en un gran número de idiomas.

Los libros traducidos por un software de traducción automática no van a competir con el trabajo de los traductores literarios y sus esfuerzos talentosos durante días y meses si no años. Pero van a permitir al lector captar lo esencial de obras literarias nunca traducidas, o traducidas sólo a unos pocos idiomas por razones comerciales.

Un libro traducido por un software de traducción podrá a continuación ser corregido por traductores (seres humanos) mediante el uso de una interfaz similar a la que utilizan ahora los voluntarios de Distributed Proofreaders para la corrección de un libro digital producido por un software de OCR (reconocimiento óptico de caracteres).

Así pues, uno empieza a soñar con Distributed Translators para compartir la revisión de las traducciones, como un socio de Distributed Proofreaders y del Proyecto Gutenberg.

LE PROJET GUTENBERG ET LES LANGUES [FR]

Le Projet Gutenberg propose essentiellement des livres numériques en anglais, mais le multilinguisme est l'une de ses priorités. Le français est la deuxième langue du projet. Soixante langues sont représentées en décembre 2010.

# En 1990-1994

À l'origine, les livres numériques sont en anglais. Comme le Projet Gutenberg est lancé à partir de l'Université de l'Illinois (États- Unis), avec l'aide de volontaires anglophones, son but premier est de procurer des livres à la communauté anglophone, à savoir 95% des usagers de l'internet au début des années 1990. (Les usagers non anglophones atteignent les 50% en été 2000, avec un pourcentage qui augmente régulièrement ensuite.)

Le Projet Gutenberg inspire aussi d'autres bibliothèques numériques ailleurs, à savoir le Projekt Runeberg pour la littérature nordique (scandinave) en 1992 et le Projekt Gutenberg-DE pour la littérature allemande en 1994.

Le Projekt Runeberg est la première bibliothèque numérique suédoise de livres du domaine public, et un partenaire du Projet Gutenberg. Elle est créée en décembre 1992 par Lysator, un club informatique d'étudiants, en collaboration avec la bibliothèque de l'Université de Linköping (Suède), pour produire et organiser des versions électroniques gratuites de la littérature nordique classique. 200 oeuvres sont disponibles en 1998, avec une liste de 6.000 auteurs nordiques en tant qu'outil de développement des collections.

Projekt Gutenberg-DE est la première bibliothèque numérique allemande de livres du domaine public, et également un partenaire du Projet Gutenberg. Plusieurs dizaines de textes peuvent être lus en ligne en 1998, avec une page web pour les textes courts et plusieurs pages - une par chapitre - pour les oeuvres plus longues. Une liste alphabétique d'auteurs et de titres est également disponible, ainsi qu'une courte biographie et bibliographie pour chaque auteur.

# En 1997

Le français fut la deuxième langue du Projet Gutenberg, et c'est toujours le cas en 2010.

Les premiers livres disponibles en français sont six oeuvres de Stendhal et deux oeuvres de Jules Verne, toutes mises en ligne début 1997.

Les six oeuvres de Stendhal sont quatre récits: Les Cenci (publié en 1837), Vittoria Accoramboni (1837), La Duchesse de Palliano (1838) et L'Abbesse de Castro (1839) - tous récits publiés dans La revue des deux mondes - et deux romans: Le Rouge et le Noir (1830) et La Chartreuse de Parme (1839).

Les deux romans de Jules Verne sont: De la terre à la lune (1865) et Le tour du monde en quatre-vingts jours (1873).

À cette date, trois romans de Jules Verne sont déjà disponibles en anglais: From the Earth to the Moon (titre original: De la terre à la lune), disponible en septembre 1993; Around the World in 80 Days (titre original: Le tour du monde en quatre-vingts jours), disponible en janvier 1994; et 20,000 Leagues Under the Seas (titre original: Vingt mille lieues sous les mers, 1869-1870), disponible en septembre 1994.

Depuis la parution de ces premiers titres, Jules Verne a toujours fait partie des auteurs les plus téléchargés, à la onzième place dans le «Top 20» du Projet Gutenberg en décembre 1999 et à la sixième place dans le «Top 100» des auteurs les plus téléchargés durant les trente derniers jours à la date du 6 novembre 2010.

À titre anecdotique, le premier recueil d'images disponible dans le Projet Gutenberg toutes langues confondues est French Cave Paintings (Peintures des cavernes en France), mis en ligne dès avril 1995 (eBook #249), avec une version XHTML ajoutée en novembre 2000. Il s'agit de quatre photos de peintures paléolithiques retrouvées dans une grotte de l'Ardèche, un département du sud-ouest de la France. Ces photos, sous copyright, ont été mises à la disposition du Projet Gutenberg par Jean Clottes, conservateur général du patrimoine, pour pouvoir être appréciées de tous.

Disponible en 1997, l'eBook #1000 est La Divina Commedia (1321) de Dante Alighieri, en italien, sa langue originale.

# En 1998

En octobre 1997, Michael Hart annonce son intention d'intensifier la production de livres dans des langues autres que l'anglais. Début 1998, le catalogue comprend quelques oeuvres en allemand, en espagnol, en français (dix titres), en italien et en latin.

Stendhal et Jules Verne sont suivis par Edmond Rostand avec Cyrano de Bergerac, publié en 1897 et disponible dans le Projet Gutenberg un siècle plus tard, en mars 1998.

# En 1999

Disponible en mai 1999, l'eBook #2000 est Don Quijote (1605) de Cervantès, en espagnol, sa langue originale.

En juillet 1999, Michael écrit lors d'un entretien par courriel: "J'introduis une nouvelle langue par mois maintenant, et je vais poursuivre cette politique aussi longtemps que possible."

# En 2000

Disponible en décembre 2000, l'eBook #3000 est le volume 3 (1919) de À l'ombre des jeunes filles en fleurs de Marcel Proust, en français, sa langue originale.

Le Project Gutenberg Australia est lancé en juillet 2001, et commence à produire des livres numériques en anglais et dans d'autres langues, par exemple certains volumes en français de À la recherche du temps perdu (1913-1927) de Marcel Proust. (Les derniers volumes sont toujours sous copyright aux États-Unis, raison pour laquelle ils ne sont pas disponibles sur le site américain du Projet Gutenberg.) Les collections du Project Gutenberg Australia comprennent 1.750 livres numériques en février 2009.

# En 2001

Disponible en octobre 2001, l'eBook #4000 est The French Immortals Series (Recueil de textes d'Immortels français, 1905), en anglais. Cette anthologie regroupe des oeuvres de fiction courtes de plusieurs membres de l'Académie française: Émile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard, Alphonse Daudet et d'autres.

# En 2002

Disponible en avril 2002, l'eBook #5000 est The Notebooks of Leonardo da Vinci (Les carnets de Léonard de Vinci), un version anglaise de ces carnets datant du 16e siècle. Ce livre est depuis régulièrement présent dans le «Top 100» des livres téléchargés.

# En 2003

Le Project Gutenberg Consortia Center (PGCC) - fondé en 1997 pour regrouper des collections de livres numériques émanant d'autres sources - est affilié au Projet Gutenberg en 2003 et devient l'un de ses sites officiels. Il propose plus de 75.000 titres dans divers formats et en plusieurs langues en décembre 2010.

# En 2004

Début 2004, 25 langues sont représentées dans le Projet Gutenberg.

En février 2004, Michael Hart prend l'avion vers l'Europe, avec des étapes à Bruxelles (Belgique), Paris (France) et Belgrade (Serbie).

Le 12 février 2004, il donne une conférence au siège de l'UNESCO (Organisation des Nations Unies pour l'éducation, la science et la culture) à Paris. Le lendemain, toujours à Paris, il anime un débat à l'Assemblée nationale. La semaine suivante, il s'adresse au Parlement européen à Bruxelles. Puis il va rendre visite à l'équipe du Projet Rastko à Belgrade pour soutenir le lancement du Projet Gutenberg Europe et de Distributed Proofreaders Europe.

Le Projet Rastko est un projet non gouvernemental à vocation culturelle et pédagogique fondé en 1997 et faisant partie d'un réseau culturel régional dans la péninsule des Balkans, située au sud-est de l'Europe.

Distributed Proofreaders Europe (DP Europe) est calqué sur le site original de Distributed Proofreaders, un site créé en octobre 2000 par Charles Franks pour partager la correction des livres entre de nombreux volontaires.

Dès ses débuts, DP Europe est un site plurilingue, avec prise en compte des principales langues nationales européennes. Grâce à des traducteurs volontaires, le site de DP Europe est disponible en douze langues dès avril 2004. L'objectif à long terme est une interface disponible en soixante langues, à savoir la plupart des langues européennes.

# En 2005

En mai 2005, DP Europe termine la correction de son centième livre. Ces livres sont en plusieurs langues, en tant que reflet de la diversité des langues en Europe. L'encodage utilisé est l'Unicode, pour pouvoir traiter des livres dans de nombreuses langues. 600 livres sont disponibles en février 2009.

En juillet 2005, 42 langues sont représentées dans le Projet Gutenberg, y compris le sanscrit et les langues mayas. Les sept langues principales sont l'anglais (avec 14.548 ebooks le 27 juillet 2005), le français (577 ebooks), l'allemand (349 ebooks), le finnois (218 ebooks), le néerlandais (130 ebooks), l'espagnol (103 ebooks) et le chinois (69 ebooks).

# En 2006

Disponible en décembre 2006, l'eBook #20000 est Twenty Thousand Leagues Under the Sea (Vingt mille lieues sous les mers, 1869) de Jules Verne, dans une version audio en langue anglaise.

En décembre 2006, 50 langues sont représentées dans le Projet Gutenberg. Les dix langues principales sont l'anglais (avec 17.377 ebooks le 16 décembre 2006), le français (966 ebooks), l'allemand (412 ebooks), le finnois (344 ebooks), le néerlandais (244 ebooks), l'espagnol (140 ebooks), l'italien (102 ebooks), le chinois (69 ebooks), le portugais (68 ebooks) et le tagalog (51 ebooks).

# En 2007

Project Gutenberg Canada (PGC) est lancé le 1er juillet 2007, le jour de la fête nationale au Canada. Distributed Proofreaders Canada (DPC) débute ses activités en décembre 2007, avec 100 livres numériques en anglais, en français et en italien en mars 2008, et 250 livres en février 2009.

# En 2010

En novembre 2010, 60 langues sont représentées dans le Projet Gutenberg. Les dix langues principales sont l'anglais (avec 28.666 ebooks le 6 novembre 2010), le français (1.672 ebooks), l'allemand (715 ebooks), le finnois (542 ebooks), le néerlandais (498 ebooks), le portugais (474 ebooks), le chinois (405 ebooks), l'espagnol (297 ebooks), l'italien (253 ebooks) et le grec (107 ebooks). Ces langues sont suivies du latin, de l'espéranto, du suédois et du tagalog.

# En 2020, peut-être

Il est possible qu'on puisse bénéficier un jour de la traduction immédiate de ces livres dans un vaste choix de langues, par le biais d'un logiciel de traduction automatique.

Dans dix ans, la traduction automatique pourrait avoir atteint un taux de fiabilité de l'ordre de 99% - la recherche est très active dans ce domaine, avec des logiciels de plus en plus performants - avec possibilité de lire des oeuvres littéraires dans un grand nombre de langues.

Les livres traduits par le biais d'un logiciel de traduction automatique ne rivaliseront certainement pas avec le travail des traducteurs littéraires et leurs efforts talentueux pendant des jours et des mois sinon des années. Mais ils permettraient au lecteur une première approche d'oeuvres littéraires jamais traduites jusqu'ici, ou traduites seulement dans quelques langues, pour des raisons commerciales.

Le texte d'un livre traduit (issu d'un logiciel de traduction) pourrait ensuite être corrigé par des traducteurs (des êtres humains, pas des logiciels), en utilisant une interface semblable à celle utilisée actuellement pour la correction du texte d'un livre (issu d'un logiciel OCR) par les volontaires de Distributed Proofreaders.

On se prend ainsi à rêver à un Distributed Translators pour partager la révision des traductions, Distributed Translators pouvant être un organisme partenaire de Distributed Proofreaders et du Projet Gutenberg.

DISTRIBUTED PROOFREADERS IS TEN YEARS OLD [EN]

Project Gutenberg got its first boost with the invention of the web in 1990, and its second boost with the creation of Distributed Proofreaders in 2000, to share the proofreading of digitized books between many volunteers. Volunteers choose a book currently processed through the site to proofread a given page, or several pages, as they wish. One page per day is a great goal. It doesn't seem much, but with hundreds of volunteers it really adds up.

# A website launched in 2000

Distributed Proofreaders (DP) was founded in October 2000 by Charles Franks to support the digitization of public domain books. From the website one can access a program that allows several proofreaders to be working on the same book at the same time, each proofreading on different pages. The goal is to all work together - from any region in the world - to significantly speed up the proofreading process.

Originally conceived to assist Project Gutenberg (PG), Distributed Proofreaders is now the main source of PG ebooks. In 2002, DP became an official PG site. In May 2006, DP became a separate legal entity and continues to maintain a strong relationship with PG.

Distributed Proofreaders counted 3,000 ebooks "preserved for the world" in February 2004, 5,000 ebooks in October 2004, 7,000 ebooks in May 2005, 10,000 ebooks in December 2006, 11,950 ebooks in January 2008, and 18,848 ebooks on 15 October 2010. Production was 196 titles in October 2010.

# How all this works

Volunteers register and receive detailed instructions. For example, words in bold, italic or underlined, or footnotes are always treated the same way for any ebook. A discussion forum allows them to ask questions or seek help at any time.

Each time proofreaders go to the website, they choose the book they want. One page of the book appears in two forms side by side: the scanned image of one page, and the text from that image as produced by OCR software. The proofreader can easily compare both versions, note the differences, and fix them. OCR is usually 99% accurate, which makes for about 10 corrections a page. The proofreader saves the page as it is completed, and then can either stop work or do another.

The books are proofread twice, and the second time only by experienced proofreaders.

All the pages of the book are then formatted, combined and assembled by post-processors to make an ebook.

A project manager oversees the progress of a particular book through its different steps on the website.

The ebook is now ready to be released in Project Gutenberg with an index entry (title, subtitle, author, ebook number, and character set) for the database. Catalogers go on with the cataloguing process (author's dates of birth and death, Library of Congress classification, etc.) after the release.

# Everyone is welcome

New volunteers are most welcome, and will be guided by experienced volunteers for their first steps. There is a lot to do, and everyone is welcome.

As stated on DP's website in 2005, "Remember that there is no commitment expected on this site. Proofread as often or as seldom as you like, and as many or as few pages as you like. We encourage people to do 'a page a day', but it's entirely up to you! We hope you will join us in our mission of 'preserving the literary history of the world in a freely available form for everyone to use'."

# Distributed Proofreaders Europe

Distributed Proofreaders Europe (DP Europe) was launched in early 2004 by Project Rastko in Belgrade, Serbia, as well as Project Gutenberg Europe. DP Europe uses the software of the original Distributed Proofreaders.

Since its beginning, DP Europe has been a multilingual website, with its main pages translated into the main national European languages by volunteer translators. DP Europe was available in 12 languages as early as April 2004. The long-term goal is 60 languages representing most European languages.

In May 2005, DP Europe finished processing its 100th ebook. Ebooks were in several languages to reflect European linguistic diversity. 600 ebooks were ready in February 2009, and 732 ebooks on 15 October 2010.

DP Europe supports Unicode to be able to proofread ebooks in numerous languages. Unicode is an encoding system created in 1991 that gives a unique number for every character in any language. Unicode is meant to replace ASCII, an encoding system dating back from 1968 that can only handle English and Latin in its "original" version, and a few European languages with accents in its "extended" version. In 2008, half of the files available on the internet were Unicode files.

# Distributed Proofreaders Canada

Distributed Proofreaders Canada (DPC) started production in December 2007, to digitize and proofread ebooks for Project Gutenberg Canada (PGC), founded on July 1st, 2007, on Canada Day, by Michael Shepard and David Jones. There were 100 ebooks in March 2008, in English, French and Italian. 250 ebooks were available in February 2009, and 427 books on October 15, 2010.

# A few numbers

= Over 33,000 high-quality proofread ebooks in Project Gutenberg, in several languages. (Quality more than quantity is what really matters to the reader, believe me.)

= 18,961 ebooks processed by Distributed Proofreaders (the original website) on November 1st, 2010, since its creation in October 2000, with 2,352 active volunteers in October 2010.

= 739 ebooks processed by Distributed Proofreaders Europe on November 1st, 2010, since its creation on January 2004.

= 433 ebooks processed by Distributed Proofreaders Canada on November 1st, 2010, since its creation in December 2007, with 127 active volunteers in October 2010.

# A few links

Project Gutenberg, https://www.gutenberg.org/ with 33,000 high-quality proofread ebooks.

Distributed Proofreaders, http://www.pgdp.net/c/ launched in October 2000.

Distributed Proofreaders Europe, http://dp.rastko.net/ launched in early 2004, with a plurilingual interface, and books to proofread in several languages.

Distributed Proofreaders Canada, http://www.pgdpcanada.net/c/default.php launched in December 2007.

Volunteers are most welcome on the three websites - with no geographic requirements - because there are no borders for beautiful literary works to be "preserved for the world".

DISTRIBUTED PROOFREADERS TIENE 10 AÑOS [ES]

El Proyecto Gutenberg cobra nuevo aliento y alcanza una difusión internacional con la aparición de la web en 1990, y luego con la creación de Distributed Proofreaders (Correctores Distribuidos) en 2000, cuya meta es compartir la revisión de los libros entre centenares de voluntarios. Los voluntarios eligen un libro digital que se está procesando en el sitio para releer y corregir determinada página, o algunas páginas, como quieran. A título indicativo, se aconseja corregir una página al día. Representa poco tiempo en un día, pero mucho para el proyecto. Una página multiplicada por cientos de voluntarios representa un volumen considerable.

# Un sitio lanzado en 2000

Distributed Proofreaders es concebido en octubre de 2000 por Charles Franks para contribuir a la digitalización de los libros del dominio público. La interfaz del sitio web da acceso a un software que permite a varios voluntarios trabajar simultáneamente en el mismo libro, cada uno corrigiendo diferentes páginas. El objetivo es que todos trabajen juntos - desde cualquier lugar del mundo - para acelerar significativamente el proceso de revisión de los libros.

Originalmente destinado a ayudar el Proyecto Gutenberg en su tarea, Distributed Proofreaders se convierte rápidamente en la principal fuente de sus ebooks. Después de afiliarse con el Proyecto Gutenberg en 2002, Distributed Proofreaders se convierte en una entidad independiente en mayo de 2006, aunque manteniendo una estrecha relación con éste.