Part 6
Distributed Proofreaders contabiliza 3.000 libros digitalizados y corregidos en febrero de 2004, 5.000 libros en octubre de 2004, 7.000 libros en mayo de 2005, 10.000 libros en diciembre de 2006, 11.950 libros en enero de 2008 y 19.059 libros el 16 de noviembre de 2010. La producción es de 196 ebooks en octubre de 2010.
# La organización práctica del procesamiento
El nuevo voluntario empieza por registrarse. Recibe instrucciones detalladas, por ejemplo cómo tratar las partes en negrita, en cursiva o subrayadas, o las notas, que se tratan todas de la misma manera. Un foro permite formular preguntas y pedir ayuda en cualquier momento.
Cuando el voluntario inicia una sesión en el sitio, elige un libro a partir de una lista dada. Una página del libro elegido aparece en dos versiones: por una parte la imagen digitalizada de la página, por otra el texto resultante de esta imagen, producido por un software de OCR (reconocimiento óptico de caracteres). El voluntario compara las dos versiones y corrige las diferencias. Un software de OCR tiene una precisión del 99%, lo que representa un promedio de diez errores a corregir por página. Luego el voluntario salva la página y puede cesar su relectura o bien optar por la corrección de otra página.
Todos los libros son revisados dos veces, y la segunda vez sólo por correctores experimentados.
Otros voluntarios llamados "post-procesadores" ("post-processors" en inglés) formatean y montan las páginas corregidas, de acuerdo con normas precisas, para obtener un ebook.
Durante todo el proceso, un jefe de proyecto (llamado "project manager" en inglés) sigue el tratamiento de un libro dado para garantizar el buen funcionamiento del proceso.
A continuación se pone en línea el ebook en el Proyecto Gutenberg después de su indexación (título, subtítulo, autor, número del ebook y formato de codificación) por voluntarios indizadores. Catalogadores voluntarios se encargan luego de la catalogación de este libro (fechas de nacimiento y muerte del autor, clasificación de la Biblioteca del Congreso, etc.).
# Calquier participación es bienvenida
Los nuevos voluntarios son bienvenidos, en cualquier país y para cualquier idioma, y serán guiados por voluntarios experimentados para sus primeros pasos como revisores. La tarea es inmensa, y cualquier ayuda es muy apreciada.
Como se indica en el sitio web en 2005, "DP no espera su compromiso incondicional. Usted puede revisar textos todas las veces que quiera, y el número de páginas que desee. Alentamos a la gente a corregir una página por día, pero usted está totalmente libre de hacer lo que le gusta. Esperamos que usted se una a nuestra misión de 'preservar la literatura mundial en una versión gratuita y disponible para todos'."
# Distributed Proofreaders Europa
Distributed Proofreaders Europa (DP Europa) - copiado a partir del sitio y del software original de Distributed Proofreaders - se lanza en enero de 2004 para gestionar la revisión de los libros del Proyecto Gutenberg Europa, a iniciativa del Proyecto Rastko, basado en Belgrado (Serbia).
Desde sus inicios, DP Europa es un sitio web multilingüe, traducido por voluntarios a los grandes idiomas nacionales europeos, y disponible en doce idiomas en abril de 2004. El objetivo a largo plazo es una interfaz en sesenta idiomas para tener en cuenta todas las (mayores) lenguas europeas.
Los cien primeros libros están disponibles en abril de 2005. Estos libros están en varios idiomas - de los cuales el español - con el fin de reflejar la diversidad lingüística que prevalece en Europa. DP Europa contabiliza 600 libros en febrero de 2009, y 741 libros el 16 de noviembre de 2010.
DP Europa utiliza el Unicode para poder procesar libros en varios idiomas. Unicode es un sistema de codificación creado en 1991, que asigna un código único para cada carácter de todos los idiomas del planeta. Se sustituye poco a poco al ASCII, un sistema de codificación que data de 1968 y que sólo puede procesar el inglés y el latín en su versión "original", y algunos idiomas europeos con acentos en su versión "extendida". En 2008, 50% de los archivos disponibles en el internet están codificados en Unicode.
# Distributed Proofreaders Canada
Distributed Proofreaders Canadá (PGC) se lanza en diciembre de 2007 para la producción de los ebooks del Proyecto Gutenberg Canadá (PGC), creado el 1 de julio de 2007, día de la fiesta nacional, a instigación de Michael Shepard y David Jones. Los cien primeros libros están disponibles en marzo de 2008, con libros en inglés, en francés y en italiano. 250 libros están disponibles en febrero de 2009, y 441 libros el 16 de noviembre de 2010.
# Algunas cifras
= Más de 33.000 ebooks en el Proyecto Gutenberg, todos revisados dos veces, y en varios idiomas. El objetivo es más la calidad que la cantidad.
= 19.059 ebooks procesados por Distributed Proofreaders (el sitio original, basado en los Estados Unidos) el 16 de noviembre de 2010, desde su lanzamiento en octubre de 2000, y 2.352 voluntarios activos durante el mes de octubre de 2010.
= 741 ebooks procesados por Distributed Proofreaders Europa el 16 de noviembre de 2010, desde su lanzamiento en enero de 2004.
= 441 ebooks procesados por Distributed Proofreaders Canadá el 16 de noviembre de 2010, desde su lanzamiento en diciembre de 2007, con 127 voluntarios activos durante el mes de octubre de 2010.
# Algunos enlaces
El Proyecto Gutenberg, https://www.gutenberg.org/
Distributed Proofreaders, http://www.pgdp.net/c/ que tiene 10 años.
Distributed Proofreaders Europa, http://dp.rastko.net/ el proyecto europeo lanzado en enero de 2004, con una interfaz en varios idiomas, incluso en español.
Distributed Proofreaders Canada, http://www.pgdpcanada.net/c/default.php lanzado en diciembre de 2007.
Los voluntarios de todos los países son bienvenidos en los tres sitios - sin preferencia geográfica o lingüística - porque la buena literatura no tiene fronteras.
DISTRIBUTED PROOFREADERS A DIX ANS [FR]
Le Projet Gutenberg trouve un second souffle et un rayonnement international avec l'apparition du web en 1990 puis la création de Distributed Proofreaders en 2000, pour partager la relecture des livres entre des centaines de volontaires. Les volontaires choisissent un livre en cours de traitement pour relire et corriger une page donnée, ou bien plusieurs. A titre indicatif, il est conseillé de relire une page par jour. C'est peu de temps sur une journée, et c'est beaucoup pour le projet. Une page multipliée par des centaines de volontaires représente un chiffre considérable.
# Un site lancé en 2000
Distributed Proofreaders est conçu en octobre 2000 par Charles Franks pour contribuer à la numérisation des livres du domaine public. À partir du site web, on accède à un logiciel permettant à plusieurs correcteurs de travailler simultanément au même livre, chacun travaillant sur des pages différentes, le but étant bien sûr de travailler ensemble - de n'importe quelle région du monde - pour accélérer de manière sensible le processus de révision des livres.
Censé à l'origine aider le Projet Gutenberg dans sa tâche, Distributed Proofreaders devient rapidement la principale source des livres du Projet Gutenberg. Après avoir été affilié au Projet Gutenberg en 2002, il devient une entité indépendante en mai 2006, tout en conservant des liens étroits avec le Projet Gutenberg.
Distributed Proofreaders comptabilise 3.000 livres numérisés et corrigés en février 2004, 5.000 livres en octobre 2004, 7.000 livres en mai 2005, 10.000 livres en décembre 2006, 11.950 livres en janvier 2008 et 18.848 livres le 15 octobre 2010. La production était de 196 livres en octobre 2010.
# Comment cela se passe, pratiquement
Le volontaire relecteur commence par s'inscrire. Il reçoit des directives détaillées. Ces directives concernent par exemple les parties en gras, en italique et soulignées, ou les notes, qui sont toutes traitées de la même manière. Un forum permet de poser des questions et de demander de l'aide à tout moment.
Quand le relecteur se connecte au site, il sélectionne le livre de son choix à partir d'une liste donnée. Une page du livre choisi apparaît simultanément dans deux versions: d'une part l'image scannée, d'autre part le texte issu de cette image, produit par un logiciel OCR. Le relecteur compare les deux versions et corrige les différences. Un logiciel OCR étant fiable à 99%, cela représente une moyenne de dix erreurs à corriger par page. Le relecteur sauvegarde ensuite la page, et peut ensuite soit cesser le travail, soit opter pour la correction d'une autre page.
Tous les livres sont relus et corrigés deux fois de suite et, la deuxième fois, uniquement par des correcteurs expérimentés.
Les pages corrigées sont ensuite formatées et assemblées selon des règles précises par d'autres volontaires (appelés «post-processors») pour obtenir un ebook.
Durant la totalité du processus, le traitement d'un livre donné est suivi par un responsable (appelé «project manager»), qui s'assure du bon déroulement des opérations.
Après la mise en forme suit la mise en ligne sur le Projet Gutenberg, avec indexation du livre (titre, sous-titre, auteur, numéro de l'ebook et format d'encodage) par d'autres volontaires puis catalogage complémentaire (dates de naissance et mort de l'auteur, classification de la Library of Congress, etc.) ensuite.
# Toute participation est bienvenue
De nouveaux volontaires sont bienvenus, dans tout pays et pour toute langue, y compris pour les livres en français, et seront guidés par des volontaires expérimentés pour leurs premiers pas en tant que réviseurs. La tâche est immense, et toute aide est très appréciée.
Comme indiqué sur le site en 2005, «DP ne s'attend pas à un engagement inconditionnel de votre part. Corrigez des textes aussi souvent que vous le voulez, et le nombre de pages que vous voulez. Nous encourageons les gens à corriger une page par jour, mais vous êtes tout à fait libre de faire ce qui vous plaît. Nous espérons que vous vous joindrez à notre mission de "préserver la littérature mondiale dans une version gratuite et disponible pour tous".»
# Distributed Proofreaders Europe
Distributed Proofreaders Europe (DP Europe) - calqué sur le site original de Distributed Proofreaders, dont il utilise le logiciel - est lancé en janvier 2004 pour gérer la relecture partagée du Projet Gutenberg Europe, sous l'égide du Projet Rastko à Belgrade (Serbie).
Dès ses débuts, DP Europe est un site multilingue. Ses pages principales sont traduites dans les grandes langues nationales européennes par des traducteurs volontaires. Le site de DP Europe est disponible en douze langues dès le mois d'avril 2004. L'objectif à long terme est soixante langues, avec prise en compte de la plupart des langues européennes.
Cent livres numérisés et corrigés sont disponibles en mai 2005. Les livres sont en plusieurs langues pour refléter la diversité linguistique prévalant en Europe. 600 livres sont prêts en février 2009 et 732 livres le 15 octobre 2010.
DP Europe utilise l'Unicode pour pouvoir traiter des livres dans un grand nombre de langues. L'Unicode, créé en 1991, est un système d'encodage qui attribue un code unique à chaque caractère pour toutes les langues de la planète, et qui remplace peu à peu l'ASCII, un système d'encodage datant de 1968 et qui ne peut traiter que l'anglais et le latin dans sa version «originale», et quelques langues européennes avec accents dans sa version «étendue». En 2008, la moitié des fichiers disponibles sur l'internet sont encodés en Unicode.
# Distributed Proofreaders Canada
Distributed Proofreaders Canada (DPC) débute ses activités en décembre 2007 pour la production des livres du Projet Gutenberg Canada (PGC), qui voit lui-même le jour quelques mois auparavant, le 1er juillet 2007, le jour de la fête nationale, sous l'égide de Michael Shepard et David Jones. Les cent premiers livres sont disponibles en mars 2008, avec des livres en anglais, en français et en italien. 250 livres sont disponibles en février 2009 et 427 livres le 15 octobre 2010.
# Quelques chiffres
= Plus de 33.000 ebooks pour le Projet Gutenberg, tous relus et corrigés deux fois, et dans plusieurs langues, le but étant plus la qualité que la quantité.
= 18.961 ebooks traités par Distributed Proofreaders (le site original, basé aux États-Unis) le 1er novembre 2010, depuis son lancement en octobre 2000, et 2.352 volontaires actifs pendant le mois d'octobre 2010.
= 739 ebooks traités par Distributed Proofreaders Europe le 1er novembre 2010, depuis son lancement en janvier 2004.
= 433 ebooks traités par Distributed Proofreaders Canada le 1er novembre 2010, depuis son lancement en décembre 2007, avec 127 volontaires actifs pendant le mois d'octobre 2010.
# Quelques liens
Le Projet Gutenberg, https://www.gutenberg.org/
Distributed Proofreaders, http://www.pgdp.net/c/ lancé en octobre 2000.
Distributed Proofreaders Europe, http://dp.rastko.net/ l'antenne européenne lancée début 2004, avec une interface en plusieurs langues, dont le français.
Distributed Proofreaders Canada, http://www.pgdpcanada.net/c/default.php lancé en décembre 2007.
Les volontaires de tous pays sont en fait bienvenus sur les trois sites - sans préférence géographique ni linguistique - la belle littérature n'ayant pas de frontières.
ACKNOWLEDGEMENTS / AGRADECIMIENTOS / REMERCIEMENTS
Many thanks to / Muchas gracias a / Merci à:
Anna Álvarez Mike Cook Al Haines Michael Hart Greg Newby Russon Wooldridge
for their kind help / para su ayuda / pour leur aide.
Copyright © 2010 Marie Lebert
End of Project Gutenberg's 40 years / 40 años / 40 ans, by Marie Lebert