Las tecnologías y el libro para todos
Chapter 1
Produced by Al Haines
LAS TECNOLOGÍAS Y EL LIBRO PARA TODOS
MARIE LEBERT
Traducido por Anna Alvarez y Marie Lebert para el Proyecto Gutenberg
Copyright © 2008 Marie Lebert
Con muchas gracias a Anna Alvarez por la traducción de una gran parte de este documento en español, y a todas las personas que contestaron mis preguntas y que están citadas aquí. Este documento está disponible también en francés (título: Les technologies et le livre pour tous. NEF, University of Toronto, mai 2008) y en inglés (título: Technology and books for all. NEF, University of Toronto, June 2008).
ÍNDICE
Introducción
Cronología
1968: ASCII
1971: Proyecto Gutenberg
1974: Internet
1990: Web
1991: Unicode
1993: Online Books Page
1993: PDF
1994: Consorcio W3C
1995: Amazon.com
1996: Internet Archive
1996: Palm Pilot
1997: Open eBook
1999: Bibliotecarios digitales
1999: Web multilingüe
2000: Mobipocket
2000: Public Library of Science
2000: Distributed Proofreaders
2000: Biblia de Gutenberg
2001: Wikipedia
2003: MIT OpenCourseWare
2004: Proyecto Gutenberg Europa
2005: Google Print / Book Search
2005: Open Content Alliance
2006: Microsoft Live Search Books
2006: WorldCat
2007: Citizendium
2007: Encyclopedia of Life
INTRODUCCIÓN
Somos muchos los que soñamos con una biblioteca digital universal de libre acceso - es decir accesible desde cualquier navegadora y en cualquier momento. Gracias al Proyecto Gutenberg, al Internet Archive y a otros proyectos, el sueño empieza a hacerse realidad, al menos para los libros del dominio público.
Este proceso empezó hace tiempo gracias a los esfuerzos de algunos precursores. El "libro para todos" nació con el Proyecto Gutenberg, creado por Michael Hart en julio de 1971. El objetivo era utilizar las "nuevas tecnologías" para difundir gratuitamente bajo forma electrónica las obras literarias que pertenecían al dominio público.
Ahora funciona a toda marcha. Aunque de momento se encuentren con dificultades a la hora de digitalizar libros con copyright, muchas instituciones se interesan por ver los problemas de copyright solucionados, para ofrecer libre acceso a cuantos libros sea posible.
Otra cuestión importante es la relectura de los libros digitalizados, que garantiza una precisión mayor del texto sin ninguna pérdida respecto a la versión impresa. Los programas OCR de buena calidad deberían garantizar una precisión al 99%, dejando unos diez errores por página. Aunque el Proyecto Gutenberg recalca la importancia de esta etapa, no es el caso del Internet Archive, de Google y de muchos otros, que casi prescinden de esta etapa.
Con métodos diversos, todos trabajan para alcanzar el mismo sueño de una biblioteca digital universal. 25 millones de libros (sin contar las diversas versiones del mismo libro) pertenecen al dominio público. A mediados de 2007, más de 2 millones tenían libre acceso en la red.
CRONOLOGÍA
1968: El ASCII es el primer sistema de codificación para computadores.
1971: El Proyecto Gutenberg es la primera biblioteca digital en el mundo.
1974: Se crea el internet.
1990: Se crea la World Wide Web como una red mundial en el internet.
1991: El Unicode es un sistema de codificación que permite tratar todos los idiomas del planeta.
1993: La Online Books Page es un catálogo de libros gratuitos en la web.
1993: Adobe crea el formato PDF, así como el Acrobat Reader, su programa de lectura.
1994: Se funda el Consorcio W3 para desarrollar los protocolos comunes de la web.
1995: Amazon.com empieza como gran librería en línea.
1996: Se funda el Internet Archive para archivar la totalidad de la web.
1996: El Palm Pilot es el primer asistente personal (PDA).
1999: El Open eBook (OeB) propone un formato estándar para el libro digital.
1999: Dos bibliotecarios digitales cuentan sus experiencias.
1999: La web se hace multilingüe, con cada vez más páginas en otros idiomas que el inglés.
2000: Mobipocket se especializa en libros digitales para asistentes personales.
2000: La Public Library of Science (PLoS) propone lanzar periódicos científicos y médicos en línea.
2000: Distributed Proofreaders ayuda a la digitalización de los libros del dominio público.
2000: La British Library pone en línea la versión digital de la Biblia de Gutenberg.
2001: Wikipedia es una gran enciclopedia de elaboración colectiva en línea.
2003: El MIT OpenCourseWare es un conjunto gratuito de clases del Massachusetts Institute of Technology.
2004: El Proyecto Gutenberg se hace internacional y lanza el Proyecto Gutenberg Europa.
2005: Google Print / Google Book Search es el proyecto de biblioteca digital mundial de Google.
2005: El Open Content Alliance (OCA) es un proyecto cooperativo para una biblioteca digital mundial pública.
2006: Live Search Books es el proyecto de biblioteca digital mundial de Microsoft.
2006: El gran catálogo conjunto WorldCat de OCLC está disponible gratuitamente.
2007: Citizendium es una enciclopedia colectiva y académica en línea.
2007: La Encyclopedia of Life es una enciclopedia colectiva de ciencias de la vida.
1968: ASCII
El código ASCII (American Standard Code for Information Interchange) fue creado como un sistema de codificación de 7 bits para computadores, desde los primeros pasos de la informática. El ASCII fue publicado en 1968 por el ANSI (American National Standards Institute), y actualizado en 1977 y 1986. El ASCII original sólo puede procesar 128 caracteres, o sea únicamente el inglés. Entre los 128 caracteres figuran 95 caracteres no acentuados imprimibles (A-Z, a-z, números, puntuación y símbolos básicos) que aparecen en el teclado inglés y estadounidense.
Las extensiones del ASCII (ISO-8859 o ISO-Latin) son códigos de 256 caracteres que incluyen las letras que llevan acento o tilde en algunos idiomas europeos como el francés, el español o el alemán: por ejemplo ISO 8859-1 (Latin-1) para el francés.
Otro sistema de caracteres masivamente usado es el Unicode, un sistema de codificación de caracteres universal lanzado en 1991 para tratar cualquier idioma con cualquier plataforma.
El ASCII sigue siendo muy utilizado en 2008: 50% para el ASCII y 50% para el Unicode. El ASCII puede ser escrito, leído, copiado e imprimido con cualquier editor de texto básico o cualquier programa de tratamiento de texto. Es el único formato compatible con 99% del hardware y del software. Se puede utilizar tal y como está, o bien para crear otras versiones en muchos formatos diferentes.
Con el Proyecto Gutenberg, la biblioteca digital más antigua del mundo, tanto los libros que fueron digitalizados hace 30 años como los de ahora se digitalizan mediante uso del ASCII original de siete bits (llamado "Plain Vanilla ASCII"). De esta manera los textos electrónicos tienen la forma más sencilla posible y pueden ser leídos sin ningún problema con cualquier ordenador, plataforma y programa, incluso si se trata de una PDA o de un aparato de lectura especializado. Después, cada uno queda libre - particulares u organismos - de convertirlos a formatos diferentes. El Proyecto Gutenberg ahora propone también otros formatos para muchos libros, pero es obligatorio que figure el ASCII.
1971: PROYECTO GUTENBERG
El Proyecto Gutenberg (Project Gutenberg) fue fundado por Michael Hart en julio de 1971 cuando aún era un estudiante de la Universidad de Illinois (Estados Unidos). El objetivo del proyecto era poner gratuitamente a disposición de todos, por vía electrónica, el mayor número posible de obras del dominio público. El Proyecto Gutenberg era innovador por muchos aspectos. Era a la vez la primera página web de información sobre un internet embrionario (que se inició verdaderamente en 1974) y la primera biblioteca digital. Durante los veinte primeros años, Michael digitalizó él mismo los cien primeros libros, con la ayuda ocasional de diversas personas. Los detractores de este proyecto consideraron imposible llevarlo a cabo a gran escala.
Apareció luego la web, un subconjunto del internet, operativa en 1991, y la primera navegadora, operativa en noviembre de 1993. Al generalizarse el uso de la web, el Proyecto Gutenberg cobró nueva vida y alcanzó una difusión internacional. Mientras proseguía con la digitalización de los libros, Michael empezó a coordinar el trabajo de decenas, y pronto de centenares de voluntarios en varios países. Las colecciones llegaron a unos 1.000 libros en agosto de 1997, 2.000 libros en mayo de 1999, 3.000 libros en diciembre de 2000, y hasta 4.000 libros en octubre de 2001.
"Nosotros consideramos el texto electrónico como un nuevo medio de comunicación, que no tiene verdadera relación con el papel, explicó Michael en agosto de 1998. La única semejanza es que ambos difundimos las mismas obras, pero en cuanto la gente se haya acostumbrado, yo no veo cómo el papel aún podría competir con el texto electrónico, sobre todo en las escuelas." (entrevista del NEF traducida por ML) El conjunto de páginas encuadernadas, forma tradicional del libro, se sustituiría por un texto electrónico que se podría desplegar de par en par, con letras capitales para los términos escritos en cursiva, en negrita y los términos subrayados en la versión impresa.
Con el transcurrir de los años, miles de voluntarios digitalizaron con paciencia cientos de obras en modo texto. Primero se trataba esencialmente de documentos en inglés, pero las colecciones se fueron haciendo poco a poco multilingües. Se alcanzó la cifra simbólica de 5.000 libros en abril de 2002, 10.000 libros en octubre de 2003, 15.000 libros en enero de 2005, 20.000 libros en diciembre de 2006 y 25.000 libros en abril de 2008. Con 340 libros más cada mes, 40 sitios espejo en numerosos países, varias decenas de millares de descargas al día y decenas de millares de voluntarios en el mundo.
Hasta hoy, nadie consiguió obrar con más éxito para poner los clásicos de la literatura mundial a disposición de todos. Ni tampoco crear con tan pocos gastos una red tan inmensa de voluntarios en el mundo entero, sin derroche de competencias y de energía.
En enero de 2004, el Proyecto Gutenberg se extendió más allá del Atlántico con la creación del Proyecto Gutenberg Europa. A la misión original se añadió un papel de puente entre idiomas y culturas diversas. Pero siguiendo siempre con la misma óptica: la lectura a disposición de todos al menor coste, mediante el uso de textos electrónicos gratuitos que se pudieran utilizar y reproducir sin límites. Y luego, la segunda etapa sería la digitalización de la imagen y del sonido, siguiendo una orientación similar.
1974: INTERNET
En 1971, tres años antes del inicio oficial del internet, Michael Hart estudiaba en la Universidad de Illinois, en los Estados Unidos. El laboratorio informático (Materials Research Lab) de su universidad le asignó 100 millones de dólares de tiempo de ordenador. ¿Qué hacer con eso?
El 4 de julio de 1971, diá de la fiesta nacional, Michael pasó The United States Declaration of Independence (la Declaración de Independencia de Estados Unidos, firmada el 4 de julio de 1776) en el teclado de su ordenador. En mayúsculas, pues las letras minúsculas aún no existían. El texto electrónico representaba 5 Ko (kilo-octetos).
El envío de un archivo de 5 Ko a las cien personas que formaban el internet embrionario de la época hubiera acabado con el sistema, provocando su implosión. Por aquel tiempo la potencia de la banda ancha aún era ínfima. Michael difundió un mensaje que explicaba dónde se almacenaba el texto (aunque sin utilizar ningún hipervínculo, pues habría que esperar unos 20 años más para la web). Poco después, seis personas descargaron este archivo.
Sobre la marcha, Michael decidió dedicar ese crédito de tiempo de 100 millones de dólares a la búsqueda de obras del dominio público que estuvieran disponibles en bibliotecas, y a la digitalización de éstas. Era el nacimiento del Proyecto Gutenberg. El internet se inició en 1974 y despegó verdaderamente en 1983.
1990: WEB
La World Wide Web -que se convirtió más tarde en la Web o web- fue inventada por Tim Berners-Lee en 1989-90.
Tim Berners-Lee escribió en mayo de 1998: "El sueño que se esconde detrás de la Web es el siguiente: crear un espacio de información común en donde comuniquemos compartiendo la información. Es esencial que este espacio sea universal y que los vínculos hipertexto puedan enlazar con cualquier tipo de datos: pueden ser personales, locales o mundiales. Tampoco importa que se trate sólo de esbozos o, al contrario, de documentos esmerados. El sueño también tenía una segunda parte: el acceso a la Web se generalizó hasta tal punto que se convirtió en un espejo realista (o de hecho en la encarnación más directa) de la manera en que trabajamos, jugamos y hacemos vida social. Esto significaba que tras contemplar online la descripción de nuestras relaciones sociales, podríamos utilizar los ordenadores para analizarlas, dar sentido a lo que hacemos, preguntarnos en qué espacio cada uno encuentra un lugar que le corresponda, y cómo podemos trabajar mejor juntos." (fragmento sacado del texto: The World Wide Web: A very short personal history, disponible en el sitio web del Consorcio W3C)
Según la sociedad Netcraft, que analiza la evolución de la web mediante sondeos automáticos, había 100 millones de páginas web el 1 de noviembre de 2006. Anteriores hitos se habían alcanzado en abril de 1997 (1 millón de páginas web), en febrero del año 2000 (10 millones), en septiembre de 2000 (20 millones), en julio de 2001 (30 millones), en abril de 2003 (40 millones), en mayo de 2004 (50 millones), en marzo de 2005 (60 millones), en agosto de 2005 (70 millones), en abril de 2006 (80 millones) y en agosto de 2006 (90 millones).
1991: UNICODE
El Unicode fue publicado por primera vez en enero de 1991 como sistema de codificación universal. El Unicode puede procesar 65.000 caracteres únicos y tratar todos los sistemas de escritura del planeta. "Unicode asigna un número único a cada carácter, cualesquiera que sean la plataforma, el programa y el idioma." (fragmento sacado de la página web) Como puede ser leído sobre cualquier plataforma, el Unicode permite el procesamiento, almacenamiento e intercambio de datos textuales en cualquier idioma, sin que importe el protocolo técnico de información utilizado.
El Unicode Consortium fue creado el mismo año para desarrollar el Unicode. Para satisfacción de muchos lingüistas, va sustituyendo el ASCII, un sistema de codificación de 7 bits que sólo puede procesar 128 caracteres, o sea únicamente el inglés, con unas extensiones que toman en cuenta las letras que llevan acento o tilde en algunos idiomas europeos. Unicode forma parte de las especificaciones del Consorcio W3C, creado en 1994 para desarrollar los protocolos comunes de la web. En 2008, el Unicode es utilizado por 50% de la web.
1993: ONLINE BOOKS PAGE
John Mark Ockerbloom era estudiante en la Universidad Carnegie Mellon (Pittsburgh, en el Estado de Pensilvania, Estados Unidos) cuando creó la Online Books Page (o sea: Página de los libros online) en 1993 para proponer una lista de obras en inglés disponibles gratuitamente en la web. La Online Books Page es "una página web que facilita el acceso a libros que se pueden leer gratuitamente en internet. Su meta también consiste en favorecer el desarrollo de semejantes libros online, para beneficio y edificación de todos." (fragmento sacado de la página web) John Ockerbloom conservó esta página en el sitio web del Departamento de informática de la universidad.
Cinco años después, en septiembre de 1998, John escribió: "Era webmaster aquí para el Departamento de informática de la CMU (Carnegie Mellon University), y empecé nuestro sitio local en 1993. Comprendía páginas con enlaces hacia recursos disponibles localmente, y al principio la Online Books Page era una de estas páginas, con enlaces hacia libros puestos en línea por personas de nuestro departamento (por ejemplo Robert Stockton, que hizo versiones web de algunos textos del Proyecto Gutenberg). Después los usuarios empezaron a pedir enlaces hacia libros disponibles en otros sitios. Observé que muchos sitios web (y no solamente el Proyecto Gutenberg o Wiretap) proponían libros en línea, y que sería útil tener una lista completa que permitiera descargar o leer libros desde el mismo lugar donde se encontraran en el internet. Fue así cómo empezó mi catálogo.
Dejé mi actividad de webmaster en 1996, pero mantuve la gestión de la Online Books Page porque, entretanto, me apasioné por el enorme potencial que tenía el internet para poner la literatura a disposición de muchas personas. Ahora hay tantos libros online, que me es difícil estar al día. Pero pienso continuar esta actividad de una manera o de otra. Me intereso mucho por el desarrollo del internet como medio de comunicación de masa durante los próximos años. Me gustaría también seguir implicándome en la puesta gratuita de libros en el internet, ya sea que esta tarea forme parte integrante de mi actividad profesional, o que sea una actividad voluntaria durante mi tiempo libre." (entrevista del NEF traducida por ML)
John Mark Ockerbloom obtuvo su doctorado en informática en 1998. Se fue a la Universidad de Pennsylvania en 1999 para trabajar como investigador sobre el desarrollo de la biblioteca digital. Transfirió la Online Books Page (12.000 libros en 1999) al sitio web de la biblioteca, con la misma presentación, muy sencilla, y continuó su lista. La Online Books Page listaba 20.000 libros en septiembre de 2003 (entre los cuales 4.000 libros publicados por mujeres), 25.000 libros en diciembre de 2006 y 31.000 libros en marzo de 2008. Los libros "fueron escritos, puestos en línea y albergados por una gran variedad de individuos y de grupos diseminados por el mundo entero", con 7.300 libros del Proyecto Gutenberg. La sección FAQ (preguntas más frecuentes) incluye información sobre el copyright en casi todos los países del mundo, con enlaces para una lectura más detallada.
1993: PDF
En junio de 1993, la sociedad Adobe lanzó el formato PDF (Portable Document Format) y el Acrobat Reader, su programa de lectura, que permite leer documentos en PDF. Lo atractivo del formato PDF es que permite conservar la presentación del documento de origen para leerlo, sin importar la plataforma que se haya utilizado para crearlo, mediante uso del programa Adobe Acrobat. Se trata de un programa que "permite reproducir y ver información rigurosa desde cualquier aplicación y cualquier sistema informático, y compartirlo con cualquier persona en el mundo. Individuos, negocios, y agencias del gobierno en todas partes se fían y dependen de Adobe PDF para comunicar sus ideas y opiniones." (fragmento sacado de la página web)
El formato PDF se convirtió en una norma internacional de difusión de los documentos electrónicos. El Acrobat Reader está disponible en varios idiomas y para diversas plataformas (Windows, Macintosh, Linux, Unix). En el año 2001, Adobe lanzó una versión de Acrobat Reader para asistente personal (PDA), utilizable en el Palm Pilot (en mayo de 2001) y luego en el Pocket PC (en diciembre de 2001). En mayo de 2003, el Acrobat Reader se convierte en el Adobe Reader. Hoy en día, más de 500 millones de copias de Adobe Reader (antiguamente el Acrobat Reader, hasta mayo de 2003) han sido descargadas en el mundo. Unos 10% de los documentos difundidos en la web se pueden consultar en formato PDF.
1994: CONSORCIO W3C
Fundado en octubre de 1994, el Consorcio W3C (World Wide Web Consortium) desarrolla las tecnologías inter-operativas (especificaciones, líneas maestras, software y herramientas) para la web (creada en 1990), a modo de foro de información, comercio, comunicación y conocimiento colectivo. El W3C desarrolla protocolos comunes para que la web alcance su máximo potencial, por ejemplo gracias a las especificaciones de HTML (HyperText Markup Language) y XML (eXtensible Markup Language). HTML es la lingua franca para editar hipertexto en la red. XML fue diseñado para enviar e intercambiar una gran variedad de datos.
1995: AMAZON.COM
En julio de 1995, Jeff Bezos fundó en Seattle (en el Estado de Washington, Estados Unidos) la librería online Amazon.com, futuro gigante del comercio electrónico. Tras un estudio de mercado que demostraba que los libros eran los mejores "productos" para poner a la venta en la red, Amazon.com empezó con diez empleados y tres millones de artículos. Cinco años más tarde, en noviembre de 2000, la sociedad contaba con 7.500 empleados, 28 millones de artículos, 23 millones de clientes y cuatro filiales (Reino Unido, Alemania, Francia, Japón), a los cuales se sumió una quinta filial en Canadá en junio de 2002 y luego una sexta filial en China en septiembre de 2004.
Pero eso no fue una buena noticia para las pequeñas librerías. La librería Ulysses está situada en París, en la Isla Saint-Louis. Creada en 1971 por Catherine Domain, es la más antigua librería en el mundo dedicada sólo al viaje, con 20.000 libros, cartas y revistas nuevos y antiguos.
Catherine es miembro del Sindicato nacional francés de la librería antigua y moderna (SLAM, o sea: Syndicat national de la librairie ancienne et moderne), del Club de los exploradores (Club des explorateurs) y del Club internacional de los grandes viajeros (Club international des grands voyageurs).
Catherine viajó mucho, a 140 países, y de vez en cuando en condiciones difíciles. En 1999, se lanzó en un viaje virtual mucho más difícil, es decir crear su propio sitio web, sin saber nada de computadores. Catherine escribió en noviembre de 2000 : "Mi sitio web está en estado embrionario y en construcción. Quiero que sea como mi librería, un lugar de encuentro antes de ser un lugar comercial. El internet me pone los pelos de punta, toma mi tiempo y no me da ningún beneficio, pero esto no me molesta..." Catherine es pesimista sobre el futuro de pequeñas librerías como la suya. "El internet mata las librerías especializadas. Esperando a que me devore, yo uso el internet como medio para atraer a los clientes hasta mi casa, ¡y también con la intención de encontrar libros para aquéllos que aún no tienen internet en casa! Pero la verdad es que no tengo mucha esperanza..." (entrevista del NEF traducida por ML y AA)
1996: INTERNET ARCHIVE
Fundado en abril de 1996 por Brewster Kahle en San Francisco (California), el Internet Archive (o sea: Archivo de internet) tiene como objetivo constituir, almacenar, preservar y gestionar una "biblioteca del internet", archivando la totalidad de las páginas web cada dos meses. El objetivo es ofrecer acceso permanente a un archivo completo de la red a los estudiantes, universitarios, investigadores o historiadores, y preservar un histórico del internet para las generaciones futuras.
A finales de 1999, la organización empezó a incluir también más colecciones de páginas web archivadas sobre temas específicos. También se convirtió en una biblioteca digital online que contenía documentos de texto, documentos audio, software, imágenes y videos.
En octubre de 2001, con 30 billones de páginas web almacenadas, el Internet Archive lanzó la Wayback Machine, para permitir a los usuarios consultar sus archivos por fechas, directamente sobre su sitio web. Los archivos de la web representaban 30 millones de páginas web en 1996, 65 miles de millones de páginas (procedentes de 50 millones de sitios web) en diciembre de 2006 y 85 miles de millones de páginas en mayo de 2007.
En octubre de 2005, el Internet Archive lanzó el Open Content Alliance (OCA) asociándose con otros colaboradores. Se trataba de unir fuerzas para construir una biblioteca mundial permanente cuyo contenido constara de textos digitales multilingües (en el Text Archive del Internet Archive) y de documentos multimedia.
1996: PALM PILOT