Part 14
Les premiers organismes participants sont les bibliothèques des Universités de Californie et de Toronto, les Archives européennes, les Archives nationales du Royaume-Uni, O'Reilly Media et les Prelinger Archives. Seuls les livres appartenant au domaine public sont numérisés, pour éviter les problèmes de copyright auxquels se heurte Google. L'OCA ne numérise les livres sous droits que si les éditeurs ou les auteurs de ces livres ont donné leur accord. Les collections numérisées sont progressivement intégrées à la section Text Archive de l'Internet Archive, avec 100.000 livres numérisés disponibles en décembre 2006 et 200.000 livres disponibles en mai 2007.
En décembre 2006, l'Internet Archive reçoit une subvention d'un million de dollars US de la part de la Sloan Foundation pour numériser les collections du Metropolitan Museum of Art (la totalité des livres et plusieurs milliers d'images) ainsi que certaines collections de la Boston Public Library (les 3.800 livres de la bibliothèque personnelle de John Adams, deuxième président des États-Unis), du Getty Research Institute (une collection de livres d'art), de la John Hopkins University (une collection de documents sur le mouvement anti- esclavagiste) et de l'Université de Californie à Berkeley (une collection de documents sur la ruée vers l'or).
En décembre 2006, tout en participant à l'OCA, Microsoft met en ligne aux États-Unis la version bêta de Live Search Books, sa propre bibliothèque numérique, qui permet une recherche par mots-clés dans sa collection de livres du domaine public. Ces livres sont numérisés par Microsoft suite à des accords passés avec de grandes bibliothèques, les premières étant la British Library et les bibliothèques des Universités de Californie et de Toronto, suivies en janvier 2007 par la New York Public Library et la bibliothèque de la Cornell University. Microsoft compte aussi ajouter des livres sous droits, mais uniquement avec l'accord préalable des éditeurs. En mai 2007, la société annonce des accords avec plusieurs grands éditeurs, dont Cambridge University Press et McGraw Hill. Microsoft met finalement un terme à ce projet en mai 2008. Les 750.000 livres déjà numérisés sont versés dans les collections de l'OCA disponibles dans l'Internet Archive.
Les collections de l'OCA comptent un million de livres numérisés en décembre 2008 et deux millions de livres numérisés en mars 2010.
2006 > LE CATALOGUE COLLECTIF WORLDCAT EN LIGNE
[Résumé] En août 2006, le catalogue collectif mondial WorldCat lance sa version web bêta en accès libre. Géré depuis nombre d'années par l'association OCLC (Online Computer Library Center), WorldCat était jusque-là disponible sur abonnement. Les 73 millions de notices des 10.000 bibliothèques participantes dans 112 pays permettent de localiser un milliard de documents. La migration de WorldCat sur le web est progressive puisque la consultation des notices est d'abord possible via plusieurs moteurs de recherche (Yahoo!, Google et d'autres). Suit la version web gratuite worldcat.org, qui propose non seulement les notices des documents mais aussi un accès direct (gratuit ou payant) aux documents électroniques des bibliothèques membres: livres du domaine public, articles, photos, vidéos, musique et livres audio. WorldCat permet de localiser 1,5 milliard de documents en avril 2010. L'autre grand catalogue mondial, géré par le RLG (Research Libraries Group), fusionne avec OCLC en décembre 2006.
***
En août 2006, l'association OCLC (Online Computer Library Center) lance la version web de son catalogue collectif mondial WorldCat en accès libre.
Qu'est-ce exactement qu'un catalogue collectif? Le but premier d'un catalogue collectif est d'éviter de cataloguer à nouveau un document déjà traité par une bibliothèque partenaire. Si le catalogueur trouve la notice du livre qu'il est censé cataloguer, il la copie pour l'inclure dans le catalogue de sa propre bibliothèque. S'il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs officiant dans d'autres bibliothèques. De nombreux catalogues collectifs sont gérés à l'échelon local, régional, national ou mondial.
Les deux grands catalogues collectifs mondiaux sont lancés dès les années 1980, respectivement par OCLC (Online Computer Library Center) et par RLG (Research Libraries Group). Vingt ans plus tard, ces deux associations gèrent de gigantesques bases bibliographiques alimentées par leurs adhérents, permettant ainsi aux bibliothèques d'unir leurs forces par-delà les frontières.
# Le catalogue d'OCLC
Fondée en 1967 dans l'Ohio (États-Unis), l'association OCLC gère d'abord l'OCLC Online Union Catalog à partir de 1971 pour desservir les bibliothèques universitaires de l'Ohio avant de s'étendre progressivement à tout le pays puis au monde entier.
Rebaptisé WorldCat et disponible sur abonnement payant, ce catalogue comprend 38 millions de notices en 370 langues en 1998, avec translittération des notices dans les langues JACKPHY, à savoir le japonais, l'arabe, le chinois, le coréen (Korean en anglais), le persan, l'hébreu et le yiddish. Deux millions de notices sont ajoutées au catalogue chaque année. WorldCat utilise huit formats bibliographiques correspondant aux catégories suivantes: livres, périodiques, documents visuels, cartes et plans, documents mixtes (plusieurs supports à la fois), enregistrements sonores, partitions et enfin documents informatiques.
En 2005, 61 millions de notices bibliographiques produites par 9.000 bibliothèques participantes sont disponibles dans 400 langues. En 2006, 73 millions de notices provenant de 10.000 bibliothèques dans 112 pays permettent de localiser un milliard de documents. Une notice type contient la description du document ainsi que des informations sur son contenu (table des matières, résumé, couverture, illustrations, courte biographie de l'auteur).
Devenue la plus grande base mondiale de données bibliographiques, WorldCat migre progressivement sur le web, d'abord en rendant la consultation des notices possible par le biais de plusieurs moteurs de recherche (Yahoo!, Google et d'autres), puis en lançant en août 2006 une version web (bêta) de WorldCat en accès libre, qui propose non seulement les notices des documents mais aussi l'accès direct (gratuit ou payant) aux documents électroniques des bibliothèques membres: livres du domaine public, articles, photos, livres audio, musique et vidéos.
# Le catalogue du RLG
Le deuxième grand catalogue collectif mondial est géré par l'association RLG (Research Library Group, qui devient plus tard le Research Libraries Group). Fondé en 1980 en Californie, avec une antenne à New York, le RLG se donne pour but d'améliorer l'accès à l'information dans le domaine de l'enseignement et de la recherche et lance un catalogue collectif dénommé RLIN (Research Libraries Information Network).
Contrairement à WorldCat qui n'accepte qu'une notice par document, RLIN accepte plusieurs notices pour le même document. En 1998, RLIN comprend 82 millions de notices dans 365 langues, avec des notices translittérées pour les documents publiés dans les langues JACKPHY et en cyrillique. Des centaines de dépôts d'archives, bibliothèques de musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques, bibliothèques d'entreprise et bibliothèques d'art utilisent RLIN pour le catalogage, le prêt interbibliothèques et le descriptif de leurs archives et manuscrits.
Une des spécialités de RLIN est l'histoire de l'art. Alimentée par 65 bibliothèques spécialisées, une section spécifique comprend 100.000 notices de catalogues d'expositions et 168.500 notices de documents iconographiques (photographies, diapositives, dessins, estampes et affiches). Cette section inclut aussi les 110.000 notices de la base bibliographique Scipio, dédiée au catalogues de ventes d'objets d'art.
En 2003, RLIN devient le RLG Union Catalog, qui comprend désormais 126 millions de notices bibliographiques correspondant à 42 millions de documents (livres, cartes, manuscrits, films, bandes sonores, etc.).
Au printemps 2004, une version web du catalogue est disponible en accès libre sous le nom de RedLightGreen, suite à une phase pilote lancée à l'automne 2003. C'est la première fois qu'un catalogue collectif mondial est en accès libre, trois ans avant WorldCat. Destiné en priorité aux étudiants du premier cycle universitaire, RedLightGreen propose 130 millions de notices, avec des informations spécifiques aux bibliothèques d'un campus donné (cote du document, lien vers sa version en ligne si celle-ci existe, etc.).
Après trois ans d'activité, le site RedLightGreen ferme en novembre 2006, et le RLG fusionne avec OCLC. Les usagers sont invités à utiliser WorldCat, qui dispose d'une version web en accès libre depuis août 2006. En avril 2010, WorldCat permet de localiser 1,5 milliard de documents et d'avoir directement accès à nombre d'entre eux.
2007 > QUEL AVENIR POUR L'EBOOK?
[Résumé] Suite à une enquête lancée fin 2006 sur l'avenir de l'ebook, voici les réponses de deux professionnels du livre: Pierre Schweitzer, concepteur du projet @folio, un lecteur portable de textes, et Denis Zwirn, fondateur de la bibliothèque numérique Numilog. Selon Pierre, «la chance qu'on a tous est de vivre là, ici et maintenant cette transformation fantastique. Quand je suis né en 1963, les ordinateurs avaient comme mémoire quelques pages de caractères à peine. Aujourd'hui, mon baladeur de musique pourrait contenir des milliards de pages, une vraie bibliothèque de quartier. Demain, par l'effet conjugué de la loi de Moore et de l'omniprésence des réseaux, l'accès instantané aux oeuvres et aux savoirs sera de mise. Le support de stockage lui- même n'aura plus beaucoup d'intérêt. Seules importeront les commodités fonctionnelles d'usage et la poétique de ces objets.»
***
Suite à une enquête lancée fin 2006 sur l'avenir de l'ebook, voici les réponses de deux professionnels du livre: Pierre Schweitzer, concepteur du projet @folio, un lecteur portable de textes, et Denis Zwirn, fondateur de la bibliothèque numérique Numilog.
# «La poétique des objets»
Concepteur du projet @folio, un lecteur portable de textes, Pierre Schweitzer explique en décembre 2006: «La lecture numérique dépasse de loin, de très loin même, la seule question du "livre" ou de la presse. Le livre et le journal restent et resteront encore, pour longtemps, des supports de lecture techniquement indépassables pour les contenus de valeur ou pour ceux dépassant un seuil critique de diffusion. Bien que leur modèle économique puisse encore évoluer (comme pour les "gratuits" la presse grand public), je ne vois pas de bouleversement radical à l'échelle d'une seule génération. Au-delà de cette génération, l'avenir nous le dira. On verra bien. Pour autant, d'autres types de contenus se développent sur les réseaux. Internet défie l'imprimé sur ce terrain- là: celui de la diffusion en réseau (dématérialisée = coût marginal nul) des oeuvres et des savoirs. Là où l'imprimé ne parvient pas à équilibrer ses coûts. Là où de nouveaux acteurs peuvent venir prendre leur place.
Or, dans ce domaine nouveau, les équilibres économiques et les logiques d'adoption sont radicalement différents de ceux que l'on connaît dans l'empire du papier - voir par exemple l'évolution des systèmes de validation pour les archives ouvertes dans la publication scientifique ou les modèles économiques émergents de la presse en ligne. Il est donc vain, dangereux même, de vouloir transformer au forceps l'écologie du papier - on la ruinerait à vouloir le faire! À la marge, certains contenus très spécifiques, certaines niches éditoriales, pourraient être transformées - l'encyclopédie ou la publication scientifique le sont déjà. De la même façon, les guides pratiques, les livres d'actualité quasi-jetables et quelques autres segments qui envahissent les tables des librairies pourraient l'être, pour le plus grand bonheur des libraires. Mais il n'y a là rien de massif ou brutal selon moi. Nos habitudes de lecture ne seront pas bouleversées du jour au lendemain, elles font partie de nos habitudes culturelles, elles évoluent lentement, au fur et à mesure de leur adoption (= acceptation) par les générations nouvelles.»
Selon Pierre, «la chance qu'on a tous est de vivre là, ici et maintenant cette transformation fantastique. Quand je suis né en 1963, les ordinateurs avaient comme mémoire quelques pages de caractères à peine. Aujourd'hui, mon baladeur de musique pourrait contenir des milliards de pages, une vraie bibliothèque de quartier. Demain, par l'effet conjugué de la loi de Moore et de l'omniprésence des réseaux, l'accès instantané aux oeuvres et aux savoirs sera de mise. Le support de stockage lui-même n'aura plus beaucoup d'intérêt. Seules importeront les commodités fonctionnelles d'usage et la poétique de ces objets.»
# «Un produit commercial»
Selon Denis Zwirn, fondateur de la librairie numérique Numilog, interviewé en août 2007, on peu noter «un premier point d'inflexion dans la courbe de croissance du marché des livres numériques. Plusieurs facteurs sont réunis pour cela:
(1) le développement de vastes catalogues en ligne utilisant pleinement les fonctionnalités de la recherche plein texte dans les livres numérisés, comme les catalogues de la future Bibliothèque numérique européenne, de VollTextSuche Online, de Google et d'Amazon. Une fois le contenu trouvé dans un des ouvrages ainsi "sondé" par ce type de recherche révolutionnaire pour le grand public, il est naturel de vouloir accéder à la totalité de l'ouvrage... dans sa version numérique.
(2) Des progrès techniques cruciaux tels que la proposition commerciale d'appareils de lecture à base d'encre électronique améliorant radicalement l'expérience de lecture finale pour l'usager en la rapprochant de celle du papier. Par exemple l'iLiad d'Irex ou le Sony Reader, mais bien d'autres appareils s'annoncent. Le progrès concerne toutefois tout autant le développement des nouveaux smartphones multifonctions comme les BlackBerry ou l'iPhone, ou la proposition de logiciels de lecture à l'interface fortement améliorée et pensée pour les ebooks sur PC, comme Adobe Digital Editions.
(3) Enfin, le changement important d'attitude de la part des professionnels du secteur, éditeurs, et probablement bientôt aussi libraires. Les éditeurs anglo-saxons universitaires ont massivement tracé une route que tous les autres sont en train de suivre, en tout cas aux États-Unis, en Europe du Nord et en France: proposer une version numérique de tous les ouvrages. Même pour les plus réticents encore il y a quelques années, ce n'est plus une question de "pourquoi?", c'est simplement devenu une question de "comment?". Les libraires ne vont pas tarder à considérer que vendre un livre numérique fait partie de leur métier normal.»
Selon Denis, «le livre numérique n'est plus une question de colloque, de définition conceptuelle ou de divination par certains "experts": c'est un produit commercial et un outil au service de la lecture. Il n'est pas besoin d'attendre je ne sais quel nouveau mode de lecture hypermoderne et hypertextuel enrichi de multimédia orchestrant savamment sa spécificité par rapport au papier, il suffit de proposer des textes lisibles facilement sur les supports de lecture électronique variés qu'utilisent les gens, l'encre électronique pouvant progressivement envahir tous ces supports. Et de les proposer de manière industrielle. Ce n'est pas et ne sera jamais un produit de niche (les dictionnaires, les guides de voyage, les livres pour les non voyants...): c'est en train de devenir un produit de masse, riche de formes multiples comme l'est le livre traditionnel.»
2007 > CITIZENDIUM, ENCYCLOPÉDIE EXPÉRIMENTALE
[Résumé] Citizendium - acronyme de «The Citizens' Compendium» - est une encyclopédie collaborative expérimentale lancée en mars 2007 (en version bêta) par Larry Sanger, auparavant co-fondateur de Wikipédia avec Jimmy Wales. Citizendium est une encyclopédie coopérative gratuite, tout comme Wikipédia, mais, d'après Larry, sans ses travers, à savoir le vandalisme, le manque de rigueur et l'utilisation d'un pseudonyme pour y contribuer. Les auteurs signent leurs articles de leur vrai nom et ces articles sont relus et corrigés par des «editors», âgés d'au moins 25 ans et titulaires d'une licence universitaire. De plus, des «constables» sont chargés de la bonne marche du projet et du respect du règlement. Le jour de son lancement le 25 mars 2007, Citizendium comptabilise 1.100 articles, 820 auteurs et 180 experts. L'encyclopédie comprend 11.800 articles en juillet 2009 et 15.000 articles en septembre 2010.
***
Citizendium est une encyclopédie collaborative expérimentale lancée en mars 2007 par Larry Sanger, co-fondateur de Wikipédia.
Acronyme de «The Citizens' Compendium», Citizendium est une encyclopédie coopérative et gratuite, tout comme Wikipédia, mais, d'après Larry, sans ses travers, à savoir le vandalisme, le manque de rigueur et l'utilisation d'un pseudonyme pour y participer. Les auteurs signent leurs articles de leur vrai nom et ces articles sont relus et corrigés par des «editors» âgés d'au moins 25 ans et titulaires d'une licence universitaire. De plus, des «constables» sont chargés de la bonne marche du projet et du respect du règlement. Le jour de son lancement le 25 mars 2007, suite à une gestation débutée en novembre 2006, Citizendium comptabilise 1.100 articles, 820 auteurs et 180 experts. L'encyclopédie comprend 9.800 articles en janvier 2009 et 15.000 articles en septembre 2010.
Dans «Why make room for experts in web 2.0?» (Pourquoi accorder une place aux experts dans le web 2.0?), un article en ligne daté d'octobre 2006 et actualisé en mars 2007, Larry Sanger voit dans Citizendium l'émergence d'un nouveau modèle de collaboration massive de dizaines de milliers d'intellectuels et scientifiques, non seulement pour les encyclopédies, mais aussi pour les manuels d'enseignement, les ouvrages de référence, le multimédia et les applications en 3D. Cette collaboration serait basée sur le partage des connaissances, dans la lignée du web 2.0, un concept lancé en 2004 pour caractériser les notions de communauté et de partage et qui se manifeste d'abord par une floraison de wikis, de blogs et de sites sociaux. D'après Larry, on pourrait également créer des structures de type web 2.0 pour des collaborations scientifiques, et Citizendium pourrait servir de prototype dans ce domaine.
2007 > L'ENCYCLOPEDIA OF LIFE, PROJET GLOBAL
[Résumé] L'Encyclopedia of Life (EOL) débute en mai 2007 en tant que projet global visant à regrouper les connaissances existantes sur les espèces animales et végétales. Les espèces connues seraient au nombre de 1,8 million, y compris les espèces en voie d'extinction, avec l'ajout de nouvelles espèces au fur et à mesure de leur identification, ce qui représenterait entre 8 et 10 millions d'espèces en tout. Outil d'apprentissage et d'enseignement pour une meilleure connaissance de notre planète, cette encyclopédie collaborative multimédia sera à destination de tous: scientifiques, enseignants, étudiants, scolaires, médias, décideurs et grand public, qui pourront y contribuer directement, le contenu étant ensuite validé ou non par des experts. L'encyclopédie devrait être pleinement opérationnelle en 2012 et complète - c'est-à-dire à jour - en 2017. Des versions en plusieurs langues seront gérées par des organismes partenaires.
***
L'Encyclopedia of Life (EOL) débute en mai 2007 en tant que projet global visant à regrouper les connaissances existantes sur les espèces animales et végétales.
Les espèces connues seraient au nombre de 1,8 million, y compris les espèces en voie d'extinction, avec l'ajout de nouvelles espèces au fur et à mesure de leur identification, ce qui représenterait entre 8 et 10 millions d'espèces en tout.
Ce projet collaboratif est mené par plusieurs grandes institutions: Field Museum of Natural History, Harvard University, Marine Biological Laboratory, Missouri Botanical Garden, Smithsonian Institution et Biodiversity Heritage Library.
Le financement initial de l'Encyclopedia of Life est assuré par la MacArthur Foundation avec 10 millions de dollars US et la Sloan Foundation avec 2,5 millions de dollars. Un financement total de 100 millions de dollars serait nécessaire sur dix ans, avant que l'encyclopédie ne puisse s'autofinancer.
Le directeur honoraire du projet est Edward Wilson, professeur émérite à l'Université de Harvard, qui, dans un essai daté de 2002, fut le premier à émettre le voeu d'une telle encyclopédie. Cinq ans plus tard, en 2007, c'est désormais chose possible grâce aux avancées technologiques récentes: outils logiciels permettant l'agrégation de contenu, mash-up (à savoir le fait de rassembler un contenu donné à partir de nombreuses sources différentes), wikis de grande taille et gestion de contenus à vaste échelle.
Cette encyclopédie collaborative multimédia permettra de rassembler textes, photos, cartes, bandes sonores et vidéos, avec une page web par espèce, en offrant un portail commun à des millions de documents épars, en ligne et hors ligne. Outil d'apprentissage et d'enseignement pour une meilleure connaissance de notre planète, l'encyclopédie sera à destination de tous: scientifiques, enseignants, étudiants, scolaires, médias, décideurs et grand public, qui pourront y contribuer directement, le contenu étant ensuite validé ou non par des experts.
En qualité de consortium des dix plus grandes bibliothèques des sciences de la vie, qui s'ouvrira ensuite à d'autres bibliothèques, la Biodiversity Heritage Library entreprend la numérisation de 2 millions de documents dont les dates de publication s'étalent sur deux cents ans, pour intégration progressive dans l'Encyclopedia of Life. En mai 2007, à la date du lancement officiel du projet, on compte déjà 1,25 million de pages traitées dans les centres de numérisation de Londres, Boston et Washington, D.C. Les documents numérisés sont disponibles au fur et à mesure dans l'Internet Archive.
Si la réalisation des pages web débute courant 2007, l'encyclopédie fait ses réels débuts sur la toile à la mi-2008. Elle devrait être pleinement opérationnelle en 2012 et complète - c'est-à-dire à jour - en 2017.
L'encyclopédie sera un «macroscope» permettant de déceler les grandes tendances à partir d'un stock d'informations considérable, à la différence du microscope permettant l'étude de détail. La version initiale sera d'abord en anglais avant d'être traduite en plusieurs langues par de futurs organismes partenaires.
2009 > INDISCRIPTS, LABORATOIRE DE SCRIPTS INDESIGN
[Résumé] Marc Autret, infographiste, a derrière lui dix ans de journalisme multi-tâches et de formation en ligne dans les domaines de l'édition, du multimédia et du droit d'auteur. Il explique en décembre 2006: «Je suis un "artisan" de l'information et je travaille essentiellement avec des éditeurs. Ils sont tellement en retard, tellement étrangers à la révolution numérique, que j'ai du pain sur la planche pour pas mal d'années. Aujourd'hui je me concentre sur le conseil, l'infographie, la typographie, le pré-presse et le webdesign, mais je sens que la part du logiciel va grandir. Des secteurs comme l'animation 3D, l'automatisation des tâches de production, l'intégration multi- supports, la base de données et toutes les technologies issues de XML [eXtensible Markup Language] vont s'ouvrir naturellement. Les éditeurs ont besoin de ces outils, soit pour mieux produire, soit pour mieux communiquer. C'est là que je vois l'évolution, ou plutôt l'intensification, de mon travail.» En mai 2009, Marc crée le site Indiscripts, laboratoire de scripts InDesign.
***