Le livre, de l'imprimé au numérique
Chapter 7
Bruno Didier, webmestre de la bibliothèque de l'Institut Pasteur, écrit en août 1999: «Internet n'est une propriété ni nationale, ni linguistique. C'est un vecteur de culture, et le premier support de la culture, c'est la langue. Plus il y a de langues représentées dans leur diversité, plus il y aura de cultures sur internet. Je ne pense pas qu'il faille justement céder à la tentation systématique de traduire ses pages dans une langue plus ou moins universelle. Les échanges culturels passent par la volonté de se mettre à la portée de celui vers qui on souhaite aller. Et cet effort passe par l'appréhension de sa langue. Bien entendu c'est très utopique comme propos. Concrètement, lorsque je fais de la veille, je peste dès que je rencontre des sites norvégiens ou brésiliens sans un minimum d'anglais.»
Au cours de l'été 2000, les usagers non anglophones dépassent la barre des 50%. Ce pourcentage continue ensuite d'augmenter, comme le montrent les statistiques de la société Global Reach, mises à jour à intervalles réguliers. Le nombre d'usagers non anglophones est de 52,5% en été 2001, 57% en décembre 2001, 59,8% en avril 2002, 64,4% en septembre 2003 (dont 34,9% d'Européens non anglophones et 29,4% d'Asiatiques) et 64,2% en mars 2004 (dont 37,9% d'Européens non anglophones et 33% d'Asiatiques).
= Des dictionnaires de langues en ligne
# Le Grand dictionnaire terminologique
Le Grand dictionnaire terminologique (GDT) est une initiative majeure de l'Office québécois de la langue française (OQLF). C'est en effet la première fois qu'un organisme propose une base terminologique de cette taille en accès libre sur le web. Mis en ligne en septembre 2000, le GDT est précédé deux ans plus tôt par Le Signet, une base terminologique pour les technologies de l'information, dont les 10.000 fiches bilingues français-anglais sont également intégrées au GDT.
Le GDT est un dictionnaire bilingue français-anglais de 3 millions de termes appartenant au vocabulaire industriel, scientifique et commercial. Sa mise en ligne est le résultat d'un partenariat entre l'OQLF, auteur du dictionnaire, et Semantix, société spécialisée dans les solutions logicielles linguistiques. Événement célébré par de nombreux linguistes, cette mise en ligne est un succès. Dès le premier mois, le GDT est consulté par 1,3 million de personnes, avec des pointes de 60.000 requêtes quotidiennes. La gestion de la base est ensuite assurée par Convera Canada. En février 2003, les requêtes sont au nombre de 3,5 millions par mois. Une nouvelle version du GDT est mise en ligne en mars 2003. Sa gestion est désormais assurée par l'OQLF lui-même, et non plus par une société prestataire.
# Eurodicautom et IATE
Géré par les services de traduction de la Commission européenne, Eurodicautom est une base terminologique multilingue de termes économiques, scientifiques, techniques et juridiques qui permet de combiner entre elles les onze langues officielles de l'Union européenne (allemand, anglais, danois, espagnol, finnois, français, grec, hollandais, italien, portugais, suédois), ainsi que le latin, avec une moyenne de 120.000 consultations par jour en 2003.
Fin 2003, Eurodicautom annonce son intégration dans une base terminologique plus vaste regroupant les bases terminologiques de plusieurs institutions de l'Union européenne, notamment celle du Parlement européen et celle du Conseil de l'Union européenne. Cette nouvelle base traiterait non plus douze langues mais une vingtaine, du fait de l'élargissement prévu de l'Union européenne l'année suivante vers l'Europe de l'Est.
Un projet de base terminologique commune est évoqué dès 1999 afin de renforcer la coopération inter-institutionnelle. Les partenaires de ce projet sont le Parlement européen, le Conseil de l'Union européenne, la Commission européenne, la Cour de justice, la Cour des comptes européenne, le Comité économique et social européen, le Comité des régions, la Banque européenne d'investissement, la Banque centrale européenne et enfin le Centre de traduction des organes de l'Union européenne.
La nouvelle base terminologique voit le jour au printemps 2004 sous le nom de IATE (InterActive Terminology for Europe), d'abord pour un usage interne dans les institutions de l'Union européenne avant de migrer sur le web en juin 2007 en tant que service public, avec 1,4 million d'entrées dans les 23 langues officielles de l'Union européenne, plus le latin. L'Union européenne est en effet passée de 15 à 25 pays membres en mai 2004, pour atteindre 27 pays membres en janvier 2007, d'où la nécessité de 23 langues officielles au lieu des 11 langues officielles présentes dans Eurodicautom.
Le site web de IATE est administré par le Centre de traduction des organes de l'Union européenne à Luxembourg (capitale du pays du même nom), pour le compte des partenaires du projet. Comme expliqué dans la brochure mutilingue de IATE, «les termes sont introduits dans la base de données par les terminologues et les traducteurs de l'Union européenne sur la base des informations fournies par les traducteurs, les administrateurs, les juristes-linguistes, les experts et d'autres sources fiables.» En 2009, IATE comprend 8,4 millions de termes, dont 540.000 abréviations et 130.000 expressions.
# WordReference.com
Le site WordReference.com est lancé en 1999 par Michael Kellogg pour proposer des dictionnaires bilingues gratuits en ligne. En mars 2010, Michael relate sur son site: «L'internet a été un incroyable outil ces dernières années pour rassembler des gens du monde entier. L'un des principaux obstacles à cela reste bien entendu la langue. Le contenu de l'internet est pour une grande part en anglais et de très nombreux usagers lisent ces pages alors que l'anglais est leur deuxième langue et non leur langue maternelle. De par mes propres expériences avec la langue espagnole, je sais que de nombreux lecteurs comprennent une grande partie de ce qu'ils lisent, mais pas la totalité.
J'ai débuté ce site en 1999 pour procurer des dictionnaires bilingues gratuits en ligne et d'autres outils pour tous sur l'internet. Depuis, le site s'est progressivement développé pour devenir l'un des sites de dictionnaires en ligne les plus utilisés, et le principal dictionnaire en ligne pour les paires de langues anglais-espagnol, anglais-français, anglais-italien, espagnol-français et espagnol-portugais. Ce site est toujours classé sans interruption parmi les 500 sites les plus visités du web. Aujourd'hui, je suis heureux de continuer à améliorer ces dictionnaires, les autres outils linguistiques du site et les forums de langues. J'ai vraiment plaisir à créer de nouvelles fonctionnalités pour rendre ce site de plus en plus utile.»
Les dictionnaires les plus populaires sont le dictionnaire espagnol (espagnol-anglais et anglais-espagnol), le dictionnaire français et le dictionnaire italien. On trouve aussi un dictionnaire allemand, un dictionnaire russe et un dictionnaire monolingue anglais. Des tableaux de conjugaison sont disponibles pour l'espagnol, le français et l'italien.
Pour l'anglais, on trouve également des dictionnaires de l'anglais vers les langues suivantes: arabe, chinois, coréen, grec, japonais, polonais, portugais, roumain, tchèque et turc, et vice versa.
Pour l'espagnol, en plus des deux dictionnaires d'Espasa Calpe et d'Oxford complétés par le supplément propre à WordReference.com, on peut consulter un dictionnaire monolingue espagnol, un dictionnaire espagnol de synonymes, un dictionnaire espagnol-français et un dictionnaire espagnol-portugais.
Pour le français et l'italien, outre les dictionnaires d'Oxford, WordReference.com propose deux dictionnaires qui lui sont propres, à savoir un dictionnaire français-anglais de 250.000 termes et un dictionnaire italien-anglais de 200.000 termes.
WordReference.com offre également des forums linguistiques très actifs et de qualité. Si les gens ont une question sur un usage linguistique donné, ils peuvent faire une recherche dans les centaines de milliers de questions précédentes, avant de poser leur propre question dans l'un des forums si nécessaire, pour être aidés par des gens des quatre coins du monde.
WordReference Mini est une version miniature du site qui permet son intégration dans d'autres sites, par exemple des sites d'apprentissage de langues.
Une version pour appareil mobile est disponible pour plusieurs dictionnaires: anglais-espagnol, espagnol-anglais, anglais-français, français-anglais, anglais-italien, italien-anglais, avec d'autres paires de langues à venir.
LE COPYRIGHT REVISITÉ
[Résumé] Lancée en 2001 à l'initiative de Lawrence «Larry» Lessig, professeur de droit à la Stanford Law School, en Californie, la licence Creative Commons a pour but de favoriser la diffusion d'oeuvres numériques tout en protégeant le droit d'auteur. L'organisme du même nom propose des licences-type, qui sont des contrats flexibles de droit d'auteur compatibles avec une diffusion sur l'internet. Simplement rédigées, ces autorisations non exclusives permettent aux titulaires des droits d'autoriser le public à utiliser leurs créations tout en ayant la possibilité de restreindre les exploitations commerciales et les oeuvres dérivées. Finalisée en février 2007, la version 3.0 de la Creative Commons instaure une licence internationale et la compatibilité avec d'autres licences similaires, dont le copyleft et la GPL (General Public License).
= Droit d'auteur et internet
Si le débat relatif au droit d'auteur sur l'internet est vif à la fin des années 1990, Philippe Loubière, traducteur littéraire et dramatique, ramène ce débat aux vrais problèmes. «Ce débat me semble assez proche sur le fond de ce qu'il est dans les autres domaines où le droit d'auteur s'exerce, ou devrait s'exercer», écrit-il en mars 2001. «Le producteur est en position de force par rapport à l'auteur dans pratiquement tous les cas de figure. Les pirates, voire la simple diffusion libre, ne menacent vraiment directement que les producteurs. Les auteurs ne sont menacés que par ricochet. Il est possible que l'on puisse légiférer sur la question, au moins en France où les corporations se revendiquant de l'exception culturelle sont actives et résistent encore un peu aux Américains, mais le mal est plus profond. En effet, en France comme ailleurs, les auteurs étaient toujours les derniers et les plus mal payés avant l'apparition d'internet, on constate qu'ils continuent d'être les derniers et les plus mal payés depuis. Il me semble nécessaire que l'on règle d'abord la question du respect des droits d'auteur en amont d'internet.»
Pour nombre d'auteurs, le web est avant tout un espace public basé sur l'échange. Alain Bron, consultant en systèmes d'information et auteur de romans, écrit en novembre 1999: «Je considère aujourd'hui le web comme un domaine public. Cela veut dire que la notion de droit d'auteur sur ce média disparaît de facto: tout le monde peut reproduire tout le monde. La création s'expose donc à la copie immédiate si les copyrights ne sont pas déposés dans les formes usuelles et si les oeuvres sont exposées sans procédures de revenus.»
Jacques Gauchey, journaliste et spécialiste des technologies de l'information, exprime un avis différent. «Le droit d'auteur dans son contexte traditionnel n'existe plus», écrit-il en juillet 1999. «Les auteurs ont besoin de s'adapter à un nouveau paradigme, celui de la liberté totale du flot de l'information. Le contenu original est comme une empreinte digitale: il est incopiable. Il survivra et prospérera donc.»
Selon Xavier Malbreil, auteur multimédia interviewé en mars 2001, «il y a deux choses. Le web ne doit pas être un espace de non-droit, et c'est un principe qui doit s'appliquer à tout, et notamment au droit d'auteur. Toute utilisation commerciale d'une oeuvre doit ouvrir droit à rétribution. Mais également, le web est un lieu de partage. Échanger entre amis des passages d'un texte qui vous a plu, comme on peut recopier des passages d'un livre particulièrement apprécié, pour le faire aimer, cela ne peut faire que du bien aux oeuvres, et aux auteurs. La littérature souffre surtout de ne pas être diffusée. Tout ce qui peut concourir à la faire sortir de son ghetto sera positif.»
= Copyleft et Creative Commons
Des créateurs souhaitent respecter la vocation première du web, réseau de diffusion à l'échelon mondial. De ce fait, les adeptes de contrats flexibles - copyleft, GPL (General Public License) et Creative Commons - sont de plus en plus nombreux.
L'idée du copyleft est lancée dès 1984 par Richard Stallman, ingénieur en informatique et défenseur inlassable du mouvement Open Source au sein de la Free Software Foundation (FSF). Conçu à l'origine pour les logiciels, le copyleft est formalisé par la GPL (General Public License) et étendu par la suite à toute oeuvre de création. Il contient la déclaration normale du copyright affirmant le droit d'auteur, mais son originalité est de donner au lecteur le droit de librement redistribuer le document et de le modifier. Le lecteur s'engage toutefois à ne revendiquer ni le travail original, ni les changements effectués par d'autres personnes. De plus, tous les travaux dérivés de l'oeuvre originale sont eux-mêmes soumis au copyleft.
Lancée en 2001 à l'initiative de Lawrence «Larry» Lessig, professeur de droit à la Stanford Law School, en Californie, la licence Creative Commons a elle aussi pour but de favoriser la diffusion d'oeuvres numériques tout en protégeant le droit d'auteur. L'organisme du même nom propose des licences-type, qui sont des contrats flexibles de droit d'auteur compatibles avec une diffusion sur l'internet. Simplement rédigées, ces autorisations non exclusives permettent aux titulaires des droits d'autoriser le public à utiliser leurs créations tout en ayant la possibilité de restreindre les exploitations commerciales et les oeuvres dérivées. L'auteur peut par exemple choisir d'autoriser ou non la reproduction et la rediffusion de ses oeuvres. Ces contrats peuvent être utilisés pour tout type de création: texte, film, photo, musique, site web, etc. Finalisée en février 2007, la version 3.0 de la Creative Commons instaure une licence internationale et la compatibilité avec d'autres licences similaires, dont le copyleft et la GPL.
Qui utilise la licence Creative Commons? O'Reilly Media par exemple. Fondé par Tim O'Reilly en 1978, O'Reilly Media est un éditeur réputé de manuels informatiques et de livres sur les technologies de pointe. L'éditeur dispose d'abord d'une formule de «copyright ouvert» pour les auteurs qui le souhaitent ou pour des projets collectifs. A partir de 2003, il privilégie le Creative Commons Founders' Copyright permettant d'offrir des contrats flexibles de droit d'auteur à ceux qui veulent également diffuser leurs oeuvres sur le web.
La Public Library of Science (PLoS) utilise elle aussi la licence Creative Commons. Les articles de ses périodiques en ligne - qui sont des périodiques scientifiques et médicaux de haut niveau disponibles gratuitement - peuvent être librement diffusés et réutilisés ailleurs, y compris pour des traductions, la seule contrainte étant la mention des auteurs et de la source.
Une licence Creative Commons est utilisée pour un million d'oeuvres en 2003, 4,7 millions d'oeuvres en 2004, 20 millions d'oeuvres en 2005, 50 millions d'oeuvres en 2006, 90 millions d'oeuvres en 2007, 130 millions d'oeuvres en 2008 et 350 millions d'oeuvres en avril 2010.
= Domaine public et copyright
Chose inquiétante à l'heure d'une société dite de l'information, le domaine public se réduit comme peau de chagrin. À une époque qui n'est pas si lointaine, 50% des oeuvres appartenaient au domaine public, et pouvaient donc être librement utilisées par tous. D'ici 2100, 99% des oeuvres seraient régies par le droit d'auteur, avec un maigre 1% laissé au domaine public. Un problème épineux pour tous ceux qui gèrent des bibliothèques numériques, et qui affecte aussi bien le Projet Gutenberg que Google Books.
Si le Projet Gutenberg s'est donné pour mission de diffuser gratuitement par voie électronique le plus grand nombre possible d'oeuvres littéraires, sa tâche n'est guère facilitée par les coups de boutoir portés au domaine public. Michael Hart, son fondateur, se penche sur la question depuis plus de trente ans, avec l'aide d'un groupe d'avocats spécialisés dans le droit d'auteur.
Dans la section Copyright HowTo, le Projet Gutenberg détaille les calculs à faire pour déterminer si un titre publié aux États-Unis appartient ou non au domaine public. Les oeuvres publiées avant 1923 sont soumises au droit d'auteur pendant 75 ans à partir de leur date de publication (elles sont donc maintenant dans le domaine public). Les oeuvres publiées entre 1923 et 1977 sont soumises au droit d'auteur pendant 95 ans à partir de leur date de publication (rien ne tombera dans le domaine public avant 2019). Une oeuvre publiée en 1998 et les années suivantes est soumise au droit d'auteur pendant 70 ans à partir de la date du décès de l'auteur s'il s'agit d'un auteur personnel (rien dans le domaine public avant 2049), ou alors pendant 95 ans à partir de la date de publication - ou 120 ans à partir de la date de création - s'il s'agit d'un auteur collectif (rien dans le domaine public avant 2074). Tout ceci dans les grandes lignes, d'autres règles venant s'ajouter à ces règles de base.
Nettement plus contraignant que l'amendement précédent, qui datait de 1976, un nouvel amendement au copyright est entériné par le Congrès le 27 octobre 1998 pour contrer le formidable véhicule de diffusion qu'est l'internet. Au fil des siècles, chaque avancée technique est accompagnée d'un durcissement du copyright, qui semble être la réponse des éditeurs à un accès plus facile au savoir, et la peur afférente de perdre des royalties.
«Le copyright a été augmenté de 20 ans», explique Michael Hart en juillet 1999. «Auparavant on devait attendre 75 ans, on est maintenant passé à 95 ans. Bien avant, le copyright durait 28 ans (plus une extension de 28 ans si on la demandait avant l'expiration du délai) et, avant cela, le copyright durait 14 ans (plus une extension de 14 ans si on la demandait avant l'expiration du délai). Comme on le voit, on assiste à une dégradation régulière et constante du domaine public.»
Les instances politiques ne cessent de parler d'Âge de l'Information alors que, en parallèle, elles durcissent la réglementation relative à la mise à disposition de cette information. La contradiction est flagrante. Le copyright est passé d'une durée de 30 ans en moyenne en 1909 à une durée de 95 ans en moyenne en 1998. En 89 ans, de 1909 à 1998, le copyright a subi une extension de 65 ans qui affecte les trois quarts de la production du 20e siècle. Seul un livre publié avant 1923 peut être considéré avec certitude comme du domaine public.
Les dates évoquées par Michael sont les suivantes, comme expliqué en détail dans son blog:
(a) 1790 est la date de la main-mise de la Guilde des imprimeurs (les éditeurs de l'époque en Angleterre) sur les auteurs, ce qui entraîne la naissance du copyright. Le 1790 Copyright Act institue un copyright de 14 ans après la date de publication de l'oeuvre, plus une extension de 28 ans si celle-ci est demandée avant l'expiration du délai. Les oeuvres pouvant être légalement imprimées passent subitement de 6.000 à 600, et neuf titres sur dix disparaissent des librairies. Quelque 335 ans après les débuts de l'imprimerie, censée ouvrir les portes du savoir à tous, le monde du livre est désormais contrôlé par les éditeurs et non plus par les auteurs. Cette nouvelle législation est également effective en France et aux États-Unis.
(b) 1831 est la date d'un premier renforcement du copyright pour contrer la réédition de vastes collections du domaine public sur les nouvelles presses à vapeur. Le 1831 Copyright Act institue un copyright de 28 ans après la date de publication de l'oeuvre, plus une extension de 14 ans si celle-ci est demandée avant l'expiration du délai, à savoir un total de 42 ans.
(c) 1909 est la date d'un deuxième renforcement du copyright pour contrer une réédition des collections du domaine public sur les nouvelles presses électriques. Le 1909 Copyright Act double la période de l'extension, qui passe à 28 ans, le tout représentant un total de 56 ans.
(d) 1976 est la date d'un nouveau durcissement du copyright suite à l'apparition de la photocopieuse lancée par Xerox. Le 1976 Copyright Act institue un copyright de 50 ans après le décès de l'auteur. De ce fait, tout copyright en cours avant le 19 septembre 1962 n'expire pas avant le 31 décembre 1976.
(e) 1998 est la date d'un durcissement supplémentaire du copyright suite au développement rapide des technologies numériques et aux centaines de milliers d'oeuvres désormais disponibles sur CD-ROM et DVD et sur le web, gratuitement ou à un prix très bas. Le 1998 Copyright Act allonge la durée du copyright qui est désormais de 70 ans après le décès de l'auteur, pour protéger l'empire Disney (raison pour laquelle on parle souvent de Mickey Mouse Copyright Act) et nombre de multinationales culturelles.
Un durcissement similaire touche les pays de l'Union européenne. La règle générale est désormais un copyright de 70 ans après le décès de l'auteur, alors qu'il était auparavant de 50 ans, suite aux pressions exercées par les éditeurs de contenu sous le prétexte d'«harmoniser» les lois nationales régissant le droit d'auteur pour répondre à la mondialisation du marché.
A ceci s'ajoute la législation sur le copyright des éditions numériques en application des traités internationaux de l'OMPI (Organisation mondiale de la propriété intellectuelle). Ces traités sont signés en 1996 dans l'optique de contrôler la gestion des droits numériques. Le Digital Millenium Copyright Act (DMCA) est entériné en octobre 1998 aux États-Unis.
La directive EUCD (European Union Copyright Directive) est entérinée en mai 2001 par la Communauté européenne. Cette directive s'intitule très précisément «Directive 2001/29/EC du Parlement européen et du Conseil sur l'harmonisation de certains aspects du droit d'auteur et des droits voisins dans la société de l'information». Elle fait suite à la directive de février 1993 (Directive 93/98/EEC) qui visait à harmoniser les législations des différents pays en matière de protection du droit d'auteur. La directive EUCD entre peu à peu en vigueur dans tous les pays de l'Union européenne, avec mise en place de législations nationales, le but officiel étant de renforcer le respect du droit d'auteur sur l'internet et de contrer ainsi le piratage. En France, par exemple, la loi DADVSI (Droit d'auteur et droits voisins dans la société de l'information) est promulguée en août 2006, et n'est pas sans susciter de nombreux remous.
UNE VASTE ENCYCLOPÉDIE
[Résumé] En 2002, le MIT (Massachusetts Institute of Technology) décide de publier le contenu de ses cours en ligne, avec accès libre et gratuit, en privilégiant la diffusion libre du savoir. Le MIT OpenCourseWare (MIT OCW) offre en accès libre le matériel d'enseignement de nombreux cours, à savoir des textes de conférences, des travaux pratiques, des exercices et corrigés, des bibliographies, des documents audio et vidéo, etc. Parallèlement, la Public Library of Science (PLoS) met sur pied des revues scientifiques et médicales en ligne de haut niveau diffusées gratuitement. Pour les encyclopédies, Wikipédia ouvre la voie en 2001, en lançant une encyclopédie écrite collectivement, avec possibilité de corriger et de compléter les articles, et dont le contenu est librement réutilisable. Suivent d'autres encyclopédies collaboratives en accès libre comme Citizendium et l'Encyclopedia of Life.
= Vers un savoir numérique