Part 2

Chapter 23,671 wordsPublic domain

Mosaic est le premier navigateur destiné au grand public. Développé par le NSCA (National Center for Supercomputing Applications) à l'Université de l'Illinois (États-Unis) et distribué gratuitement en novembre 1993, il contribue largement au développement rapide du web. Début 1994, une partie de l'équipe de Mosaic émigre dans la Netscape Communications Corporation pour développer un nouveau logiciel sous le nom de Netscape Navigator. En 1995, Microsoft lance son propre navigateur, l'Internet Explorer. Viennent ensuite d'autres navigateurs, comme Opera ou Safari, le navigateur d'Apple.

Un consortium industriel international est fondé en octobre 1994 pour développer les protocoles communs du web, sous le nom de World Wide Consortium (W3C) et sous l'égide de Tim Berners-Lee. En 1997, une section Internationalization / Localization regroupe les protocoles utilisés pour créer un site web multilingue: HTML (HyperText Markup Language), jeux (de base) de caractères, nouveaux attributs, HTTP (HyperText Transfer Protocol), négociation de la langue, URL (Uniform Resource Locator) et autres identificateurs incluant des caractères non ASCII, conseils divers.

# Le rêve de Tim Berners-Lee

À la question de Pierre Ruetschi, journaliste à la Tribune de Genève, quotidien suisse: «Sept ans plus tard, êtes-vous satisfait de la façon dont le web a évolué?», Tim Berners-Lee répond en décembre 1997 que, s'il est heureux de la richesse et de la variété de l'information disponible, le web n'a pas encore la puissance prévue dans sa conception d'origine. Il aimerait «que le web soit plus interactif, que les gens puissent créer de l'information ensemble», et pas seulement consommer celle qui leur est proposée. Le web doit devenir «un média de collaboration, un monde de connaissance que nous partageons».

Dans un essai publié en avril 1998 sur sa propre page web (sur le site du World Wide Web Consortium), Tim Berners-Lee explique que «le rêve derrière le web est un espace d'information commun dans lequel nous communiquons en partageant l'information. Son universalité est essentielle, à savoir le fait qu'un lien hypertexte puisse pointer sur quoi que ce soit, quelque chose de personnel, de local ou de global, aussi bien une ébauche qu'une réalisation très sophistiquée. Deuxième partie de ce rêve, le web deviendrait d'une utilisation tellement courante qu'il serait un miroir réaliste (sinon la principale incarnation) de la manière dont nous travaillons, jouons et nouons des relations sociales. Une fois que ces interactions seraient en ligne, nous pourrions utiliser nos ordinateurs pour nous aider à les analyser, donner un sens à ce que nous faisons, et voir comment chacun trouve sa place et comment nous pouvons mieux travailler ensemble.» (extrait de «The World Wide Web: a very short personal history»)

# Le web 2.0

Selon Netcraft, société spécialisée dans les mesures d'audience, le nombre de sites web passe d'un million de sites en avril 1997 à dix millions de sites en février 2000, 20 millions de sites en septembre 2000, 30 millions de sites en juillet 2001, 40 millions de sites en avril 2003, 50 millions de sites en mai 2004, 60 millions de sites en mars 2005, 70 millions de sites en août 2005, 80 millions de sites en avril 2006, 90 millions de sites en août 2006 et 100 millions de sites en novembre 2006, une augmentation rapide qui s'explique par l'explosion des sites personnels et des blogs.

Le web 2.0, termé lancé en 2004 par Tim O'Reilly, éditeur de livres informatiques, apporte peut-être un début de réponse au rêve de Tim Berners-Lee puisqu'il est basé sur les notions de communauté et de partage.

Quinze ans après la création du web, le magazine Wired constate dans son numéro d'août 2005 que «moins de la moitié du web est commercial, le reste fonctionne avec la passion». Quant à l'internet, d'après le quotidien Le Monde du 19 août 2005, «ses trois pouvoirs - l'ubiquité, la variété et l'interactivité - rendent son potentiel d'usages quasi infini».

Robert Beard, professeur de langues et créateur du site A Web of Online Dictionaries en 1995, écrivait de manière prémonitoire dès septembre 1998: «Le web sera une encyclopédie du monde faite par le monde pour le monde. Il n'y aura plus d'informations ni de connaissances utiles qui ne soient pas disponibles, si bien que l'obstacle principal à la compréhension internationale et interpersonnelle et au développement personnel et institutionnel sera levé. Il faudrait une imagination plus débordante que la mienne pour prédire l'effet de ce développement sur l'humanité.»

1991 > L'UNICODE, SYSTÈME D'ENCODAGE UNIVERSEL

[Résumé] L'ASCII, premier système d'encodage datant des débuts de l'informatique, n'est plus suffisant avec l'internationalisation de l'internet, d'où l'intérêt de l'Unicode, nouveau système d'encodage universel, dont la première version est publiée en janvier 1991. L'Unicode spécifie un nombre sur 16 bits unique à chaque caractère (ou idéogramme) et lisible quels que soient la plateforme, le logiciel et la langue utilisés. L'Unicode peut traiter 65.000 caractères et prendre en compte tous les systèmes d'écriture de la planète. Il devient une composante des spécifications du World Wide Web Consortium (W3C), l'organisme international chargé du développement du web. L'utilisation de l'Unicode se généralise à partir de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII. L'Unicode supplante définitivement l'ASCII en décembre 2007.

***

L'ASCII n'est plus suffisant avec l'internationalisation de l'internet, d'où l'intérêt de l'Unicode, nouveau système d'encodage universel, dont la première version est publiée en janvier 1991.

Contrairement à l'ASCII conçu pour l'anglais (et le latin), avec des variantes pour quelques langues supplémentaires, l'Unicode prend en compte toutes les langues de la planète.

# De l'ASCII à l'Unicode

Pour mémoire, le premier système d'encodage informatique est l'ASCII (American Standard Code for Information Interchange), publié en 1963 aux États-Unis par l'American National Standards Institute (ANSI) pour encoder des informations en anglais.

Mais le multilinguisme devient bientôt une nécessité vitale. Des variantes de l'ASCII prennent en compte d'autres langues à partir de 1986. Avec le développement de l'internet, l'échange des données s'internationalise de plus en plus, si bien qu'il n'est plus possible de se limiter à un système d'encodage datant des débuts de l'informatique, même avec ses variantes.

Publié pour la première fois en janvier 1991, l'Unicode est un système d'encodage universel sur 16 bits spécifiant un nombre unique pour chaque caractère (ou idéogramme). Ce nombre est lisible quels que soient la plateforme, le logiciel et la langue utilisés. L'Unicode peut traiter 65.000 caractères uniques et prendre en compte tous les systèmes d'écriture de la planète. À la grande satisfaction des linguistes, il remplace progressivement l'ASCII, avec des variantes UTF-8, UTF-16 et UTF-32 (UTF: Unicode Transformation Format) selon le nombre de bits utilisés pour l'encodage.

L'Unicode est maintenu par l'Unicode Consortium. Il devient une composante des spécifications du World Wide Web Consortium (W3C), fondé en octobre 1994 pour promouvoir le développement du web. L'utilisation de l'Unicode se généralise à partir de 1998, par exemple pour les fichiers texte sous plateforme Windows (Windows NT, Windows 2000, Windows XP et versions suivantes), qui étaient jusque-là en ASCII.

# Une tâche énorme

Mais la tâche s'annonce rude. Patrick Rebollar, professeur de français et de littérature française au Japon et modérateur de la liste de diffusion LITOR (Littérature et ordinateur), précise en janvier 2000: «Il s'agit d'abord d'un problème logiciel. Comme on le voit avec Netscape ou Internet Explorer, la possibilité d'affichage multilingue existe. La compatibilité entre ces logiciels et les autres (de la suite Office de Microsoft, par exemple) n'est cependant pas acquise. L'adoption de la table Unicode devrait résoudre une grande partie des problèmes, mais il faut pour cela réécrire la plupart des logiciels, ce à quoi les producteurs de logiciels rechignent du fait de la dépense, pour une rentabilité qui n'est pas évidente car ces logiciels entièrement multilingues intéressent moins de clients que les logiciels de navigation.»

Luc Dall'Armellina, co-auteur et webmestre d'oVosite, un espace d'écriture hypermédia, écrit en juin 2000: «Les systèmes d'exploitation se dotent peu à peu des kits de langues et bientôt peut-être de polices de caractères Unicode à même de représenter toutes les langues du monde; reste que chaque application, du traitement de texte au navigateur web, emboîte ce pas. Les difficultés sont immenses: notre clavier avec ses ± 250 touches avoue ses manques dès lors qu'il faille saisir des Katakana ou Hiragana japonais, pire encore avec la langue chinoise. La grande variété des systèmes d'écriture de par le monde et le nombre de leurs signes font barrage. Mais les écueils culturels ne sont pas moins importants, liés aux codes et modalités de représentation propres à chaque culture ou ethnie.» Un sentiment prémonitoire puisque l'Unicode ne supplantera l'ASCII qu'en décembre 2007.

1992 > DES RÉPERTOIRES DE TEXTES ÉLECTRONIQUES

[Résumé] Les premiers textes électroniques sont recensés dans les Etext Archives, répertoire créé en 1992 par Paul Southworth, et dans l'E- Zine-List, liste créée en 1993 par John Labovitz. Les premiers titres purement électroniques sont des textes courts de tous ordres, souvent politiques au début, auxquels succèdent les e-zines (electronic zines), rédigés par une personne ou un petit groupe sur des sujets souvent culturels, sans publicité ni profit commercial. Les Etext Archives sont créées en 1992 par Paul Southworth, et hébergées sur le site web de l'Université du Michigan (États-Unis). Elles sont "un lieu d'accueil pour les textes électroniques de tout genre", sans juger de leur contenu. L'E-Zine-List est créée en été 1993 par John Labovitz. En cinq ans, de 1993 à 1998, les quelques dizaines d'e-zines deviennent plusieurs centaines (3.045 e-zines recensés en novembre 1998). Le champ de l'e-zine s'élargit pour recouvrir tout type de publication publiée par voie électronique.

***

Les premiers textes électroniques sont recensés dans les Etext Archives, répertoire créé en 1992 par Paul Southworth, et dans l'E- Zine-List, liste créée en 1993 par John Labovitz.

Les premiers titres purement électroniques sont des textes courts de tous ordres, souvent politiques au début. Viennent ensuite les e-zines (zines électroniques), rédigés par une personne ou un petit groupe sur des sujets souvent culturels.

Qu'est-ce exactement qu'un zine? John explique sur le site: «Pour ceux d'entre vous qui ne connaissent pas le monde du zine, "zine" est l'abrégé de "fanzine" ou "magazine" selon votre point de vue. Les zines sont en général l'oeuvre d'une personne ou d'un petit groupe, souvent rédigée pour le plaisir ou pour des raisons personnelles, et sont le plus souvent irrévérencieux, bizarres et/ou ésotériques. Les zines ne sont pas des publications grand public - le plus souvent ils ne contiennent pas de publicité (sauf parfois des publicités pour d'autres zines), ils ne sont pas dirigés vers une audience de masse et ils ne visent pas un profit commercial. Un "e-zine" est un zine qui est distribué en partie ou uniquement sur des réseaux électroniques tels que l'internet.»

# Les Etext Archives

Les Etext Archives sont créées en 1992 par Paul Southworth, et hébergées par le site web de l'Université du Michigan (États-Unis). Elles sont «un lieu d'accueil pour les textes électroniques de tout genre, du sacré au profane, et du politique au personnel», sans juger de leur contenu.

Cinq ans plus tard, elles comportent six sections: (a) une section «E- zines», qui regroupe des textes électroniques périodiques qui vont du professionnel au personnel; (b) une section «Politics», qui regroupe des zines politiques, des essais et des pages de groupes politiques; (c) une section «Fiction», qui regroupe des publications d'auteurs amateurs; (d) une section «Religion», qui regroupe des textes religieux grand public ou non; (e) une section «Poetry», qui est un mélange éclectique de poésie surtout amateur; et enfin (f) une section «Quartz», qui comprend les archives auparavant hébergées à quartz.rutgers.edu.

Comme indiqué à l'époque sur le site, "le web venait de débuter [en 1992], le gopher était la nouvelle technologie de pointe et le FTP était encore le protocole standard d'extraction de l'information pour la grande majorité des utilisateurs. L'origine du projet a incité de nombreuses personnes à l'associer avec l'Université du Michigan, bien qu'il n'ait existé aucune relation officielle et que le projet soit entièrement le fait du travail des volontaires et de dons personnels. Le matériel est la propriété exclusive des responsables du projet. Le projet a été lancé en réponse à l'absence d'archivage organisé de documents politiques, de périodiques et de discussions diffusées par le biais de Usenet sur des newsgroups tels que alt.activism, misc.activism.progressive et alt.society.anarchy. Le groupe alt.politics.radical-left a rejoint le projet plus tard et il était aussi une source importante de documents et de contributeurs réguliers. Peu de temps après, les zines électroniques (e-zines) ont débuté leur prolifération rapide sur l'internet, et il était clair que ces publications souffraient de la même absence de collecte coordonnée et de préservation, sans parler du fait que la frontière était floue entre les e-zines (qui à l'époque était surtout liés au hacking, au phreaking et à l'anarchisme internet) et les documents politiques présents sur l'internet, si bien que la plupart des e-zines étaient en phase avec l'objectif original des Etext Archives. Une chose en amenant une autre, des e-zines de toutes sortes - dont de nombreux titres sur divers sujets culturels non liés à la politique - ont fini par envahir nos archives en volume significatif."

# L'E-Zine-List

L'E-Zine-List est créée en été 1993 par John Labovitz pour recenser les e-zines circulant dans le monde entier et accessibles par FTP (File Transfer Protocol), gopher (système d'information à base de menus textuels à plusieurs niveaux), courriel, le web ou d'autres services. La liste est actualisée une fois par mois.

Comment l'E-Zine-List débute-t-elle? Dans l'historique présent sur le site, John relate qu'à l'origine son intention est de faire connaître Crash, un zine imprimé dont il souhaite proposer une version électronique. À la recherche de répertoires, il ne trouve que le groupe de discussion alt.zines et des archives comme The Well et les Etext Archives. Lui vient alors l'idée d'un répertoire organisé. Il débute avec douze titres classés manuellement sur un traitement de texte. Puis il écrit sa propre base de données.

En cinq ans, de 1993 à 1998, les quelques dizaines d'e-zines deviennent plusieurs centaines, et la signification même d'e-zine s'élargit pour recouvrir tout type de publication publiée par voie électronique, même si, selon John, «il subsiste toujours un groupe original et indépendant désormais minoritaire qui continue de publier suivant son coeur ou de repousser les frontières de ce que nous appelons un zine.» L'E-Zine- List recense 3.045 titres en novembre 1998. John poursuit encore la liste pendant quelques années avant de passer le relais à d'autres.

1993 > L'ONLINE BOOKS PAGE, LISTE DE LIVRES EN LIGNE

[Résumé] Alors que certains numérisent les oeuvres littéraires du domaine public, comme le Projet Gutenberg et des projets connexes, d'autres se donnent pour tâche de répertorier celles qui sont en accès libre sur le web, en offrant au lecteur un point d'accès commun. C'est le cas de John Mark Ockerbloom, doctorant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, États-Unis), qui crée l'Online Books Page en janvier 1993 afin de recenser les livres anglophones du domaine public en accès libre sur le web. En 1999, il rejoint l'Université de Pennsylvanie pour travailler à la R&D (recherche et développement) de la bibliothèque numérique. À la même époque, il y transfère l'Online Books Page tout en gardant la même présentation, très sobre, et tout en poursuivant son travail d'inventaire dans le même esprit. Ce répertoire recense 12.000 titres en 1999, 20.000 titres en 2003 (dont 4.000 titres publiés par des femmes), 25.000 titres en 2006, 30.000 titres en 2007 (dont 7.000 titres du Projet Gutenberg) et 35.000 titres en 2010.

***

L'Online Books Page est une page web créée en janvier 1993 pour recenser les livres anglophones du domaine public en accès libre sur le web.

Alors que certains numérisent les oeuvres littéraires du domaine public, comme le Projet Gutenberg et des projets connexes, d'autres se donnent pour tâche de répertorier celles qui sont en accès libre sur le web, en offrant au lecteur un point d'accès commun. C'est le cas de John Mark Ockerbloom, doctorant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, États-Unis), auteur de l'Online Books Page.

Cinq ans plus tard, en septembre 1998, John Mark relate: «J'étais webmestre ici pour la section informatique de la CMU [Carnegie Mellon University], et j'ai débuté notre site local en 1993. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l'origine l'Online Books Page était l'une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des versions web de certains textes du Projet Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d'autres sites. J'ai remarqué que de nombreux sites (et pas seulement le Projet Gutenberg ou Wiretap) proposaient des livres en ligne, et qu'il serait utile d'en avoir une liste complète qui permette de télécharger ou de lire des livres où qu'ils soient sur l'internet. C'est ainsi que mon index a débuté.

J'ai quitté mes fonctions de webmestre en 1996, mais j'ai gardé la gestion de l'Online Books Page, parce qu'entre temps je m'étais passionné pour l'énorme potentiel qu'a l'internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j'ai du mal à rester à jour. Je pense pourtant poursuivre cette activité d'une manière ou d'une autre. Je suis très intéressé par le développement de l'internet en tant que médium de communication de masse dans les prochaines années. J'aimerais aussi rester impliqué dans la mise à disposition gratuite de livres sur l'internet, que ceci fasse partie intégrante de mon activité professionnelle, ou que ceci soit une activité bénévole menée sur mon temps libre.»

En 1998, un index de 7.000 livres en ligne est disponible par auteur, par titre et par sujet. On trouve aussi une liste de répertoires et d'archives de textes en ligne, tout comme une liste de répertoires de publications périodiques (magazines, journaux, revues, périodiques scientifiques).

Fin 1998, John Mark obtient son doctorat en informatique. En 1999, il rejoint l'Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique. À la même époque, il y transfère l'Online Books Page tout en gardant la même présentation, très sobre, et tout en poursuivant son travail d'inventaire dans le même esprit. Ce répertoire recense 12.000 titres en 1999, 20.000 titres en 2003 (dont 4.000 titres publiés par des femmes), 25.000 titres en 2006, 30.000 titres en 2007 (dont 7.000 titres du Projet Gutenberg) et 35.000 titres en 2010.

1993 > LE FORMAT PDF, LANCÉ PAR ADOBE

[Résumé] La société Adobe lance en juin 1993 le format PDF (Portable Document Format), l'Acrobat Reader (gratuit, pour lire les PDF) et l'Adobe Acrobat (payant, pour créer des PDF). Le but du format PDF est de figer les documents numériques dans une présentation donnée, pour conserver la présentation originale du document source, quelle que soit la plateforme utilisée pour le créer et pour le lire. Au fil des ans, le format PDF devient un standard de diffusion des documents électroniques. L'Acrobat Reader est progressivement disponible dans plusieurs langues, pour diverses plateformes (Windows, Mac, Linux) et pour divers supports (ordinateur, PDA, smartphone). En mai 2003, l'Acrobat Reader (5e version) fusionne avec l'Acrobat eBook Reader (2e version) pour devenir l'Adobe Reader, qui débute à la version 6 et qui permet de lire aussi bien les fichiers PDF standard que les fichiers PDF sécurisés des livres numériques sous droits. De format propriétaire, le format PDF devient un standard ouvert en juillet 2008, tout comme une norme ISO (ISO 32000-1:2008).

***

De la côte californienne, la société Adobe lance en juin 1993 le format PDF (Portable Document Format), tout comme l'Acrobat Reader (gratuit, pour lire les PDF) et l'Adobe Acrobat (payant, pour créer des PDF).

# Un standard de diffusion

Le but du format PDF est de figer les documents numériques dans une présentation donnée, pour conserver la présentation originale du document source, quelle que soit la plateforme utilisée pour le créer et pour le lire. Au fil des ans, le format PDF devient un standard de diffusion des documents électroniques. L'Acrobat Reader est progressivement disponible dans plusieurs langues et pour diverses plateformes (Windows, Mac, Linux).

Adobe annonce en août 2000 l'acquisition de la société Glassbook, spécialisée dans les logiciels de distribution de livres numériques à l'intention des éditeurs, libraires, diffuseurs et bibliothèques. À la même date, Adobe passe un partenariat avec les grandes librairies en ligne Amazon.com et Barnes & Noble.com pour que celles-ci proposent des titres lisibles sur l'Acrobat Reader et le Glassbook Reader dans leur eBookStore, lancé en août 2000 par Barnes & Noble et en novembre 2000 par Amazon.

# Deux nouveaux logiciels

En janvier 2001, Adobe lance deux nouveaux logiciels.

Le premier logiciel, gratuit, est l'Acrobat eBook Reader, qui permet de lire les fichiers PDF de livres numériques sous droits, avec gestion des droits par l'Adobe Content Server. Le logiciel permet d'ajouter des notes et des signets, de choisir l'orientation de lecture des livres (paysage ou portrait), ou encore de visualiser leur couverture dans une bibliothèque personnelle. Il utilise la technique d'affichage CoolType et comporte un dictionnaire intégré.

Le deuxième logiciel, payant, est l'Adobe Content Server, destiné aux éditeurs et distributeurs. Il s'agit d'un logiciel serveur de contenu assurant le conditionnement, la protection, la distribution et la vente sécurisée de livres numériques au format PDF. Ce système de gestion des droits numériques (ou système DRM: Digital Rights Management) permet de contrôler l'accès aux livres numériques sous droits, et donc de gérer les droits d'un livre selon les consignes données par le gestionnaire des droits, qui est souvent l'éditeur, par exemple en autorisant ou non l'impression ou le prêt. L'Adobe Content Server sera remplacé par l'Adobe LiveCycle Policy Server en novembre 2004.

En avril 2001, Adobe passe un deuxième partenariat avec Amazon, qui met en vente 2.000 livres numériques lisibles sur l'Acrobat eBook Reader: titres de grands éditeurs, guides de voyages, livres pour enfants, etc.

L'Acrobat Reader s'enrichit d'une version PDA, disponible pour le Palm Pilot en mai 2001 puis pour le Pocket PC en décembre 2001, puisque le public commence à lire sur PDA, suscitant l'inquiétude de certains professionnels du livre (et de certains ophtalmologues) qui trouvent que l'écran est vraiment trop petit, alors que les adeptes de la lecture sur PDA tentent de les convaincre du contraire.

# L'Adobe Reader