Le livre numérique, objet technologique

Avant le livre numérique …

Un livre peut-il être numérique ?

La question est toujours latente, le livre imprimé étant dans l’esprit de beaucoup la seule forme possible d’ouvrage optimisé pour une lecture concentrée. 

Lorsque Michael Hart, considéré comme le créateur de la notion de livre électronique, a créé le projet Gutenberg en 1971, un opérateur devait transcrire au kilomètre le texte d’un ouvrage imprimé, sur un éditeur de texte basique, en majuscules ASCII. On ne pouvait parler que de livre numérisé. Livres numérisés également les facsimilés obtenus par scan de manuscrits, utilisés principalement pour des besoins d’étude et d’archivage.

L’idée de M. Hart était dès le départ de permettre la diffusion la plus large de la littérature sous forme numérique, mais il a fallu 20 ans et l’apparition du Web (1991) pour rendre cette idée réalisable. L’essor des technologies de reconnaissance de caractères a alors permis d’accélérer le processus, et donc le volume d’ouvrages numérisés.  

Mais rapidement les choses ont évolué : grâce aux traitements de texte, et en particulier via l’omniprésence de Word (Microsoft), les manuscrits sont devenus originellement numériques. Les chaines de traitement des éditeurs sont également devenues totalement numériques, et le livre – imprimé ou non – est devenu le résultat d’un « formatage » réalisé sur un manuscrit numérique.

Nous pouvons ainsi dire que le livre numérique non seulement existe, mais précède l’imprimé dans la chaîne de création. Et pourtant, la très grande majorité des livres numériques sont des facsimilés de leurs équivalents imprimés ; on parle de livres homothétiques. Et la minorité restante est souvent qualifiée de livre « augmenté ».  

Cette séparation en deux groupes nous paraît limitée, et nous allons voir que la typologie des livres numériques est plus riche que cela. 

Le livre homothétique

Le livre homothétique imite au plus près l’apparence du codex imprimé, avec ses notions de pages, de marge et de typographie. 

Le format le plus représentatif de ce type de publication est PDF (1993), démocratisé grâce au développement parallèle d’un logiciel de création (Adobe Acrobat, puis Adobe InDesign) et d’un logiciel de lecture (Acrobat Reader). 

Le format PDF a été le premier standard de diffusion de livres numériques ; bien qu’il soit encore largement utilisé pour la diffusion de livres numériques, il est maintenant mis hors-jeu par le format EPUB, comme nous allons le voir maintenant. 

Le livre fluide (« recomposable »), EPUB 

Autour de l’an 2000, il est apparu important de séparer contenu et présentation afin de gérer un contenu unique, pouvant être diffusé dans plusieurs formats. Il était logique à partir de 1998 d’utiliser pour cela le système de balisage XML. Le premier format numérique basé sur XML s’appelait Open eBook et était contrôlé par l’Open eBook Forum. 

Il a été suivi en 2005 par le format EPUB (Electronic PUBlication), basé sur le langage HTML sous sa forme structurée XML – soit XHTML – qui rapproche les technologies du livre de celles du Web et consacre l’idée du livre « fluide » (reflowable). 

En effet un EPUB fluide s’adapte à l’écran utilisé, comme le fait une page Web, là où une page PDF demande une surface de lecture équivalent à celle d’une page de livre imprimé. Ce point est devenu crucial avec l’avènement d’écrans de taille très variable, du smartphone à l’écran de PC.

La version actuelle d’EPUB est la version 3, et elle mérite qu’on s’y attarde. Un livre au format EPUB 3 est composé de ressources (fichiers) XHTML. Toutes les balises du langage HTML5 peuvent être utilisées pour structurer une ressource : les paragraphes, listes, tables bien entendu, mais aussi le balisage interne des phrases (mise en avant, citation), les hyperliens bien sûr, les images, les clips audio et vidéo, les formules mathématiques …

Les effets de styles, sont gérés par des feuilles de style CSS, sans limitation hors celles éventuelles des logiciels de lecture EPUB. Et enfin il est possible d’ajouter du code javascript au contenu. 

Cela implique que les spécialistes de la mise en page de livres électroniques doivent essentiellement connaître les technologies du Web, et peuvent utiliser les outils du Web. 

Ces ressources sont ordonnées et décrites par un ensemble de fichiers XML. Le tout est stocké dans un fichier Zip.

L’évolution du format EPUB est maintenant entre les mains du consortium W3C (World Wide Web). 

Codex ou rouleau ?

Vous le savez, une page Web n’est pas paginée : c’est un petit rouleau en fait, on scrolle pour découvrir son contenu. 

Logiquement, la lecture des EPUB devrait s’effectuer en naviguant vers une ressource HTML grâce à une table des matières, puis en déroulant cette page. Certains logiciels de lecture EPUB permettent cela, et même d’aligner les ressources les unes sous les autres pour constituer un long rouleau (ou volumen). 

Mais les lecteurs assidus aiment tourner des pages (pour des raisons d’ergonomie qui dépassent l’objet de cet article). Et donc les logiciels de lecture émulent une pagination, forcément basée sur le contenu affichable à l’écran. Le lecteur passe d’un écran à l’autre par des gestes discontinus, comme on tournerait des pages. 

Or l’on passerait des heures à décrire les difficultés que provoque le besoin de tronçonner des pages Web. 

Pour la mise en page d’abord : au vu des technologies disponibles, il est impossible pour un logiciel de lecture d’optimiser la présentation du contenu d’un écran. Des espaces vides apparaissent car une image est déplacée dans l’écran suivant, les veuves et orphelines foisonnent, etc. 

Pour les designers de livres ensuite, car certaines structures HTML ne sont pas compatibles avec cette découpe par écran. 

Pour les lecteurs enfin, puisque la notion de numéro de page est totalement déconstruite. Suivant la taille de l’écran, la taille de la police et une infinité d’autres paramètres, un morceau de texte ne sera pas à la même « page » pour deux lecteurs différents. 

Si les lecteurs n’étaient pas aussi crispés sur la notion de page, les livres numériques n’en seraient que plus lisibles. 

Des centaines de milliers d’heures de développement sont consacrées à trouver des contournements à ce problème. Une importante partie des développements libres au sein du projet Readium y est consacrée. 

EPUB fluide ou pré-paginé ?

L’EPUB 3 fluide est donc excellent pour une lecture pratique, en particulier sur liseuse et smartphone. Cependant de nombreux livres perdent de leur valeur s’ils ne sont pas présentés de manière homothétique. On peut citer en particulier les bandes dessinées, les livres pour enfants, les livres d’art, des livres de cuisine et livres scolaires actuels.  

Les concepteurs du format EPUB 3 ont donc créé une variante non fluide, donc pré-paginée, très similaire à ce qu’offre PDF. Plusieurs outils de conception permettent de générer des publications EPUB 3 pré-paginées, dont Adobe InDesign.  

Au japon, des millions de manga sont diffusés sous ce format. En France, on trouve des BD franco-belges, des mangas et des livres pour enfants au format EPUB 3 fixed layout.

Comme le format PDF, le format EPUB pré-paginé impose au lecteur de zoomer l’image sur un petit écran pour rendre les textes lisibles.  Il serait intéressant de travailler sur un livre pré-paginé mais pourtant malléable (responsive), mais ce format reste à inventer.

Accessibilité

L’un des gros avantages de la séparation du contenu et de sa présentation est la possibilité pour l’utilisateur d’agir finement sur cette présentation. Et c’est justement ce qu’offre le format EPUB. Cette facilité à agir sur la présentation est clé pour permettre un accès à la lecture au 1,7 million de français porteurs de déficiences visuelles, ainsi qu’aux 6 millions de français atteints de dyslexie.   

Du point de vue du contenu, rendre accessible une publication EPUB fluide n’est pas très compliqué, surtout si le problème est pris en amont, au moment de la création des structures XHTML. Transformer une masse de documents mal structurés (par exemple un stock d’anciens livres numériques des années 2010) en livres accessibles est par contre beaucoup plus compliqué et onéreux. Rendre accessible un EPUB pré-paginé est également complexe si l’on ne dispose pas d’un logiciel bien adapté ; or Adobe InDesign n’a pas été conçu pour générer facilement accessibles les EPUB exportés de l’outil.

Du point de vue logiciel de lecture, un navigateur Web ne permet pas de gérer très finement la présentation des textes à l’écran. Tout au plus peut-on afficher un « lecteur Zen », qui supprimer toute mise en page, et zoomer le texte de la page.  

Un bon logiciel de lecture EPUB permet d’aller beaucoup plus loin dans la personnalisation de l’expérience de lecture : il est en effet possible d’afficher deux pages côte à côte, à la façon d’un livre ouvert, de passer en mode nuit (voire gérer des thèmes d’affichage personnalisés), de changer la police d’affichage, gérer la taille de la police, l’espacement des paragraphes, des lignes, des mots voire des lettres, les marges, ou supprimer la justification.

Or, ces possibilités aident énormément les personnes malvoyantes ou dyslexiques à lire correctement. Ces personnes apprécient également la possibilité d’écouter le texte ; soit un mot seulement, qu’un enfant dyslexique a du mal à lire, soit un texte complet. Une voix humaine synchronisée avec le texte est encore préférable, ce qui est possible avec le format EPUB, grâce à la technique des media overlay.  C’est pourquoi un logiciel de lecture accessible intègre des fonctionnalités de vocalisation (text-to-speech) et supporte les EPUB 3 media overlays

Une personne aveugle possède généralement un logiciel nommé lecteur d’écran, qui lui apporte des possibilités de navigation fine dans le texte au clavier et une voix qu’il a choisi. De tels logiciels existent sous Windows (NVDA et Jaws), sous iOS (Voice Over) et sous Android (Talkback). Un logiciel de lecture accessible doit donc également être compatible avec ces lecteurs d’écran.

Développer un logiciel de lecture accessible est en particulier complexe, et peu d’applications parviennent à relever ces défis. Dans ce cadre, EDRLab est fier d’offrir Thorium Reader aux lecteurs du monde entier, une application pour ordinateur sous Windows, Mac et Linux, dont l’accessibilité est l’un des nombreux avantages. 

L’accessibilité est un défi auquel le format EPUB3 permet de répondre bien mieux que le format PDF. Mais le format ne fait pas tout : il faut des éditeurs sachant rendre leurs livres numériques accessibles, des logiciels de lecture accessibles, des sites de libraires et des bibliothèques numériques accessibles. C’est donc un défi auquel il faut que l’ensemble de l’industrie du livre réponde avant 2025, date de démarrage pratique de la Directive Accessibilité Européenne. 

Le livre augmenté

Le livre augmenté correspond à un livre enrichi de ressources audio et vidéo, d’animations et d’interactions. Ce sont jusqu’à présent généralement des EPUB pré-paginés, souvent des livres pour enfants.

Malheureusement, ces ouvrages très technologiques et chers à produire sont difficilement compatibles avec l’ensemble des lecteurs EPUB du marché. Le gros problème est ici que de nombreux logiciels de lecture EPUB ne sont pas construits sur un moteur de navigation Web récent, et ne peuvent donc pas exploiter toutes les possibilités du format EPUB 3. De plus, certaines plateformes de diffusion contraignent les caractéristiques des livres numériques qu’ils distribuent, en limitant par exemple la taille des images ou en interdisant les interactions sous forme de code javascript. Les concepteurs de livres augmentés visent donc généralement une seule plateforme, souvent celle d’Apple, ce qui limite forcément leur succès.

Le livre augmenté ne pourra donc percer que si l’interopérabilité des moyens de production et des plateformes de distribution et de lecture s’améliore très nettement. 

Dans le cadre des bandes dessinées numériques, le format EPUB lui-même montre ses limites : impossible de diffuser des webtoons avec ce format, de réaliser des transitions entre images, de gérer facilement des calques. Afin de dépasser ces limites, EDRLab incube actuellement un format spécialisé nommé Divina, qui permet de représenter de manière optimisée de nombreux types de narrations visuelles numériques. 

Le livre en ligne

Le livre en ligne est essentiellement un ouvrage long (long form), lisible en ligne dans un navigateur Web. 

Les lecteurs de livres en ligne attendent les mêmes fonctionnalités que s’ils lisaient dans un logiciel de lecture classique, donc une pagination, des réglages fins de présentation du texte, la pose de signets etc. Rien de cela n’est nativement disponible dans un navigateur Web et il est donc nécessaire de développer des applications Web compatibles avec les différents navigateurs du marché, ce qui est complexe et donc onéreux. 

Aucun standard de diffusion de livres en ligne n’a percé (même si des membres du W3C ont travaillé sur le sujet des Web Publications), ce type de publication ne peut pas être protégé par un verrou numérique solide et la mise en ligne entraine des problèmes de protection de données privées difficiles à résoudre. En conséquence, la lecture en ligne est actuellement réservée majoritairement à la lecture d’extraits, à l’analyse automatique des usages et à des opérations ponctuelles de communication éditeur. 

Le livre audio

Le livre audio doit également être considéré comme un livre. Pour l’instant c’est pourtant un peu moins qu’un livre, puisque les livres audio du marché ne disposent ni de couverture ni de table des matières, et que les logiciels de lecture de livre audio ne permettent pas la pose de signets ni l’annotation. 

Des membres du W3C ont créé un format standard qui permet de structurer et diffuser des livres audio, mais ce standard (W3C Audiobooks + LPF) est nouveau, peu connu, et n’a pas encore rencontré de succès jusqu’ici. 

Le prêt en bibliothèque

De nombreuses médiathèques proposent aujourd’hui le prêt de livres numériques. Le prêt numérique tente de s’approcher au mieux du prêt classique, avec une limite temporelle, la possibilité d’étendre cette limite et la possibilité de rendre un livre avant d’avoir atteint la limite de temps. 

Pour intégrer ces notions dans un monde numérique, il faut faire appel à un système qui « rende » le livre une fois le prêt expiré. Ce système est un verrou numérique, une DRM. La DRM la plus fréquemment utilisée depuis 2010 pour ce faire a été mise au point par Adobe, sous le nom Adept ou ACS. Il s’avère qu’elle est anti-ergonomique, pose des problèmes d’accessibilité, de données privées, et est maintenant obsolète. 

EDRLab a travaillé dès sa création (2016) à créer une solution alternative et meilleure, ce qui a été réalisé dès 2017. Cette solution s’appelle LCP, c’est maintenant un standard international ISO et la solution s’étend actuellement dans le monde, parmi les bibliothèques publiques et les libraires en ligne.  

Readium

Pour réaliser tous ces projets, EDRLab a décidé d’opérer au sein d’une communauté existante, l’initiative open-source Readium. Une initiative soutenue par différents groupes d’édition français, et constituée d’une petite communauté très active de développeurs de logiciels de lecture EPUB. 

EDRLab est particulièrement actif au sein de cette initiative, qui prend la forme d’une suite de projets open-source facilitant le développement de logiciels de lecture sur différentes plateformes technologiques :

  • Readium Mobile, pour iOS et Android
  • Readium Desktop, pour Windows, Mac et Linux
  • Readium Web, pour Chrome, Firefox, Safari et Opera 
  • Readium LCP, pour toutes les plateformes gérées par Readium.

On compte maintenant une cinquantaine d’applications de lecture développées sur la base des kits de développement Readium. Toutes ces applications disposent de fonctionnalités avancées et offrent un traitement identique des contenus EPUB, améliorant ainsi mécaniquement l’interopérabilité de l’écosystème EPUB. 

 Conclusion

Comme nous avons pu le voir, le livre numérique est un objet hautement technologique, qui prend de nombreuses formes, fluide ou pré-paginé, simple ou augmenté, textuel, audio ou visuel, téléchargeable ou en ligne, diffusé librement, vendu ou prêté.

Les enjeux d’interopérabilité restent élevés dans le domaine du livre numérique, et de grosses évolutions sont encore à réaliser pour permettre à tout ouvrage au format EPUB d’être lisible à travers tout logiciel de lecture EPUB.

Le format EPUB flirte avec le Web, mais est retenu de s’y fondre par le manque d’évolution de certains logiciels de lecture, par l’attachement des lecteurs à la notion de page et par les limites de la lecture profonde sur le Web. 

Enfin, la qualité principale d’un livre numérique n’est sans doute pas d’être augmenté, puisque trop d’effets numériques n’apportent pas au lecteur la concentration qu’il recherche dans un livre, mais bien d’êtretoujours disponible et inclusif.  

Close