Pourquoi j’ai sauté dans la marmite XML il y a 15 ans

Once upon a time, je développais pour l’AFP un système de réception de photos de presse par satellite, destiné à injecter ces photos dans les systèmes rédactionnels des journaux. Les informations qui accompagnaient les photos – titre, légende, fournisseur, date et lieu de prise de vue etc. – étaient insérées au sein des flux JPEG dans des structures binaires alors assez classiques, du type illustré ci-dessous :

IIM tags

 

La spécification du format IIM  de l’IPTC (organisme de standardisation du monde de la presse) était assez claire, et pourtant les implémentations différaient sur certains détails. Du coup la machine d’Associated Press recevait mal les photos AFP et  les développeurs du système FotoWare souffraient pour recevoir l’ensemble des productions des agences de presse. Le format IPTC souffrait de gros problèmes d’interopérabilité, et aucun juge de paix n’existait pour mettre tout le monde d’accord.

Pour compliquer encore le problème, les dépêches d’agence étaient à l’époque transmises dans des formats différents, en particulier dans le format IPTC 7901 qui utilisait comme séparateurs de champs des caractères ésotériques tels que SOH, STX, ETX ou EOT (jeu pour vieil informaticien, retrouvez les codes ascii  correspondant). Là aussi, interprétations subtilement différentes des spécifications et donc problèmes d’interopérabilité : un véritable casse-tête pour tous les développeurs de plateformes d’échange d’information de presse, alors qu’approchait l’avènement de l’information multimédia.

C’est alors qu’en 1998, XML (eXtensible Markup Language) fit son apparition.  XML, un système de balisage qui permet d’échanger, traiter et stocker des informations structurées ou partiellement structurées ; un standard du Web qui permet de gérer des données dans toutes les langues possible grâce au support natif d’Unicode ; un format d »échange qui intègre un juge de paix pour les échanges, puisqu’un parser XML vérifie que les données reçues sont bien formées, voire valides par rapport à un schéma, avant d’accepter de les traiter ; un langage accompagné d’une collection d’outils de traitement (XSLT, DOM, SAX en particulier) très efficaces et souvent gratuits.

Très rapidement, les chefs de projets qui comme moi s’étaient arraché les cheveux sur les transmissions de photos et de texte se sont mis à  travailler au support d’XML dans les plateformes d’échange de données du monde de la presse. Le résultat de ce travail, nommé NewsML, fut standardisé par l’IPTC en 2000 ; je faisais partie du groupe de travail consacré à ce sujet, avant de piloter le développement de la seconde génération de ce standard en 2007.

Et je nage dans la marmite XML depuis ce moment là.

 

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

Commentaires protégés par WP-SpamShield pour WordPress