Temps de lecture : 7 minutes

Pourquoi revenir à Word façon 1990 ?

On en parle parfois, on l’oublie souvent, la souris, les interfaces graphiques et … les éditeurs Wysiwyg (What You See Is What You Get – un éditeur de mise en forme standard, Word par exemple) datent des années 60 et 70.

  • Premier prototype de la souris ? 1963.
  • Première tentative d’utiliser un éditeur Wysiwyg, 1974…

La recherche de ces technologies et faire évoluer a souvent eu lieu dans les laboratoires de Xerox, à Palo Alto.
Comme l’informatique était souvent une affaire de spécialistes derrière de très grosses machines, ces technologies n’ont vu le jour que lorsque les ordinateurs personnels sont devenus légions.

Dès lors, il fallait utiliser des outils plus simples à appréhender que des lignes de code et des cartes perforées.
En conséquence, qui rédige encore sa lettre sur une machine à écrire ? C’est difficile, il faut s’y reprendre à plusieurs fois, bref, le traitement de texte est infiniment plus pratique.

On s’approche toujours plus de ce qui est simple pour nous, humains, rendant notre smartphone convivial, notre GPS vocal, et notre réfrigérateur semi-autonome.
Grosse puissance de calcul et simplification d’usage pour l’utilisateur sont la clé de voûte de l’informatique omniprésente.

Une écriture médiévale

Dans ce cas, pourquoi diantre utiliser un code qui semble « médiéval » pour rédiger un document. Est-ce que cet article a été rédigé ainsi?

Bien sûr que non, c’est un éditeur convivial qui me le permet.

SGML, XML, XHTML et DITA

Pourtant, si demain je souhaite extraire la moelle de ce texte formidable (hum), je risque rapidement de me retrouver bloqué.

Certes, il va m’être possible de retrouver sa date de publication, son auteur, ce qu’on y retrouve entre les principaux titres. Mais comment faire pour retrouver l’information qui y est noyée, et comment savoir si j’ai déjà écrit cela de manière plus ou moins identique ? Soit je fais appel à quelque outil qui va comparer des phrases, rechercher des portions de texte, soit je relis mes écrits.

C’est ce que la plupart d’entre nous font si nous souhaitons reprendre une lettre pour une correspondance : « À l’attention de la société abc, je souhaite résilier mon abonnement ».
Pour une lettre du quotidien, cela reste envisageable. Pour le support de cours universitaire qui aura pris des heures de préparation, nettement moins.
Pour le 100e manuel du 100e produit, encore moins.
Et si je parle des documents des 10 dernières années soumis à relectures, améliorations et validations diverses pour un département, là… c’est une autre paire de manches.

Comment retrouver une éguille dans 100 bottes de foins ?

Nous sommes partis, à des fins de mise en forme, de balises peu agréables à des outils qui permettent de faire cela visuellement.

Et si je décidais maintenant d’utiliser ce même type de balise pour me permettre de retrouver des informations dans mon texte ? De le structurer ?

Je n’inventerai strictement rien, et IBM a même regroupé cela avec « Darwin Information Typing Architecture » (DITA).

Exemple concret, ce qui m’intéresse maintenant, c’est de pouvoir retrouver un couple de serrage parmi des milliers de pages dans 2 ans.

Je n’ai pas besoin (pour mon exemple) d’avoir une jolie mise en forme. Aucun besoin non plus de savoir si ma page sera en A4 ou format Letter. Tout ce qui m’intéresse c’est d’identifier une information et d’autres et de les retrouver.
Et bien je vais utiliser mes balises. Voilà, 12 N.m ou [COUPLESERRAGE]12 N.m[/COUPLESERRAGE].

Cela ne sera pas esthétique dans mon document et j’aurai vraiment l’impression de revenir à de très vieilles façons de procéder. Si je reste cohérent et que depuis maintenant tous mes couples de serrage sont notés ainsi, je retrouverais mon information. En ajoutant bien entendu quelques informations de plus 12 N.m, etc.

Voilà pourquoi utiliser de si « vieilles » façons de faire.

DITA

Les ténors et monsieur tout le monde

Vous vous en doutez, comme cette réflexion ne date pas d’hier, on peut faire différemment. XML (eXtensible Markup Language) est là pour me le rappeler. Plusieurs normes de formats en sont les héritiers : DITA brièvement évoqué, et HTML bien entendu.

Si je désire un document bien présenté et bien structuré, je peux donc me tourner vers DITA et en apprendre la syntaxe et les règles – un ténor.

Mais je n’en ai pas une folle envie à l’instant. J’ai plutôt envie d’en comprendre les règles de « classement » et « d’identification » et de les appliquer à quelque chose de plus facile à aborder. Et puisque chaque jour des milliers de contenus sont rédigés ainsi dans des éditeurs simples et intuitifs (Wysiwyg), je choisis XHTML – Monsieur tout le monde.

XHML pour eXtensible Hypertext Markup Language. C’est ce que n’importe quel navigateur pourra interpréter et mettre en forme nativement. Mieux, avec une bonne feuille de style pour une présentation soignée, je peux créer des contenus imprimables.

dita docbook, les ténors

On mix et on met au four

En me creusant – pas beaucoup – la tête, je me dis alors qu’il me faut « mixer » XHMTL (pour sa mise en forme) et des notions de DITA.

Par exemple, de manière très réductrice :

<div class="article">
<p class="information">[...]</p>

<ul class="process">
<li>[...]&lt;<strong>span</strong> class="<strong>coupleserrage</strong>"&gt;12 N.m<!--<strong-->span&gt;</li>
</ul>
</div>

Si j’introduis cela dans mon flux de texte, aucun changement dans ma mise en page. Et j’ai toutes mes informations !

J’ai clairement triché et pour que mon contenu soit pérenne, il me faudra plus que cela, c’est pour l’exemple.
SPAN en XHTML n’a aucune valeur en soi (sémantique) dans un contenu. Et CLASS indique la référence à un élément de formatage par exemple (.information sera en gras et en bleu, quelque chose comme ça).

Par contre, si je transmets ceci à un « parseur », un système automatisé qui va convertir mon petit exemple j’obtiendrai :

<task id="...">
<title>[..]</title>
<taskbody>
<prereq>[..]</prereq>
<info>[...]</info>
<steps>
<step>
<cmd>[...]<torque>12 N.m</torque>
<stepresult>[...]</stepresult>
</step>
</steps>
</taskbody>
</task>

Je sens que je vous ai perdu.
Donc je résume : j’utilise un éditeur tout à fait standard, j’ajoute mes informations utiles (le couple), je passe à la moulinette et j’obtiens un savant contenu qu’un système automatisé m’aidera à réutiliser, modifier, retrouver.

C’est un morceau du puzzle pour retrouver mon information facilement dans deux ans et la réutiliser.

Vers l’infini et au delà !

Cela ouvre sur des outils très intéressants – pas nécessairement nouveaux – que sont les parseurs et les feuilles de transformations.

Si vous avez pu lire cet article :

1. merci,

2. j’espère que vous avez saisi mon idée de base : une solution tout terrain pour un problème du quotidien,

3. au plaisir de vous parler un peu plus de la séparation contenue / mise en forme !