![]() |
|
|
|
|
|
|
RÉSEAUX74 > 2002 > N°13 Septembre 2002 >
Formats de fichiers - Partie 2
Formats de fichiers : Attention danger ! "Le format idéal serait un format connu, échangeable et lisible par tous, garantis-sant la mise en page de la version impri-mée. De plus, ce format devrait permettre de générer d’autres formats comme le HTML, le RTF ou le PDF, sans autre saisie. Ce format existe, ou plutôt ces formats existent, car plusieurs permettent d’at-teindre les objectifs cités ci-dessus. Ces formats s’appellent sgml, tex, xml ou doc-book. Eux-mêmes et les outils pour les créer relèvent des logiciels libres. A suivre..." Ainsi se terminait l’article paru dans le numéro précédent sous le titre "Formats de fichier, attention danger". En voici donc la suite annoncée.
TABLEAU RÉCAPITULATIFCommençons tout d’abord par un petit tableau récapitulatif : pour chacun des formats que nous avions vus, vous trouverez ci-dessous ses caractéristiques comme son extension, qui en est en charge, son ojectif d’utilisation.
Il faut introduire un nouveau format dans ce tour d’horizon, celui concernant l’impression. Ce format, le PostScript, est dédié aux sorties papier des imprimantes (voire même des photocomposeuses). Il est reconnu, puissant, et surtout il est lui aussi ouvert : on en connait les spécifications, qui sont publiées (un énorme manuel de référence technique), développées et maintenues par la société Adobe. Les fichiers PostScript ont des noms se terminant en .ps et sont utilisés par le monde professionnel de l’édition : la qualité obtenue est élevée. C’est aussi un format très souvent rencontré dans le monde du logiciel libre. Comme écrit en introduction, nous allons nous intéresser aux solutions et outils permettant d’obtenir en une seule saisie les 5 versions indiquées ci-dessus, PostScript, HTML, PDF, RTF et TXT. UNE NOUVELLE APPROCHE DU DOCUMENTSi on prend un document, il est possible d’en distinguer trois composants :
Ces trois composants sont fortement liés : les propos sont développés selon un plan qui les met en valeur et avec une présentation particulière. Cette présentation est normalement cohérente dans tout le document : les informations de même nature (les titres, les sous-titres, les citations, etc.) sont toujours présentées de la même façon (gras pour les uns, italique, décalage pour les autres, etc.). Regardez cet article pour le constater ! Habituellement, on travaille sur les trois composants en même temps : on tape le texte, on crée le plan (en numérotant par exemple) et on met en forme (en mettant en gras par exemple). Or ce travail de mise en forme est répétitif et pourrait très bien être automatisé. N’oublions pas que la définition du mot informatique fait état du traitement automatique de l’information par des logiciels. Ainsi, une nouvelle approche consiste à indiquer explicitement la nature des informations. Le logiciel s’occupe alors de mettre en forme correctement, de numéroter les parties ou les listes, etc. Prenons un exemple pour illustrer le plus clairement possible l’intérêt de cette approche. Dans l’article que vous lisez, il y a des titres de parties, qui sont toujours en bleu. Je n’ai pas mis en bleu, mais j’ai indiqué où se situe le début et la fin de ces titres. A cette nature "titre", a été associée une mise en forme gras. Et cela pour tout le document, en une seule fois. Mais notez qu’une autre mise en forme peut être choisie, qui va alors affecter aussi tout le document en un seul changement d’association ! Il en va de même des numérotations des chapitres, des numéros dans une liste, des citations en italique (ou en autre chose). En fait, on sépare le fonds de la forme. Vous ne vous occupez que du contenu et de sa hiérarchie (le plan). La mise en forme découlera de la nature des informations. Certains d’entre vous penseront sans doute aux relectures qu’ils ont faites pour s’assurer que leurs titres, les titres d’ouvrages cités, les numéros, avaient toujours la même présentation, faite à la main à chaque fois... Avec cette approche, vous en aurez la garantie absolue sans le faire à la main (si vous n’avez pas oublié d’indiquer la nature de l’information !). Certains d’entre vous se diront que ce qui est décrit s’appelle des feuilles de style, utilisées dans les logiciels de traitement de texte. C’est exact, mais ces feuilles de style sont propres au logiciel utilisé et ne sont pas à un format ouvert et connu. On en revient au même problème que celui des formats de fichiers propriétaires. APRÈS LA THÉORIE, LA PRATIQUE !Avec cette nouvelle approche à l’esprit, comment la mettre en pratique ? Cela est possible au travers de 4 formats principalement, qui utilisent le principe des balises : l’information est encadrée à son début et à sa fin par des balises qui sont explicites. Les formats Le SGML (Standard Generalized Markup Language) Le XML avec DTD libre Le XML avec DTD DocBook TeX et LaTeX Les outils Pour écrire en SGML, en XML libre, en DocBook, en TeX/ LaTeX, voici des outils disponibles en logiciel libre (donc entre autres gratuits et pas seulement en version pour Linux). Les éditeurs de texte LyX TeXmacs OpenOffice.org En espérant que ce tour d’horizon vous en aura ouvert de nouveaux, bon travail ! Copyright © 2002 Thierry STOEHR.
|
|
||||||||||||||||||||||||||||||||
| Copyright
© 2005 Centre
de Ressources Informatiques de Haute-Savoie
- webmaster@thematic74.fr
Site web entièrement basé sur SPIP, logiciel libre de gestion de contenu collaborative. |