Introduction au format PDF
Toute personne qui se sert régulièrement d’un ordinateur a, au moins une fois, été amené à utiliser un document PDF… mais peut être que peu de ces mêmes personnes se doutent de la fabuleuse richesse que renferme et propose ce type de document.
Voyons voir déjà la définition qu’en donne l’encyclopédie Wikipedia. On constatera que de manière générale, les définitions qui nous sont proposées, sont PDF = Portable Document Format. C’est à dire, que le document est portable….
Il faut traduire par : il peut être lu de manière identique et conforme à la mise en page et la présentation qu’à souhaité son auteur, quelque soit la plate-forme sur laquelle l’utilisateur se trouve.
Attention, il faut entendre par plate-forme, l’environnement global de lecture, c’est à dire que cela comprend aussi bien, les divers navigateurs web (Safari, Internet Explorer, Firefox, Opera, Netscape…), que les multiples systèmes d’exploitation (Vista, XP, 2000, 98, OSX, OS9, OS2 Warp, Mandrake, Suze…. donc Mac, Windows, IBM, Linux….), que les différents supports matériels (ordinateur, PDA, autres…) …. bref, dès qu’on ouvre un document PDF, quelque soit le contexte, on voit toujours la même chose.
En fait, ceci ne représente que la partie émergée de l’iceberg. PDF propose bien plus que cela. C’est ce que nous allons essayer de découvrir tout au long de ce tutoriel qui se garde bien d’être exhaustif… je vous invite à faire part de vos suggestions afin de le compléter.
Préambule
Dans le début des années 90 la presse micro informatique titrait des premières pages du style : « Postcript vs PDF », ou encore « PDF sera t-il le nouveau standard du prépresse….? ».
InDesign commençait alors à pointer timidement sa version 1.0 face à l’indétrônable Xpress 3.31…. le prépresse ne connaissait ni ne se doutait de ce que le PDF pouvait être et allait pouvoir solutionner….
Comment fallait-il alors interpréter ces gros titres ? Fallait-il comprendre une lutte entre deux camps ou bien comprendre que ces deux éléments étaient complémentaires…. Afin d’y voir un peu plus clair, commençons déjà par dire que le Postscript est un langage et que le PDF est un format de fichier. Ceci dit, essayons de bien comprendre ce que représente et apporte chacun des deux.
Le langage Postscript
Le postcript n’est ni plus ni moins qu’un langage de description propre à la mise en page d’un document. Il est apparu au début des années 80 en proposant le Postscript Level 1. Depuis la fin des années 90, nous avons accès à un Postscript Level 3.
Afin d’être interprété, le Postscript nécessite à la fois une interprétation logicielle, et matérielle. c’est pour cela qu’on parle d’imprimante Postscript. Généralement, ces imprimantes utilisent un RIP, qui permet de transposer les lignes de code en une image bitmap imprimable.
Pour avoir une idée de ce à quoi ressemble le Postscript, il suffit de tracer quelques formes et du texte dans un logiciel vectoriel (Illustrator par exemple) et ensuite de sélectionner le menu Fichier > Imprimer. Vous devriez alors trouver dans le sélecteur d’imprimante, l’imprimante fichier Adobe Postscript qui vous permet de générer un fichier .ps (Postscript).
Exemple de présentation du langage Postscript
Afin d’illustrer cela, voici une très basique mise en page réalisée sous Illustrator. Deux formes, un effet d’ombre portée et un texte. Le tout est ensuite imprimé en utilisant l’imprimante « fichier Adobe Postscript » afin de générer un fichier .ps. Vous trouverez parmis les fichiers téléchargés les fichiers Vectoriel.ai et vectoriel.ps. Voici ci-dessous un extrait du code Postscript généré :
... %!PS-Adobe-3.1 %ADO_DSC_Encoding: Windows Roman %%Title: vectoriel.ai %%Creator: Adobe Graphics Manager %%For: Adobe %%CreationDate: 11/9/2006< %%BoundingBox: 184 279 411 563 %%HiResBoundingBox: 184.2243 279.2676 410.9958 562.7325 %%CropBox: 184.2243 279.2676 410.9958 562.7325 %%LanguageLevel: 3 ...
le format PDF
Donc, par rapport au Postscript et afin de résumer à l’essentiel, nous pouvons dire que le PDF est un format de fichier qui englobe tout un ensemble d’informations. L’information Postscript y est préservée, et se voit rejointe par l’ensemble des éléments nécessaires à l’affichage du document dans des conditions optimales : c’est à dire les polices de caractères utilisées, les images, les médias de type Flash, Quick time….
Toutefois, le format PDF ne s’arrête pas là, il encapsule également toute une série d’informations que l’on pourrait qualifier de PDF Mark, telles que des méta données (mots clés, auteur, description, dates…), des instructions d’impression, des informations sur la gestion de la couleur, des informations d’interactivités (liens, signets, articles, boutons, …), des éléments d’annotations, de formulaires, les réglages de création PDF (joboptions) etc…
Justement, au travers des prochaines pages de ce tutoriel, nous explorerons divers aspects du format PDF, notamment au niveau de la création d’index, ou de la mise en place de circuits de révisions, ou encore d’utilisation de formulaires…
On peut d’ores et déjà distinguer deux grandes orientations de format PDF, celui purement destiné à un flux de travail très orienté Pré-presse et celui plus orienté Internet et à la pluri-distribution d’informations.
Si vous souhaitez tout connaître sur le format PDF, vous pouvez directement consulter le PDF Reference, publié par Adobe Systems Incorporated, ou visiter l’historique du format, toujours sur le site de l’éditeur ou encore sur le remarquable site d’AbracadabraPDF.
Quelques articles Postscript et PDF
- Postscript vs PDF vu par Adobe
- PDF – Wikipedia
- PostScript – wikipedia
- Une référence en ligne – PDF Zone
- Une autre référence – Planet PDF
- Syndicat National des Industries de la communication Graphique et de l’imprimerie Française – SIGOGIF
L’import / export de datas avec des applications tierces
Comme nous le verrons et expérimenterons plus tard au cours de ce tutoriel, le format PDF permet de gérer des formulaires (et/ou des annotations). Pour être réellement exploitable, il est donc important qu’Acrobat puisse dialoguer avec des applications tierces, ou même plus simplement, puisse échanger des informations directement entre deux documents PDF.
Adobe a donc mis en place à cet effet un autre format de fichier, le FDF (Forms Datas Format) dédié à cette tâche. Ce format se décline sous deux aspects, soit le FDF à l’état brut , soit le XFDF qui est disons, le même format à la sauce XML.
Il est également possible de pouvoir exporter ce même contenu au format XML ou au format TXT…. Vous obtenez l’ensemble des ces possibilités depuis le menu Options Avancées > Formulaires > Exporter les données à partir d’un formulaire… Voici-ci dessous à quoi ressemble le contenu exporté en fonction de ces divers types de format.
Dans cet exemple, le formulaire contient un champ libellé Nom: et a pour contenu: Ernest Zitapolio. Vous trouverez en téléchargement les fichiers données.pdf, données.fdf, données.xfdf, données.xml et données.txt.
TXT
nom ernest zitapolio
XML
<?xml version="1.0" encoding="UTF-8"?> <fields> <nom>ernest zitapolio</nom> </fields>
FDF
%FDF-1.2 %âãÏÓ 1 0 obj<</FDF<</Fields[<</T(nom)/V(ernest zitapolio)>>]/ID[<3149522FD07725A7C96F4BC5FC63A3E3>]/F(form_01.pdf)>>>> endobj trailer <</Root 1 0 R>> %%EOF
XFDF
<?xml version="1.0" encoding="UTF-8"?> <xfdf xmlns="http://ns.adobe.com/xfdf/" xml:space="preserve"> <fields> <field name="nom"> <value>ernest zitapolio</value> </field> </fields> <ids original="3149522FD07725A7C96F4BC5FC63A3E3" modified="BF92191E61D6534F89344555EFF283FA"/> <f href="form_01.pdf"/> </xfdf>
Outils de développement
Afin d’en simplifier leur utilisation et surtout leur manipulation, il existe des outils pour développeurs, qui permettent de mettre en place et d’automatiser les process d’exportation ou d’importation pour ces types de fichiers.
Vous trouverez de plus amples informations sur leur site respectif FDFMerge Products et PowerMerge. Vous pouvez également utiliser le SDK fournis par Adobe et PHP pour mettre en place votre propre système de gestion.
Vous trouverez un manuel assez riche à cette adresse et des informations sur le SDK à celle ci. Enfin, un forum assez fourni qui va vous apporter une mine d’informations sur le sujet.
L’export global vers des applications tierces
Depuis Acrobat, les documents PDF peuvent être exportés vers quatre familles d’applicatifs au travers de divers formats de fichiers :
- les documents textuels (TXT, RTF, DOC),
- les documents images (TIFF, JPG, PNG),
- les documents qui préservent la couche Postscript (PDF, EPS),
- les documents structurés (HTML, XML).
De ce fait, il est donc très facile de pouvoir ‘dé-convertir’ un document PDF afin de le modifier, de le compléter, et ensuite de le re-transformer en document PDF.
Attention, lorsque vous convertissez un document PDF en document Word par exemple, le fait de quitter l’encapsulation PDF, vous désolidarise des liaisons avec les polices de caractères et une certaine approche de la mise en forme…
Il vous faudra donc installer au préalable sur votre système d’exploitation, les typos nécessaires (si elles ne le sont pas déjà), afin de préserver une continuité dans le respect de l’affichage du document et éventuellement revoir les positionnements de mise en forme.
Les divers standards du PDF
Au vu du nombre d’options et de paramétrages possibles pour générer du format PDF, diverses normes et standards ont été mis en place afin de garantir et certifier certains types de documents en fonction des objectifs de leur utilisation.
Qu’il s’agisse de documents dédiés à l’impression, à l’archivage, à destination du Web ou tout autre finalité, les standards se sont bien établis et permettent de s’assurer de la bonne conformité du document par rapport à son utilisation.
Vous trouverez sur le site de la société Quartet une multitude d’informations et d’outils sur les solutions que propose l’industrie du prépresse et de la chaine graphique, notamment avec les produits de Enfocus.
PDF/A
Il garantit une pérennité dans l’archivage des documents. A ce sujet, la société Seal System a développé une gamme d’outils permettant de générer des fichiers respectant cette norme gXconvert, ConvertWIZ et DPF4Convert ainsi qu’un outil de contrôle PDF checker. En savoir plus
PDF/X (PDF/X-1, PDF/X-2, PDF/X-3, PDF/X-Plus)
Cette série de normes permet de régler des standards d’échanges basés sur PDF pour l’industrie du prépresse et garanti ainsi la sécurité en terme de processus, tout au long de la chaine graphique. Vous trouverez une rapide démystification de ces diverses normes sur le site de SOSPDF .
Si vous préférez une analyse un peu plus détaillée, rapprochez vous du site de PdfXreport ou si vous recherchez un rapport très détaillé sur ces normes. Vous trouverez également un excellent article sur le site de newsplex, et enfin un incontournable rapport de l’IFRA sur le PDF/X-3.