Les métadonnées
Qu’est ce qu’une méta donnée ?
Une donnée de la donnée… certes mais encore ?
Prenons l’exemple du mot orange, nous pensons de suite au fruit, et pourquoi pense-t-on au fruit ?… hmmm… et bien en voyant l’image d’illustration de cet article on pense qu’il doit s’agir du fruit… mais il est vrai que si nous sommes mal-voyant, ou que si nous sommes un moteur d’indexation… rien ne nous indique qu’il s’agit du fruit…
Il pourrait tout aussi bien s’agir, entre autres, de la couleur orange, de l’opérateur téléphonique Orange, du fleuve Orange, (le plus long fleuve d’Afrique du Sud), mais il pourrait aussi bien s’agir du compté d’Orange au sud-est de Los Angeles, du peintre Maurice Orange ou encore de la ville d’Orange au Nord d’Avignon. À ce sujet, voir l’article Taxonomie, Thésaurus et vocabulaire contrôlé.
… bref les possibilités en manquent pas!
Alors, afin de pouvoir définir avec précision le contenu de nos pages, nous allons avoir recours à ce que l’on appelle des métadonnées. Les métadonnées, ce sont des informations qui vont être associées de manière structurelle, et surtout sémantique, pour chaque élément. Nous pourrions dire qu’une métadonnée est une source d’information complémentaire à la partie visible de l’information, qui sert à décrire l’élément concerné, comme son nom, sa famille, sa nature, sa largeur, sa source, sa taille…
Nous verrons plus tard, que les métadonnées peuvent également informer sur la structure même de cet élément et son rôle au sein de la page; comme par exemple indiquer s’il s’agit d’une illustration, d’un complément d’information, de la photo d’une personne, du logo d’une entreprise, d’un élément interactif, etc…
En résumé
Une méta donnée peut donc définir avec précision une description d’un élément à savoir, que dans notre cas, il s’agit d’une image qui représente un fruit, plus précisément une orange de couleur orange, qui est le fruit de l’oranger et qui peut se consommer sous forme de jus ou directement par quartiers en tant que fruit.
Les métas données peuvent également s’étendre sur la source de la donnée, comme qui est l’auteur de cette image, quelle est sa date de création, son titre éventuel, quelque chose comme: Photo prise sur le marché d’Apt le 31 juillet 2004, auteur Birnou Sébarte… ou photo récupérée sur Pixabay sur le compte de Logga Wiggler, crée le 4 novembre 2011 et mise à disposition le 28 avril 2012
De manière automatique, et dans le cas d’une photographie, les appareils de prises de vue associent automatiquement d’autres types de métadonnée, comme celles relatives à la technique utilisée pour réaliser l’image : Appareil Photo Nikon E995, Focale F4/1, Temps d’exposition 1/98 secondes, Vitesse ISO-100, Longueur de focale 22 mm, etc…
Comment utiliser les métadonnées?
Tout va dépendre de l’utilisation, des programmes utilisés et des besoins. En ce qui nous concerne nous ne nous focaliserons uniquement que sur le gestion des fichiers lors des projets et la partie web de nos contenus lors de la publication en ligne.
Au niveau des fichiers, il existe divers supports qui ne sont pas standards, comme par exemple le format XMP de Adobe qui s’intègre dans la plupart des applications du Creative Cloud et notamment sur Bridge. Si vous utilisez Bridge, cela permet de rapidement travailler, classer, organiser, répartir tout type de fichiers aussi images, que XLS, DOC, PDF… et bien d’autres formats.
Adobe Bridge
Comme le décrit Adobe son éditeur, Adobe Bridge est un gestionnaire de supports visuel, à la fois performant et convivial, qui facilite le classement, l’exploration, la localisation et la visualisation des ressources de création.
Ce logiciel permet d’accéder aux fichiers, applications et paramètres des projets, ainsi qu’aux fonctions de balisage et de recherche de métadonnées XMP.
Cet explorateur permet de parcourir l’ensemble des fichiers de son disque dur, tout en visualisant un aperçu d’un grand nombre de format (images, PDF, données tablulées, textes…), ainsi que l’ensemble des métadonnées liées à ce fichier.
L’onglet Métadonnées de l’application, permet d’accéder directement (lecture et écriture) à des données comme IPTC, DICOM, EXIF…
Du côté du web, les outils sont nombreux
Il existe divers outils pour insérer des métadonnées dans les contenus à destination du web. Générallement ces données se placent au niveau de la structure HTML sous forme de balises ou d’attributs, qui viennent compléter et enrichir la structure du document.
Nous distinguerons quelques familles de métadonnées;
- Balises <meta>
- Microformats
- Microdatas
- RDFa Lite
- JSON for Linking Data
- WebFinger
- Aria Roles Model et States and properties
La famille Aria est une famille particulière qui est spécifiquement dédié à l’accéssibilité des documents web et permet grâce aux attributs rôle de définir le rôle des éléments au sein de a page et les attributs d’états et propriétés permettent de préciser l’états de chaque éléments comme visible, invisible, obligatoire, coché, décoché, et bien d’autres encore.
Les outils s’appuient sur des vocabulaires (ou ontologie)
Les outils sans vocabulaire seraient vite limités, donc la plupart des outils s’appuient sur des vocabulaires. Mais tous les outils et tous les vocabulaires ne sont pas forcément compatibles. Nous dirons que l’outil correspond à la mécanique de mise en place de la métadonnée au sein du document et le vocabulaire permet de décrire l’élément par des propriétés.
Afin de mieux illustrer ce concept, prenons un exemple tout simple au travers de l’outil balise <meta>. Les balises <meta> permettent de décrire le document HTML et s’emploie au travers d’une paire d’attributs en corélation, l’attribut name qui permet de définir la propriété ciblée et l’attribut content qui précise la valeur attribuée.
<meta name="author" content="Birnou">
Sans trop entrer dans le détail, une fois les quelques propriétés name utilisées, on sera vite à cour de vocabulaire… et donc on pourra faire appel à d’autres vocabulaire que celui proposé nativement par le w3c et s’appuyer sur des alternatives compatibles comme le Dublin Core, ou encore l’Open Graph protocol
<meta name="DC:title" content="Les métadonnées"> <meta name="og:title" content="Les métadonnées">
Parmi les vocabulaires les plus fréquemment rencontrés nous avons donc
- Dublin Core
- Open Graph protocol
- FOAF
- Schema.org
- Accommodation Ontology Language Reference
- Used Cars Ontology Language Reference
- Interval Vocabulary
Aller plus loin
Vous trouverez un canevas de réflexion sur les métadonnées sur le site de Wikipédia. Un autre point de départ est le remarquable site de Patrick Pecatte, cela vous permettra d’approfondir l’utilisation des méta données, et l’avenir du web sémantique.
S’il n’existe pas de thésauri sur le domaine du site que vous développez, pensez à mettre en place une base de données de terminologies, que vous pourrez utiliser comme méta données pour vos pages.
Pensez également à soumettre cette question aux utilisateurs futurs du site. Qui mieux qu’eux pourra définir les mots clés utilisés pour définir le site et son contenu ?
Par ailleurs, si vous mettez en place un index de recherche sur un vocabulaire spécifique, vous pourrez saisir des métas données décrivant le contenu d’une page, sans pour cela que ces même mots soient utilisés dans la page.
Par exemple, vous pourriez très bien alimenter un index de vocabulaire incluant les mots cabot, cleps, alors que la page n’utilisera que le mot chien, … par contre, les internautes pourront saisir les mots de l’index dans le moteur de recherche interne du site, qui pointera vers la page.
1 réponse
[…] Une fois la structure du contenu mise en place, nous pouvons éventuellement venir la renforcer en usant de métadonnées. Ces métadonnées existent sous deux formes, d’une part une première catégorie permettant l’amélioration de l’accessibilités, avec notamment des attributs rôle et plus précisément les rôles de points de repères ARIA, et d’autre part en usant de RDFa ou de Microdata et en s’appuyant sur le schéma du CreativeWork et des divers types qui en découlent (article, blog, digitaldocument, et plus particulièrement website, webpage et webpageelement). Voir à ce sujet l’article sur les métadonnées. […]