Thésaurus, vocabulaires controlés... métadonnées...
Les métas données
Qu'est ce qu'une méta donnée ?.... un donnée de la donnée... certes mais encore ?

Une méta donnée peut définir des informations sur un élément ou la structure même de cet élément lors de son utilisation, comme sa largeur, sa source... <img width="100" src="/archi_orange.jpg" /> ou sa taille, son type soit 21 534 octets Fichier JPG. Une méta donnée peut également définir une description de la donnée, ... ce même élément est une image qui représente un fruit, plus précisement une orange de couleur orange, qui est le fruit de l'oranger et qui peut se consommer sous forme de jus ou directement par quartier. Les métas données peuvent également s'étendre sur la source de la donnée, comme l'auteur, la date de création, le titre... Photo prise sur le marché d'Apt le 31 juillet 2004, auteur Birnou Sébarte... ou enore sur la technique utilisée pour réaliser la donnée Appareil Photo Nikon E995, Focale F4/1 Temps d'exposition 1/98 secondes Vitesse ISO-100 Longueur de focale 22 mm...
Quelques standards
Le Dublin Core
Il existe un schéma générique de méta données, le Dublin Core, qui a été mis en place en 1995 par un groupe de travail et qui propose une description des prinicipales données nécessaires afin de définir une ressource.
Les données IPTC
http://www.iptc.org/pages/index.php
Les métadonnées EXIF
le standard DICOM
Adobe Bridge

Comme le décrit Adobe son éditeur, Adobe Bridge est un gestionnaire de supports visuel, à la fois performant et convivial, qui facilite le classement, l'exploration, la localisation et la visualisation des ressources de création. Ce logiciel permet d'accéder aux fichiers, applications et paramètres des projets ainsi qu'aux fonctions de balisage et de recherche de métadonnées XMP.
Cet explorateur permet de parcourir l'ensemble des fichiers de son disque dur tout en visualisant un aperçu de grand nombre de format (image, PDF, texte...) ainsi que l'ensemble des métadonnées liées à ce fichier.
L'onglet Métadonnées de l'application permet d'accéder directement (lecture et écriture) à des données comme IPTC, DICOM...
En savoir plus
Vous trouverez un canevas de réflexion sur les métadonnées sur le site de Wikipédia, un autre point de départ est le remarquable site de Patrick Pecatte, cela vous permettra d'approfondir l'utilisation des méta données, et l'avenir du web sémantique.
S'il n'existe pas de thésauri sur le domaine du site que vous développez, pensez de mettre en place une base de données de terminologies que vous pourrez utilisez comme méta données pour vos pages. Pensez de soumettre cette questions aux utilisateurs futurs du site. Qui mieux que eux pourra définir les mots clés utilisés pour définir le site et son contenu ?
Par ailleurs si vous mettez en place un index de recherche sur un vocabulaire spécifique, vous pourrez saisir des métas données décrivant le contenu d'une page, sans pour cela que ces même mots soient utilisés dans la pages. Par exemple vous pourriez très bien alimenter un index de vocabulaire incluant les mots cabot, cleps, alors que la page n'utilisera que les mots chiens, ... par contre les internautes pourront saisir les mots de l'index dans le moteurs de recherche interne du site qui pointera vers la page.
Taxonomie, Etiquetage et catégories
Taxonomie, le mot est apparu en relation avec la taxinomie et est devenu un mot à la mode dans l'architecture de site Web... on parle de Taxonomie comme d'une science de classification qui au sein des systèmes d'informations des entreprises, va permettre de définir une liste d'index facilitant la recherche d'information.
Bien que cela puisse paraître évident, il n'est pas facile de regrouper les pages d'un site sous des menus et sous menus.... Arriver à trouver une clarté dans l'arborescence est une tâche qui demande réflexion. La navigation dans l'arboresence du site va devoir passer par l'utilisation d'étiquettes pour définir les libellés de menus et sous menus, et ensuite chacun de ses menus donnera lieu à des catégories regroupant plusieurs pages (méthode du tri de carte). Bien sur tout ceci afin de faciliter la navigation de l'internaute ou l'uilisation des moteurs de recherche.
Prennons quelques exemples très caricatural mais qui peuvent démontrer ce qu'il faut entendre par une erreur d'étiquetage, ou de classement dans une mauvaise catégorie.
Qu'évoque pour vous le mot fer... s'agit il du métal ? de la lame d'une épée ? du fer à repasser ? de fer à cheval ? des entraves qui enchainent un prisonnier ? du nom commun donné aux forceps ? bref... le choix ne manque pas. Donc si vous devriez classer le mot fer dans quelle catégorie le classerez vous ... en tant que minéral ou objet métallique ? . Pour cette raison il est bien d'utiliser un vocabulaire controlé qui permet d'éviter toute ambiguité du langage naturel.
De même lorsqu'on parle d'un avocat, la définition du dictionnaire est un fruit , bien que consommé comme un légume, mais la botanique elle le classe comme une baie monocarpique.... youps... donc fruit, légume, ou baie ? ou est ce une profession de justice ?
Par ailleurs hormis les appelations spécifiques à un site et à son contenu, le nomage de rubriques classiques ne doit pas venir perturber les habitudes prisent par les internautes, et donc il est commun de pouvoir trouver des catégories comme contactez nous, accueil, panier, à propos de ... etc...
vocabulaire controlé
Il existe plusieurs formes de vocabulaire controlé, qui s'étendent de leur présentation la plus simple, les boucles de synonymes à leur présentation la plus complexe, le thésaurus
Les boucles de synonymes
Fichiers d'autorités
Schémas de classification
Thésauri
Thésaurus
Un thésaurus, est un ensemble de terme structuré de manière à faire resortir des catégories.
- il permet de regrouper les termes d'un même domaine à l'intérieur d'une hiérarchie, et de les mettre en relation avec des termes d'autres domaines ;
- la relation hiérarchique permet d'accéder à des concepts plus larges ou plus étroits à l'intérieur d'un même domaine ;
- lorsque plusieurs termes peuvent rendre compte d'un même concept l'utilisateur est guidé vers le terme préférentiel choisi par l'indication des autres termes possibles dans le champ " employé pour " ;
- le thesaurus est un outil dynamique qui peut être mis à jour par ajout, modification ou suppression de termes ou relations entre termes.
Les termes du thésaurus peuvent avoir divers types de relations entre eux, de ces relations peuvent découleur des multitudes d'utilisation d'aide à la navigation ou à la recherche d'information dans un index de sites ou dans l'aide d'un moteur de recherche :
Equivalence :
pneu, tube, gomme, slik...
Hierarchique :
La relation hierarchique peut être générique comme mamifères , chien, partie ou ensemble, jambe , tibia, pied, ou d'instance, pneu, firestone, good year, michelin...
Associatives :
Enfin l'associative, qui permet de pouvoir ouvrir également vers les produits dérivés ou les accéssoires, dans un site e-commerce. voiture, route, station essence, carte, gps ...






