Puce et Média

Recherche et développement en multimédia

  • Augmenter la taille
  • Taille par défaut
  • Diminuer la taille
Puce et Média > Ergonomie et Architecture > Taxonomie, Thésaurus et vocabulaire controlé

Taxonomie, Thésaurus et vocabulaire controlé

Envoyer Imprimer PDF

Thésaurus, vocabulaires controlés... métadonnées...

Les métas données

Qu'est ce qu'une méta donnée ?.... un donnée de la donnée... certes mais encore ?

Une méta donnée peut définir des informations sur un élément ou la structure même de cet élément lors de son utilisation, comme sa largeur, sa source... <img width="100" src="/archi_orange.jpg" /> ou sa taille, son type soit 21 534 octets Fichier JPG. Une méta donnée peut également définir une description de la donnée, ... ce même élément est une image qui représente un fruit, plus précisement une orange de couleur orange, qui est le fruit de l'oranger et qui peut se consommer sous forme de jus ou directement par quartier. Les métas données peuvent également s'étendre sur la source de la donnée, comme l'auteur, la date de création, le titre... Photo prise sur le marché d'Apt le 31 juillet 2004, auteur Birnou Sébarte... ou enore sur la technique utilisée pour réaliser la donnée Appareil Photo Nikon E995, Focale F4/1 Temps d'exposition 1/98 secondes Vitesse ISO-100 Longueur de focale 22 mm...

Quelques standards

Le Dublin Core

Il existe un schéma générique de méta données, le Dublin Core, qui a été mis en place en 1995 par un groupe de travail et qui propose une description des prinicipales données nécessaires afin de définir une ressource.

Les données IPTC

http://www.iptc.org/pages/index.php

Les métadonnées EXIF
le standard DICOM

Adobe Bridge

Comme le décrit Adobe son éditeur, Adobe Bridge est un gestionnaire de supports visuel, à la fois performant et convivial, qui facilite le classement, l'exploration, la localisation et la visualisation des ressources de création. Ce logiciel permet d'accéder aux fichiers, applications et paramètres des projets ainsi qu'aux fonctions de balisage et de recherche de métadonnées XMP.

Cet explorateur permet de parcourir l'ensemble des fichiers de son disque dur tout en visualisant un aperçu de grand nombre de format (image, PDF, texte...) ainsi que l'ensemble des métadonnées liées à ce fichier.

L'onglet Métadonnées de l'application permet d'accéder directement (lecture et écriture) à des données comme IPTC, DICOM...

En savoir plus

Vous trouverez un canevas de réflexion sur les métadonnées sur le site de Wikipédia, un autre point de départ est le remarquable site de Patrick Pecatte, cela vous permettra d'approfondir l'utilisation des méta données, et l'avenir du web sémantique.

S'il n'existe pas de thésauri sur le domaine du site que vous développez, pensez de mettre en place une base de données de terminologies que vous pourrez utilisez comme méta données pour vos pages. Pensez de soumettre cette questions aux utilisateurs futurs du site. Qui mieux que eux pourra définir les mots clés utilisés pour définir le site et son contenu ?

Par ailleurs si vous mettez en place un index de recherche sur un vocabulaire spécifique, vous pourrez saisir des métas données décrivant le contenu d'une page, sans pour cela que ces même mots soient utilisés dans la pages. Par exemple vous pourriez très bien alimenter un index de vocabulaire incluant les mots cabot, cleps, alors que la page n'utilisera que les mots chiens, ... par contre les internautes pourront saisir les mots de l'index dans le moteurs de recherche interne du site qui pointera vers la page.

Taxonomie, Etiquetage et catégories

Taxonomie, le mot est apparu en relation avec la taxinomie et est devenu un mot à la mode dans l'architecture de site Web... on parle de Taxonomie comme d'une science de classification qui au sein des systèmes d'informations des entreprises, va permettre de définir une liste d'index facilitant la recherche d'information.

Bien que cela puisse paraître évident, il n'est pas facile de regrouper les pages d'un site sous des menus et sous menus.... Arriver à trouver une clarté dans l'arborescence est une tâche qui demande réflexion. La navigation dans l'arboresence du site va devoir passer par l'utilisation d'étiquettes pour définir les libellés de menus et sous menus, et ensuite chacun de ses menus donnera lieu à des catégories regroupant plusieurs pages (méthode du tri de carte). Bien sur tout ceci afin de faciliter la navigation de l'internaute ou l'uilisation des moteurs de recherche.

Prennons quelques exemples très caricatural mais qui peuvent démontrer ce qu'il faut entendre par une erreur d'étiquetage, ou de classement dans une mauvaise catégorie.

Qu'évoque pour vous le mot fer... s'agit il du métal ? de la lame d'une épée ? du fer à repasser ? de fer à cheval ? des entraves qui enchainent un prisonnier ? du nom commun donné aux forceps ? bref... le choix ne manque pas. Donc si vous devriez classer le mot fer dans quelle catégorie le classerez vous ... en tant que minéral ou objet métallique ? . Pour cette raison il est bien d'utiliser un vocabulaire controlé qui permet d'éviter toute ambiguité du langage naturel.

De même lorsqu'on parle d'un avocat, la définition du dictionnaire est un fruit , bien que consommé comme un légume, mais la botanique elle le classe comme une baie monocarpique.... youps... donc fruit, légume, ou baie ? ou est ce une profession de justice ?

Par ailleurs hormis les appelations spécifiques à un site et à son contenu, le nomage de rubriques classiques ne doit pas venir perturber les habitudes prisent par les internautes, et donc il est commun de pouvoir trouver des catégories comme contactez nous, accueil, panier, à propos de ... etc...

vocabulaire controlé

Il existe plusieurs formes de vocabulaire controlé, qui s'étendent de leur présentation la plus simple, les boucles de synonymes à leur présentation la plus complexe, le thésaurus

Les boucles de synonymes

Fichiers d'autorités

Schémas de classification

Thésauri

Thésaurus

Un thésaurus, est un ensemble de terme structuré de manière à faire resortir des catégories.

  • il permet de regrouper les termes d'un même domaine à l'intérieur d'une hiérarchie, et de les mettre en relation avec des termes d'autres domaines ;
  • la relation hiérarchique permet d'accéder à des concepts plus larges ou plus étroits à l'intérieur d'un même domaine ;

  • lorsque plusieurs termes peuvent rendre compte d'un même concept l'utilisateur est guidé vers le terme préférentiel choisi par l'indication des autres termes possibles dans le champ " employé pour " ;
  • le thesaurus est un outil dynamique qui peut être mis à jour par ajout, modification ou suppression de termes ou relations entre termes.

Les termes du thésaurus peuvent avoir divers types de relations entre eux, de ces relations peuvent découleur des multitudes d'utilisation d'aide à la navigation ou à la recherche d'information dans un index de sites ou dans l'aide d'un moteur de recherche :

Equivalence :

pneu, tube, gomme, slik...

Hierarchique :

La relation hierarchique peut être générique comme mamifères , chien, partie ou ensemble, jambe , tibia, pied, ou d'instance, pneu, firestone, good year, michelin...

Associatives :

Enfin l'associative, qui permet de pouvoir ouvrir également vers les produits dérivés ou les accéssoires, dans un site e-commerce. voiture, route, station essence, carte, gps ...

Quelques liens intéressants
 


Puce et Média > Ergonomie et Architecture > Taxonomie, Thésaurus et vocabulaire controlé