Métadonnées : théorie de l’indexation

Haute École Bruxelles-Brabant (HE2B)

2025-12-04

Planning de la séance

Vos questions

Langue naturelle & langages documentaires

Langage documentaire combinatoire

Les répertoires de vedettes-matière

Illustration : RAMEAU

Illustration : Répertoire de vedettes-matière de l’Université Laval (RVM)

Illustration : Gemeinsame Normdatei (GND)

Les thésaurus

Thésaurus
Le thésaurus est une liste de mots ou d’expressions ayant valeur de termes dans un domaine de la connaissance ou une discipline, dans un champ d’activité ou dans un environnement institutionnel ou organisationnel particulier. Le terme est la représentation verbale d’un concept (Hudon, 2013)
Thésaurus
Liste organisée de termes contrôlés et normalisés (descripteurs et non descripteurs) servant à l’indexation des documents et des questions dans un système documentaire. Les descripteurs sont reliés par des relations sémantiques (génériques, associatives et d’équivalence), exprimées par des signes ou symboles conventionnels. Les synonymes (non-descripteurs ou termes interdits) sont reliés aux descripteurs par la seule relation d’équivalence. (Dégez, 2001)

Fonctions d’un thésaurus

  • atténuer l’impact des difficultés causées, au moment de la recherche d’information, par la synonymie (redondance) et la polysémie (ambiguïté) caractéristiques de la langue naturelle ; le thésaurus appauvrit la langue naturelle pour améliorer l’efficacité de la communication d’information ;
  • faciliter la recherche d’information et la rendre plus efficace ;
  • permettre l’exhaustivité du repérage en liant les concepts et les termes au sens proche.

Répertoire de vedettes-matières vs. Thésaurus

Typologie des thésaurus

  • le thésaurus spécialisé ou sectoriel décrit les concepts et utilise la terminologie normalisée d’une seule discipline ou d’un seul champ d’activité ;
  • le macrothésaurus décrit plusieurs disciplines ou champs d’activité ;
  • le thésaurus disciplinaire se développe indépendamment d’une base de données ou d’une collection particulière ;
  • le thésaurus institutionnel ou le thésaurus d’entreprise est conçu à seule fin d’assurer l’accès à une collection documentaire locale ; dans le thésaurus monolingue, les termes et les relations sont présentés en une seule et même langue naturelle ;
  • le thésaurus multilingue propose un inventaire de concepts, de termes et de relations utilisés dans diverses cultures et représentés dans plusieurs langues naturelles ;
  • le thésaurus est dit thématique lorsque la structuration de son contenu est faite à partir de grands thèmes ou de sujets généraux ;
  • le thésaurus est dit à facettes lorsque la structuration de son contenu est faite à partir de la nature des concepts représentés (par exemple, Activité, Agent, Propriété, etc .) .

Composantes d’un thésaurus

Le lexique
aussi appelé vocabulaire d’entrée, est constitué de deux catégories de termes : les descripteurs, ou termes préférentiels, et les non-descripteurs
Le descripteur
un terme (mot ou groupe de mots formant une expression) choisi parmi un ensemble de synonymes pour représenter un concept de manière univoque. À l’origine, le descripteur était plutôt de type uniterme. Cette caractéristique est moins évidente aujourd’hui alors que des règles assouplies permettent un certain degré de précoordination des concepts et des termes dans des circonstances particulières

Composantes d’un thésaurus (suite)

Définitions
précise la signification d’un descripteur dans la discipline ou le champ d’activité décrits par le thésaurus. Mais le thésaurus n’est pas un dictionnaire et on n’y trouvera pas la définition de chacun des termes du lexique
Notes d’application
précisent les modalités et les circonstances d’utilisation d’un terme

Composantes d’un thésaurus (suite)

La structure relationnelle
La structure relationnelle du thésaurus s’extériorise dans une variété de relations sémantiques qui lient les concepts d’un domaine et par conséquent les termes qui les représentent dans le lexique

Ces relations sont * l’équivalence intralinguistique entre termes représentant le même concept dans une même langue naturelle (donc entre synonymes) * l’équivalence interlinguistique entre termes représentant un même concept dans deux ou plusieurs langues naturelles * la hiérarchie * l’association