Métadonnées : théorie de l’indexation

Haute École Bruxelles-Brabant (HE2B)

2025-11-19

Planning de la séance

  • Feedback sur l’exercice
  • Les classifications, fin
  • Retour sur les langages documentaires avant d’aborder les langages combinatoires

Vos questions

Panorama des langages documentaires

Les classifications

Feedback : Exemples de relation

Relation Exemple Question clé
Hyperonymie Chien → Animal “Est-ce un type de… ?”
Méronymie Roue → Voiture “Est-ce une partie de… ?”
Instance La Tour Eiffel → Monument “Est-ce un exemple de… ?”

Caractéristiques des langages classificatoires

  • Un langage classificatoire ne peut remplir ses fonctions que s’il est :

    • complet : c’est-à-dire s’il intègre tous les sujets qui ont déjà été traités ou qui pourraient éventuellement être traités dans un document ;
    • flexible : c’est-à-dire s’il s’ajuste aux besoins et aux habitudes de recherche des usagers, au volume des collections à classifier, à l’évolution du domaine d’activité qu’il représente, à l’environnement technologique au sein duquel il est exploité pour la recherche, etc . ;
    • hospitalier : c’est-à-dire s’il autorise l’intégration de nouveaux sujets à la structure existante, sans qu’il soit nécessaire de la modifier ou de la repenser.

Typologie des langages classificatoires

  • le schéma de classification encyclopédique, qui décrit la totalité de l’univers des connaissances passées, présentes et potentielles ;
  • le schéma de classification spécialisé, qui structure les sujets les plus courants dans un seul champ de la connaissance ou un domaine d’activité ;
  • le schéma de classification énumératif, qui décrit tous les sujets simples et complexes dans un domaine d’activité ou dans la totalité de l’univers des connaissances ;
  • le schéma de classification synthétique, ou analytico-synthétique, qui énumère des concepts et des sujets simples et fournit des directives pour l’élaboration de représentations précises pour des sujets complexes ;
  • le schéma de classification philosophique, qui reproduit un système conventionnel d’organisation des connaissances et se développe indépendamment de toute collection documentaire ;
  • le schéma de classification utilitaire, qui est conçu pour organiser les documents dans une collection particulière et dont le développement est entièrement dépendant de celle-ci ;

Source : Hudon, 2013

Typologie des langages classificatoires

Langue naturelle & langages documentaires

Langue naturelle

  • Langue naturelle
    • Richesse sémantique
    • Richesse lexicale
  • D’un point de vue documentaire, cela pose plusieurs problèmes pour le repérage des documents
    • la polysémie, c’est-à-dire la présence dans la langue de mots possédant plusieurs significations
    • la synonymie, c’est-à-dire la présence dans la langue de plusieurs mots ayant la même signification ou des significations assez voisines
    • les variations autour d’une même racine
    • les variantes orthographiques
    • les figures de style qui décrivent un concept sans le nommer

Langage documentaire

  • Cohérence sémantique sur le plan des significations
  • Cohérence terminologique sur le plan des termes et des expressions
  • → Contrôle de la langue naturelle pour faciliter le repérage

Les contrôles offerts par les langages documentaires

  • le contrôle morphologique
  • le contrôle syntaxique
  • le contrôle sémantique
  • le contrôle pragmatique

Contrôle le plus important pour la recherche

  • Pour les systèmes de recherche « classiques » : contrôle sémantique
  • … mais les systèmes de recherche évoluent !

Contrôle sémantique

Nature et fonctions du langage documentaire

  • Langage artificiel
  • Sous-ensemble de termes provenant d’une ou plusieurs langues naturelles
  • Application du principe de biunivocité (ou règle de l’unité de sens)
    • Un concept est représenté par un seul descripteur
    • Un descripteur représente un seul concept

Avantages et inconvénients pour la recherche

Typologie des langages documentaires

  • Langage documentaire combinatoire
  • Langage documentaire classificatoire

Précoordination et postcoordination

  • Précoordination : c’est au moment de l’indexation par le professionnel que l’ordre des termes choisis est déterminé, cet ordre respecte les règles syntaxiques et pragmatiques
  • Postcoordination : le professionel doit s’assurer que tous les termes nécessaires soient présent pour représenter le contenu du document, mais c’est au moment de la recherche par l’usager que ces termes seront coordonnés pour représenter son besoin d’information

Les répertoires de vedettes-matière

  • La vedette-matière est un terme simple, composé ou complexe qui représente un sujet de façon normalisée aux fins d’indexation et de repérage
  • Le répertoire de vedettes-matière est un langage documentaire combinatoire précoordonné qui propose un ensemble de vedettes-matière déjà établies, montre les relations d’équivalence, de hiérarchie et d’association qui existent entre elles, et propose des règles syntaxiques et pragmatiques pour leur utilisation

Typologie des répertoires de vedettes-matières

  • Encyclopédique
    • Library of Congress Subject Heading (LCSH)
    • Répertoire de vedettes-matière de l’Université Laval (RVM)
    • Répertoire d’autorité-matière encyclopédique et alphabétique unifié (RAMEAU)
  • Spécialisé
    • Medical Subject Headings (MeSH)

La vedette-matière

  • Tête de vedette
  • Subdivisions
    • la subdivision thématique
    • la subdivision géographique
    • la subdivision chronologique
    • la subdivision de forme

Illustration : Répertoire de vedettes-matière de l’Université Laval (RVM)