Pages

dimanche 15 novembre 2009

L'indexation sujet dans les catalogues, fierté et honte des bibliothécaires


Nous sommes actuellement en pleine période de formation des premières années de licence : visite de la bibliothèque, présentation de l'offre documentaire et de services, utilisation du catalogue et de ressources en ligne.
Pour le catalogue, nous préconisons une méthode qui me parait tout à fait efficace et sensée et que je préconise depuis longtemps : dans la majorité des cas, se contenter pour commencer d'une recherche simple puis, lorsqu'on a trouvé un document correspondant visiblement à ce que l'on recherche, cliquer sur le mot sujet correspondant pour obtenir la liste de tous les documents dûment identifiés par la bibliothèque comme traitant précisément du même sujet.
Très bien, sauf que ça ne marche pas.
Depuis plus de trois ans, j'ai pu le constater, à chaque fois que j'ai fait des contrôles soit pour répondre à la demande d'un usager, soit dans le cadre de mes propres recherches : 9 fois sur 10 au moins, on constate des incohérences dans l'indexation sujet. Je ne parle pas ici de la part de subjectivité inhérente à la pratique de l'indexation, ni même de la difficulté de choisir le niveau de l'indexation, du général au particulier. Non, ce que je constate dans les catalogues que j'ai utilisés, à Nancy ou à Reims, ce sont de vraies incohérences : des éditions différentes d'un même document qui ont à peine un sujet en commun ou des façons différentes de décrire un même sujet.
Prenons un exemple. L'autre jour, je voulais vérifier si le livre Accueillir les publics de Marielle de Miribel que mes collègues m'avaient transmis avait été mis sur ma carte. Par distraction et par atavisme, j'ai tapé comme mots clés "accueillir orienter" dans notre catalogue, ce qui m'a bien sûr renvoyé à la notice du livre de référence de Bertrand Calenge, Accueillir, orienter, informer.
Plutôt que de faire une autre recherche, j'ai voulu faire mon test habituel : rebondir sur un mot-clé sujet pour retrouver l'autre livre. Peine perdue : les deux livres n'ont aucun descripteur sujet en commun, alors qu'il n'y a pas besoin de se creuser longtemps pour savoir que leurs thématiques sont très proches. Mais là, on trouve en sujets pour le Calenge "Bibliothèque et lecteurs" et "Bibliothèques - Utilisation" et pour le Miribel "Bibliothèques - Accueil et orientation des publics", "Bibliothèques - Services aux publics" et "Bibliothèques - Publics".
L'indexation des deux éditions du livre de Bertrand Calenge, en 1996 et 1999, se recoupe en partie, mais en partie seulement.
Alors à quoi est-ce dû ? Notre catalogue n'est pas plus mauvais qu'un autre, nous jouons à fond le jeu du SUDOC... En fait, je pense que tous les catalogues connaissent ce genre de problème, surtout au fil du temps, car le catalogue, emblème de la bibliothèque, est aussi un témoin de son histoire et, avec ses différentes strates, un témoin archéologique de la l'histoire de l'établissement.
Quoi qu'on fasse, un catalogue ne sera jamais parfait et une indexation sujet ne sera jamais parfaitement cohérente à l'échelle d'une collection de plusieurs centaines de milliers de documents catalogués sur des dizaines d'années (On connait tous pourtant des collègues qui ne s'en sont pas encore rendus compte et perdent leur temps et se rendent malades à essayer de "nettoyer" leur catalogue chéri. Je ne sais pas vous, mais moi j'appelle ça la cataloguite aigue).
Pour ma part, ce qui m'inquiète, c'est que notre catalogue tel qu'il fonctionne actuellement avec son rebond sur les mots clés sujet ne rend pas un bon service aux usagers. Pire, il les induit en erreur : on lui laisse croire qu'en choisissant de cliquer sur un sujet il va obtenir la liste de tous ceux qu'on lui propose sur ce sujet précis, ce qui est rarement le cas.
Que faire alors ? Abandonner tout bonnement l'indexation sujet ? Sûrement pas. Il me semble que les bibliothécaires sont en plein dans leur rôle en indiquant ou en validant les sujets traités par un document donné en fonction des usagers potentiels de la bibliothèque.
Non, ce qu'il faut, c'est modifier nos OPAC. Cette histoire de liens pré-établis entre des autorités normalisées, ça ne marche pas. Ce qui fonctionne, et ce qui existe déjà, même si c'est pour des outils encore novateurs peu répandus, c'est la possibilité d'un rebond sur un sujet - ou sur tout autre type de donnée descriptive - à partir de facettes qui ne sont pas pré-établies d'avance mais dont la liste est établie à partir des résultats mêmes de la requête, piochés dans la zone sujet, mais aussi dans les autres zones significatives comme le titre ou les notes. Ainsi, on peut affiner intuitivement une première requête en étant certain de ne pas rater de résultats répondant à la question posée. Mais en attendant notre réinformatisation, prévue à moyen terme, j'ai le temps de continuer à m'énerver en contrôlant les résultats de mes requêtes catalogue...

9 commentaires:

Raphaële a dit…

Même constat ici aussi. C'est bien pour cela qu'on va se lancer à fond dans l'implémentation d'un OPAC de nouvelle génération qui va beaucoup mieux répondre aux attentes des usagers tout en confortant les bibliothécaires dans leur rôle de descripteurs.

Pottok a dit…

Même combat à Nancy et mêmes certitudes !

B. Majour a dit…

Bonjour

Pourquoi ne suis-je pas étonné. :-))

Sur le principe, je pense que même un OPAC nouvelle génération ne changera rien au problème.

Les tags (mots clés, mots matières) d'une génération ne seront pas ceux d'une autre.
Et c'est ce que reflète un thésaurus vivant : une évolution dans le temps.
C'est ce que montre une collection, des livres de moins en moins lus, la nouvelle version d'un ouvrage poussant l'autre dans les limbes d'un magasin.

On parle souvent de strates de savoirs, et on retombe bien dans le domaine de l'archéologie.

N'en est-il pas de même avec la Dewey, qui bouge dans le temps.


Ce que je trouve paradoxal, c'est de vouloir figer du vivant avec un thésaurus, des facettes, ou une indexation. En oubliant les liens entre les éléments, les mots, ou les indices.
Qui nécessitent, au bas mot, une sorte de dictionnaire de conversion permettant de basculer de l'un à l'autre, ou de rebondir de l'un à l'autre.

On le constate aussitôt lorsque le public interagit avec les OPAC.
Combien utilisent les synonymes d'un mot, plutôt que le mot lui-même ?

Orienter. Synonymes : guider, mener, diriger, promener, accompagner...

Combien utilisent la racine du mot, plutôt que le verbe ?
Accueillir, accueil.

Le mot lui-même, écrit de manière même approximative ?
(en langage SMS pour demain ?)


Certes, on touche là à la sémantique.

Mais, on doit retenir que plus dictionnaire est riche, plus on peut y rebondir.

Du bruit dans les réponses, on peut le réduire.
L'inverse non.

Ce qui implique que, pour être efficace, l'OPAC doit savoir traiter toutes les occurrences rejetées. Et ne pas se contenter d'une unique recherche dans un champ, ou même dans tous les autres champs renseignées (ce qui est déjà mieux).

Car les utilisateurs ne sont pas bibliothécaires. Eux, ils ne rejettent aucune formulation.
Lorsque le bibliothécaire, lui, l'a fait, pour n'en garder qu'une seule.

Le fossé est là, dans notre propre pratique... Une pratique qui n'est pas répercutée dans les OPAC.


Bien cordialement
B. Majour

JC Brochard a dit…

Bonjour,
Effectivement, toute recherche se base sur des mots et, pour prendre encore l'exemple de Reims, nos OPAC sont des plus paresseux pour aider à les utiliser : pas de liaison singulier/pluriel, pas de liaison masculin/féminin, pas de synonymie, d'antonymie ou d'équivalence, pas de suggestion de correction d'erreurs de frappe,...
Je milite aussi pour le bruit par rapport au silence, surtout en début de recherche. D'ailleurs, la recherche sur des documents en texte intégral, sans le filtre d'un quelconque thésaurus ou autre système de mots-clés, se révèle généralement très efficace.
Ce que je voulais juste signaler ici, c'est que notre système de réduction de bruit par rebond sur des autorités sujets pseudo-normalisées est particulièrement nocif, car il n'offre que l'apparence d'une rechercher experte et efficace. C'est pour ça que la possibilité d'affiner sa recherche à partir de l'analyse du contenu des premiers résultats me parait une première étape vers l'amélioration du service rendu par l'OPAC.

Anonyme a dit…

Tiens tiens, voila que tu te penches sur les entrailles de notre cher catalogue... C'est vrai que ce n'est pas joli joli, et pourtant fait de notre mieux.


Pour moi Rameau est une usine à gaz peut-être utilisable par un professionnel qui aurait un accès au site Rameau pour vérifier la pertinence de requêtes, mais surement pas par un lecteur lambda. Comment savoir que tel terme est retenu plus qu'un autre? Comment deviner que France -- Histoire ne renverra que des documents généraux, et pas des documents portant exclusivement sur la France au 20e par exemple?


Ce pbm est aggravé par des choix fait "en local" :
- pas de fichier d'autorité dans notre catalogue --> on ne bénéficie pas des renvois qui existent dans les notices sudoc.
- pas d'imports automatiques, pour protéger nos données d'exemplaires --> 80% des notices qui datent de Mathusalem, enfin, de la date où nous avons intégré le SUDOC. Ces notices sont archimoches (mal traduites d'OCLC, parfois sans indexation française etc.)


Du coup, je n'insiste pas trop sur la recherche par sujet auprès des lecteurs, par ce que je ne mens pas bien, et j'aurai du mal à leur vendre ça comme une panacée...

Par contre, on pourrait imaginer qqch se rapprochant des tags, mais aussi pt etre une indexation utilisant des options qu'on trouve dans certaines bases de données, comme Psycinfo :
- différenciation entre descripteurs majeurs et mineurs (sujets abordés de manière secondaire dans le document)
- "éclatement" des mots du thesaurus : en cherchant 'France -- Histoire' on pourrait cocher une case pour chercher aussi toutes les périodes précises.

On peut rêver. Mais quand on voit qu'en 2009 nous respectons encore les préceptes AFNOResques débiles (pardon, je voulais dire "légèrement obsolètes") en ce qui concerne les "anonymes par excès d'auteurs", ça ne me pousse pas à l'optimisme. Je n'ai pas l'impression que l'accès aux documents et aux informations soient réellement une priorité pour les bibliothèques, contrairement aux beaux discours.
Tu imagines un Amazon qui ne ferait pas ressortir le nom des auteurs d'un livres s'ils étaient 4 ? Un libraire ne fera jamais ça, car un livre invendu, c'est une perte financière pour lui. Pour nous, un livre non lu, c'est inéluctable, c'est la routine. Et puis les étudiants ne lisent plus de toute façon, alors...


Mathieu

27point7 a dit…

Autre précision : pour qu'une recherche 'tous mots' donne le plus de réponses possibles, il vaut mieux que la notice soit enrichie par un résumé.
Or nous payons pour télécharger des notices Electre, enrichies d'un résumé, mais ces notices ne servent que pendant que l'ouvrage est en commande. Ensuite, elles sont écrasées par celles du SUDOC, y compris la zone du résumé.
Je ne sais pas si c'est une limitation de notre SIGB ou un choix volontaire pour éviter le 'bruit', mais personnellement je trouve ça dommage...

Mathieu

Anonyme a dit…

plutôt utiliser le SUDOC non ;-))

Quand on ne peut (ou veut) pas améliorer un opac, on sombre doucement vers une mort lente...
RIP !

A votre santé

GIGI

JC Brochard a dit…

Mathieu,
Ah, j'attendais ta réaction. Je savais bien qu'un tel sujet te passionnerai.
Pour ce qui est des résumés d'Electre dans nos notices, je ne sais pas trop ce qu'il en est, mais je pense que c'est lié au fait que nous remplaçons les notices de commande par celles du SUDOC, dans lesquelles nous ne sommes peut-être pas autorisés à ajouter le résumé Electre.

Gigi,
Le SUDOC est loin d'être parfait, mais je milite depuis un certain temps déjà pour qu'on limite le nombre de catalogues en créant par exemple des OPAC qui seraient des versions localisées de catalogues collectifs, sur le modèle de Worldcat Local. Il suffit d'avoir, relié à ça ou à côté un système qui gère le prêt des exemplaires (et ça c'est beaucoup plus simple à gérer) et le fichier des inscrits, et hop !
Attendons de voir si, une fois l'accord Worldcat signé, l'ABES va plancher sur une solution de ce type...

27point7 a dit…

Pour les résumés, oui en effet il est interdit de les intégrer au SUDOC.
Par contre, certains SIGB sont paramétrables pour que certaines zones unimarc ne soient pas écrasées lors des imports sudoc. Mais je ne sais pas si c'est le cas d'Horizon.
On pourrait aussi imaginer que le catalogueur copie le résumé dans un document temporaire le jour j et le recopie dans la notice après import, mais ça serait une complication du travail, une source de ralentissement, et une source d'erreur potentielle...

Pour l'histoire des catalogues collectifs "opacisés", c'est tt à fait ce qu'on a vu au Danemark lors du voyage d'étude ABF : http://bibliotek.dk/?lingo=eng