Le Sudoc apprivoisé (avec des vrais morceaux d’UNIMARC dedans…)

Non, il ne s’agit pas là d’un tutoriel pour le SUDOC, mais de quelques remarques sur un petit bug repéré en cherchant des ouvrages sur la Mégère apprivoisée de Shakespeare (en version originale The taming of the shrew).
J’ai été surpris de constater que dans l’interface publique, une recherche « mégère apprivoisé » en sujet ne donnait aucune réponse.
Idem pour l’équivalent dans le logiciel de catalogage (WinIBW) : « CHE MSU mégère apprivoisée » ne donne aucune réponse.
Pourtant, il serait bien étonnant qu’aucune BU ne possède aucune étude consacrée à cette pièce!
Et en effet, il y en a 35 dans le SUDOC, mais pour les retrouver, il faut chercher en sujet des mots du titre original : « taming shrew ».

Ne croyez pas que Shakespeare ait été honteusement discriminé par l’ABES. Ainsi, le comportement du SUDOC est identique avec le Portrait de Dorian Gray de Wilde, qu’il faudra plutôt chercher au titre original, The Picture of Dorian Gray, ou avec les Hauts de Hurlevent d’Emily Brontë, à chercher à Wuthering Heights.

Explication pour les gens pressés

Pour les deux premiers exemples, ce comportement n’est pas normal, et il devrait être corrigé quand l’ABES aura le temps. (D’après un message du pôle métadonnées de l’ABES, à qui j’avais signalé le problème).

Explication unimarcienne, pour les grands malades

La recherche par « sujet » renvoie une liste de notices où les mots recherchés sont présents, dans certaines zones UNIMARC bien précises, le plus souvent 600, 604, 606, 607. La plus utilisée est la zone 606, qui contient des sujets « noms communs », essentiellement en RAMEAU.
Or, pour tous les types de sujets, il est prévu que l’usager puisse saisir des « formes rejetées » qui seront interprétées par le système comme équivalentes aux « formes retenues ».
Par exemple, vous pouvez chercher et trouver des ouvrages sur les doudous, bien qu’aucune notice ne comporte une zone « 606 $aDoudous ».
Couverture : Le grand livre des doudous (AMAZON)
Dans cet exemple, c’est en fait le sujet « Objets transitionnels » qui est présent dans les notices en zone 606, non pas en plein texte, mais sous la forme d’un lien renvoyant à une « notice d’autorité » qui contient plusieurs équivalents de cette notion (Voir la notice équivalente à la BnF ), chacun pouvant être saisi indifféremment dans une recherche sujet.

Dans le cas de la Mégère apprivoisée et des Hauts de Hurlevent, tout devrait se passer de la même façon, le titre français jouant le rôle de « forme rejetée », comme « Doudous » dans l’exemple précédent.
Pourtant, cela ne fonctionne pas, mais pour deux raisons différentes :

Il existe bien deux notices d’autorité de type Tq (auteur/titre) correspondant à la pièce de Shakespeare et au roman d’E. Brontë, et les notices correspondant à des études critique sur ces oeuvres peuvent donc comporter une zone 604 contenant un lien vers l’une d’elles.
Conformément aux usages du SUDOC, la « forme retenue » dans ces notice d’autorité, en zone 240, est le titre en langue originale : « Shakespeare, William (1564-1616). The @taming of the Shrew », et « Brontë, Emily (1818-1848). @Wuthering heights ».

Les deux cas diffèrent, car la notice consacré à Wuthering heights est en fait trop pauvre en informations dans le SUDOC : Alors que la notice équivalente à la BnF est très détaillée, et donne plusieurs traductions du titre, celle du SUDOC ne comporte que le titre original.

240 ##$aBrontë, Emily (1818-1848)$t@Wuthering heights

Il est donc tout à fait logique que la recherche « Hauts de Hurlevent » en sujet ne donne rien.
Bien que cela soit corrigeable ponctuellement, étant donné le grand nombre de notices dans ce cas, seule une solution globale permettrait d’y remédier. J’ignore totalement si cela serait faisable, mais on pourrait peut-être imaginer un « import » des données issues de la BnF ou de catalogues étrangers…

Concernant notre mégère, et le Portrait de Dorian Gray, la situation est différente : la traduction du titre en français figure bien dans la notice en « forme rejetée », dans la zone 440, conformément au format UNIMARC.

240 ##$aShakespeare, William (1564-1616)$tThe @taming of the Shrew
440 ##$aShakespeare, William (1564-1616)$tLa @mégère apprivoisée

Comme point de comparaison, voila ce qui se passe dans le catalogue de la BnF :
La notice auteur/titre décrivant cette oeuvre contient les mêmes informations que dans le SUDOC, en zone 240 et 440.
La conséquence, c’est qu’une recherche « mégère apprivoisée » dans l’index sujet donne exactement les mêmes réponses qu’une recherche « taming shrew ».

Enfin, j’ajoute que contrairement aux notices Auteur/Titre, les notices décrivant dans le SUDOC les titres anonymes (qui n’utilisent pas les mêmes zones unimarc), gèrent parfaitement les renvois entre formes retenues et formes rejetées. Par exemple, pour trouver toutes les 108 études sur le Roman de Renart, on peut très bien saisir « Reinardus vulpes » ou « Reinaard de Vos ».

Conclusion : dans le SUDOC professionnel comme dans l’interface publique, la zone 440 des notices d’autorité de type Tq n’est pas « indexée », alors qu’elle devrait l’être.

Finalement, ce qui m’étonne le plus dans cet oubli, qui devrait donc être réparé cet été, c’est que personne ne l’ait signalé auparavant. Or cette non-indexation semble durer depuis assez longtemps (pas depuis les origines du Sudoc, j’espère!).
J’aurais tendance à y voir une nouvelle preuve, indirecte, de la prédominance dans les usages de la « recherche simple » par rapport à la recherche dans un index, sans parler de la recherche avancée combinant plusieurs index, de la recherche par lot, et autres fonctionnalités du SUDOC.

2 comments to Le Sudoc apprivoisé (avec des vrais morceaux d’UNIMARC dedans…)

  • vingtseptpointsept

    Auto-commentaire après auto-modification…
    Petites modifications apportées hier au billet (et pistes d’orientation pour une « charte » sur de futurs billets à contenu pro ou semi-pro):
    anonymisation : je citais nommément un responsable de l’ABES (avec une faute d’orthographe, en plus…), mais les échanges concernant le point souligné dans ce billet ayant été fait de manière privée, et dans un cadre professionnel, il n’était pas très convenable de le citer sans son accord.
    suppression de la date probable à laquelle ce problème devrait être corrigé, car là encore cette information n’était pas publique.
    suppression des captures d’écran de WinIBW.
    J’espère que le cache Google ne gardera pas trop longtemps en mémoire la version non corrigée…

    On peut légitimement se demander s’il est opportun d’évoquer sur un blog « public » un problème apparemment très professionnel, et lié à un outil précis (le sudoc), mais ce billet me semble tout de même justifié dans la mesure où:
    – le comportement du SUDOC public est affecté, et ce fait est constatable par tout-un-chacun. Donc un utilisateur « lambda » du SUDOC pourra éventuellement tirer profit de cette information.
    – des collègues travaillant avec d’autres SIGB peuvent avoir à faire à des problèmes similaires.

  • […] Ce billet était mentionné sur Twitter par Pierre A., Mathieu. Mathieu a dit: Billet sur le sudoc. essai de pédagogie, mais je ne sais pas si c'est clair. Merci de me corriger si erreurs… http://bit.ly/btzuSB […]

Leave a Reply to vingtseptpointsept Cancel reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

  

  

  

*

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

A sample text widget

Etiam pulvinar consectetur dolor sed malesuada. Ut convallis euismod dolor nec pretium. Nunc ut tristique massa.

Nam sodales mi vitae dolor ullamcorper et vulputate enim accumsan. Morbi orci magna, tincidunt vitae molestie nec, molestie at mi. Nulla nulla lorem, suscipit in posuere in, interdum non magna.