Explorons le répertoire des centres de ressources du Sudoc

Le Sudoc permet non seulement d’identifier et de localiser plusieurs millions de documents, mais d’obtenir des informations sur les 3400 (environ) bibliothèques du réseau. C’est ce qu’on appelle le Répertoire des centres de ressources du Sudoc.

Dompter la recherche par type d’établissement

L’interface de recherche propose 4 index :

  • nom de l’établissement
  • ville
  • type d’établissement
  • département (code)
  • numéro RCR

Un document technique de l’ABES nous explique que le numéro RCR, qui identifie chaque bibliothèque est composé de la sorte (sur 9 caractères) :

  • les deux premiers numéros correspondent au numéro du département ;
  • les trois numéros suivants correspondent au code INSEE de la commune ;
  • les deux numéros suivants correspondent au type de bibliothèque ;
  • les deux derniers forment un numéro séquentiel.

Il est dommage de ne pas avoir à disposition la liste des codes identifiant les différents types d’établissements.

Malgré tout, cette liste est facile à obtenir en rusant un peu. Précisément, en se plaçant sur l’index « type d’établissement » et en recherchant l’expression « 1 ».

Voici le résultat:

 

Les types d'établissements dans le Sudoc

Les types d’établissements dans le Sudoc

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

La signification de ces différents codes peut être dénichée dans le guide méthodologique de l’ABES, précisément dans la page documentant la zone R130 des notices décrivant les bibliothèques.

Le résultat de la requête peut donc être complété, ce qui nous donne le tableau suivant:

Nombre de bibliothèques Code Signification
7 00
1 01
26 10 Bibliothèque nationale
401 21 Bibliothèque universitaire
765 22 Bibliothèque d’institut ou de département universitaire
492 23 Bibliothèque d’enseignement supérieur et de recherche ne faisant pas partie de l’Université
9 30 Autre bibliothèque importante non spécialisée
21 40 Bibliothèque scolaire
357 51 Bibliothèque spécialisée tous publics sur fonds publics
350 52 Bibliothèque spécialisée à accès réservé sur fonds publics
153 53 Bibliothèque spécialisée tous publics sur fonds privés
166 54 Bibliothèque spécialisée à accès réservé sur fonds privés
57 61 Bibliothèque municipale classée
175 62 Bibliothèque municipale non classée
21 63 Bibliothèque départementale de prêt
6 64 Autre bibliothèque de lecture publique sur fonds publics
4 65 Autre bibliothèque de lecture publique sur fonds privés
82 99

Nous avons donc un total de 3093 centres de ressources, dont 401 BU, 765 bibliothèques de départements (UFR…) ou instituts dépendant d’une université, et 492 Bibliothèques d’enseignement supérieur et de recherche ne faisant pas partie de l’Université.
Dans le détail, ces catégories ne sont pas forcément homogènes. On retrouve par exemple des bibliothèques d’ESPE/IUFM dans les trois catégories (surtout les deux dernières il me semble). Et qu’entend-on exactement par « bibliothèque universitaire »? La notion recouvre-t-elle celle – administrative – de « bibliothèque intégrée aux SCD », ou bien est-elle plus fonctionnelle (les bibliothèques « centrales » uniquement)? Existe-t-il une règle homogène, ou bien les établissements disposent-ils d’une certaine liberté pour catégoriser leurs bibliothèques?

Petit souci : nous avons 3 codes (00, 01, 99) qui ne correspondent pas à des types de centres de ressources.

En creusant un peu, il semble que le type de centre de ressource figure normalement à deux endroits dans chaque notice:

– dans la zone 130

– dans le numéro RCR, en position 6 et 7 (ex : pour la Bibliothèque de l’Université de Nîmes. Annexe Hoche, le RCR est 301892105, et le type est 21, c’est à dire « Bibliothèque universitaire »)

Mais dans certains cas, le les postions 6 et 7 du numéro RCR ne correspondent pas à des types reconnus. Or l »index de l’interface de recherche du Sudoc ne porte pas sur la zone 130 (comme on pourrait s’y attendre), mais visiblement sur ces positions 6 et 7.

Concrètement, si nous examinons la fiche de la bibliothèque Diderot de Lyon, il est précisé qu’il s’agit d’une « Bibliothèque universitaire » (donc le code 21 doit être présent en zone 130), mais le RCR (693879901) contient le chiffre 99. Et elle se retrouve donc en bonne place dans les résultats d’une recherche par type d’établissement avec le code 99. Par contre on ne la trouvera pas dans une recherche portant sur le code 21.

La bibliothèque Diderot de Lyon

La bibliothèque Diderot de Lyon

 

 

 

 

 

 

 

 

 

 

 

 

En fait, d’après le descriptif des établissements attributaires d’un code 99, il semble que ce soient pour l’essentiel des bibliothèques numériques. Mais je ne suis pas sûr que ce soit le cas pour le RCR de Diderot (par ailleurs la bibliothèque Diderot dispose de 6 autres fiches, mais il est vrai que la situation et l’histoire de cet établissements sont assez complexes). En tout cas le signalement n’est pas idéal, puisque ce code ne semble pas documenté.

Récupérer une notice XML sur Idref

J’ai découvert avec joie que ces notices d’établissements étaient accessibles sur Idref, au moyen d’un index « RCR ».

Rendons-nous sur l’interface d’Idref et recherchons la notice correspondant à la bibliothèque Diderot:

Recherche de la bibliothèque Diderot dans Idref

Recherche de la bibliothèque Diderot dans Idref

 

 

 

 

 

 

 

 

 

 

Nous arrivons sur une description sommaire, qui nous fournit au passage un permalien vers la notice : http://www.idref.fr/175105332. Ce permalien n’est pas basé sur le RCR, mais sur la zone 001 de la notice, autrement dit le PPN (mais je ne sais pas si l’on peut parler de PPN dans le cas de notices de centres de ressources). Notons que contrairement aux notices de documents, les notices de centres de ressources accessibles via le Sudoc ne présentent pas le PPN ni le permalien. Il faut donc passer par IdRef pour l’obtenir.

A partir des résultats, il possible de télécharger le lot (qui ne comprend qu’une notice…) en MarcXML:

Export en MarcXML

Export en MarcXML

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ce qui génère la requête suivante : http://www.idref.fr/OracleSru/OracleSru?Requete=GetDatabaseS%20LstAut%28%27rcr_t:693879901%27,100%29%20GetDatabaseF%20dual, qui attaque l’index « rcr_t » d’IdRef et affiche les 100 premières réponses (je ne comprends pas bien le reste de la syntaxe, il me semble qu’elle a évolué depuis mes tests de jeunesse sur Idref…).

Nous voila avec une belle notice MarcXML, encapsulée dans un élément collection.

Cette notice peut également être récupérée au moyen du permalien, en ajoutant l’extension « .xml » : http://www.idref.fr/175105332.xml

On peut également rechercher un lot de notices en utilisant IdRef.
Pour cela, il suffit de rechercher « . » (ou « a* ») en sélectionnant le type de notice « Rcr ». Nous obtenons bien 3093 réponses.

Recherche de tous les RCR

Recherche de tous les RCR

 

 

 

 

 

 

 

 

 

 

 

L’interface propose là encore un export en MarcXML, qui correspond à l’URL suivante : http://www.idref.fr/OracleSru/OracleSru?Requete=GetDatabaseS LstAut(‘all:. AND recordtype_z:w’,100) GetDatabaseF dual

Exploiter les données

Après avoir examiné les notices en MarcXML et noté les informations exportées en les comparant à la documentation de l’ABES, j’ai souhaité récupérer les informations suivantes, en les structurant dans un fichier csv : RCR, Nom, Nom usuel, Type, Pays, Code postal, Ville, Réseau documentaire, Conditions d’accès, Notes sur l’accessibilité, Consultation sur place, Prêt à domicile, Conditions d’utilisation.

Pour cela, 2 étapes (en ligne de commande, sous Ubuntu):

  • importer toutes les notices en XML
  • les parser avec une feuille de style XSL

Pour l’import :

curl http://www.idref.fr/OracleSru/OracleSru?Requete=GetDatabaseS%20LstAut%28%27all:.%20AND%20recordtype_z:w%27,3100%29%20GetDatabaseF%20dual > notices.xml

J’avais peur que ma requête soit trop lourde, mais j’ai obtenu toutes les notices en quelques secondes, et – ouf – je n’ai pas planté IdRref.

Pour le parsage :
xsltproc parseur.xsl notices.xml > liste-rcr.csv

J’ai bricolé le parseur sans être un expert du XSL, mais ça fonctionne. J’avais envisagé le cas des champs redoublés, mais apparemment ce n’était pas nécessaire, sauf pour la zone 122. J’avais peur d’avoir des données contenant des « , ce qui aurait perturbé le résultat, mais heureusement ça n’est pas le cas.

Voilà, j’ai maintenant un fichier csv contenant toutes les informations qui m’intéressaient. A vrai dire, je ne suis pas certain d’en faire grand chose, mais je me suis bien amusé 😉

1 comment to Explorons le répertoire des centres de ressources du Sudoc

  • Vince

    Salut Mathieu,
    Je te confirme que le RCR de la bibliothèque dont tu parles longuement et qui contient 99 correspond à la bibliothèque électronique.
    A bientôt
    Vincent

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

  

  

  

*