Zotero et les styles de citation – épisode 2 : communauté, documentation et outils

[Edit du 28/07/2014 : rajout d'un guide sur l'usage de la norme ISO 690 en chimie]

Suite du billet d’hier (Zotero et les styles de citation – épisode 1)

Je remercie les Zotéristes (il y a un mot?) qui ont réagi à mon billet d’hier et ont éclairé ma lanterne sur certains points, que je récapitule ici.

Stéphanie Bouvier avait rédigé un billet début 2010 pour expliquer le contexte de création des 4 styles France1-4.

Un groupe de travail organisé par le SCD de l’Université de Poitiers alimente une bibliographie imposante (111 documents) et bien organisée, qui contient notamment des informations sur les styles.

Deux sites à connaître :

Concernant les styles francophones :

  • Des discussions sur les styles francophones ont lieu dans une rubrique du forum Zotero
  • Un board Trello est dédié aux styles CSL francophones. Une dizaine de personnes sont actives, la plus impliquée étant semble-t-il Franziska Heimburger, qui a rédigé plusieurs styles pour les besoins de l’EHESS

Documentation sur les styles

Guides pour l’édition de styles :

Outils (en plus d’un bon éditeur de code…)

  • un éditeur de style CSL intégré à Zotero (décrit ici sur le site de Zotero, et évoqué par le guide de T. Lienhard)
  • un éditeur de style CSL en dehors de Zotero, permettant de tester tous les styles du dépôt CSL (attention, certaines subtilités du langage peuvent ne pas être correctement implémentées dans Zotero, donc les tests faits avec cet éditeurs doivent être complétés par des tests en grandeur nature)
  • un validateur de style CSL en ligne

 

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Zotero et les styles de citation – épisode 1

Comme l’expliquait ma voisine de classe il y a quelques jours, les bébés conservateurs que nous sommes doivent s’atteler à la rédaction d’un mémoire d’étude dans les mois à venir. Or qui dit mémoire dit bibliographie. Quel meilleur prétexte pour se plonger dans les arcanes de mon gestionnaire de bibliographie préféré ? Voilà en effet des semaines que j’accumule les références dans Zotero, que je les classe, déclasse, duplique, annote, reclasse, redéclasse avec la joie d’un gamin devant ses cubes. Mais le but de l’opération est bien de les intégrer à un texte à un moment où un autre, en respectant les préconisations de l’école.

Quelles sont ces préconisations? Faire figurer dans le mémoire…

… une bibliographie rédigée selon les normes :

- AFNOR. Références bibliographiques : contenu, forme et structure, norme AFNOR Z 44-OO5 et ISO 690. Paris : AFNOR, 1987. 13 p.

- AFNOR. Références bibliographiques. Partie 2 : documents électroniques, documents complets ou parties de documents, norme AFNOR NF ISO 690-2. Paris : AFNOR, 1998. 18 p.

Tout autre choix de présentation qui se justifierait doit être explicité dans un bref avertissement en tête de la bibliographie. Un logiciel de gestion de références bibliographiques pourra être utilisé.

En complément de ces consignes, deux guides nous sont proposés :

- un guide maison rédigé en janvier 2012 par une enseignante de l’école (actuellement loin de Lyon mais c’est une autre histoire), qui fait référence à la norme ISO 690, en précisant que…

La norme de rédaction d’une notice bibliographique est fixée par la norme Afnor Z 44-005 (décembre 1987), adaptée de la norme ISO 690. Une nouvelle norme ISO 690 a obtenu le statut de norme française en août 2010. Elle présente un certain nombre de modifications par rapport à la norme Z 44-005 décrite ici (simplification des différences typographiques).

- un guide rédigé en 2009 par une personne extérieure à l’école. Puisqu’il est librement accessible sur internet et diffusé sous licence CC BY-NC-SA, voila le lien référence : V. Pierre, Références et citations bibliographiques dans un article scientifique: La norme ISO 690 (Z 44-005). 23 mai 2007. Mise à jour le 14 avril 2009

Ce qui me chiffonne un peu c’est que le guide “maison” ne semble pas tout à fait compatible avec l’autre guide. Et les essais que j’ai pu mener avec Zotero ne me convainquent pas, car les styles de citation compatibles avec l’ISO 690 ne permettent pas de faire figurer des références dans des notes en bas de page, ce qui est la pratique courante dans les mémoires d’étude de conservateurs.

J’ai donc pris quelques jours pour approfondir le dossier, dans le but d’écrire mon propre style, en me basant sur ceux existant déjà. Au delà de l’intérêt immédiat, l’exercice est intéressant, car il permet d’approfondir le fonctionnement de Zotero, et l’usage de la norme ISO 690 (j’ai beau être dans le métier depuis 2007, je n’ai qu’une connaissance assez superficielle des styles de citation utilisés par les étudiants et les chercheurs, car j’ai été biberonné à d’autres normes, exclusivement utilisées par les bibliothécaires, notamment la norme NZ 44-050)

Le style en question est déjà bien avancé, mais dans ce billet je me contenterai de quelques remarques préliminaires.

Zotero et les styles CSL

Zotero permet d’utiliser de nombreux styles de citations. Chaque style est défini dans un fichier .csl rédigé en utilisant le Citation Style Language, un format XML utilisé pour décrire les références, citations, et bibliographies, et maintenu par le projet Citationstyle, séparément de Zotero. On trouve en ligne les spécifications du CSL, ainsi qu’un guide introductif.

Les styles se distinguent par leur manière

  • de structurer les références,
  • de les appeler dans le texte,
  • de les lister dans la bibliographie finale.

Un appel de citation peut être se faire

  • directement dans le corps du texte, en utilisant
    • le nom de l’auteur (ex : [Tartenpion]),
    • le nom suivi de la date (ex: [Tartenpion 2010]) ,
    • un “label” construit en concaténant le nom et la date (ex: [tartenpion10]),
    • un numéro correspondant à l’ordre de citation de la ressource dans le texte (ex: [1]).
  • sous forme de notes (de bas de page ou reportée en fin de texte) appelées par un numéro ou un symbole quelconque (tel que *). Le système de numérotation ou de symboles ne fait pas en lui-même partie du langage CSL.

Le choix du type de citation est déterminé par la valeur d’un élément category affecté d’un attribut citation-format, en début de fichier.  Les valeurs possibles sont “autor-date”, “author”, “numeric”, “label” et “note”.

12 styles sont fournis en standard avec Zotero (voir la liste sur github).

5 sont de type “auteur-date”:

  1. American Anthropological Association
  2. Americain Psychological Association 6th edition
  3. Cell
  4. Chicago Manual of Style 16th edition (author-date)
  5. Elsevier Harvard (with titles)

3 sont de type “note”:

  1. Chicago Manual of Style 16th edition (fullnote bibliography)
  2. Chicago Manual of Style 16th edition (note)
  3. Modern Humanities Research Association 3rd edition (note with bibliography)

3 sont de type “numérique” :

  1. IEEE
  2. Nature
  3. Vancouver

1 est de type “auteur” :

  1. Modern Language Association 7th edition

En plus de ces styles pré-installés, il est possible d’en ajouter de nouveaux à partir d’une liste plus de 7000 styles issus du dépôt de styles collaboratif du projet Citationstyle. Le dépôt est également accessible sur Github.

La norme ISO 690

Parmi ces styles supplémentaires, plusieurs font référence à la norme ISO 690, dont l’usage est recommandé pour la rédaction des mémoires de l’ENSSIB.

L’ISO 690 est une norme internationale qui donne des principes directeurs pour la rédaction de références bibliographiques et de citations. Elle s’applique à tout type de ressources ayant fait l’objet d’une publication, y compris sous forme électronique, mais exclut de son périmètre les documents manuscrits ou non publiés.  La version en vigueur est la 3e édition publiée par l’ISO en 2010. Sa traduction française a été homologuée en France par l’AFNOR sous la référence NF ISO 690:2010, dans cadre de classement Z 44-005.

Jusqu’en 2010, la 2e édition de la norme se présentait sous la forme de deux documents : un premier volet publié en 1987, et un second en 1997, consacré aux documents électroniques. La 2e édition de 1987 succédait à une 1re édition de 1975.

Malheureusement, comme la plupart des normes, l’ISO 690 n’est pas accessible en ligne librement. Elle est vendue  — cher — par l’ISO comme par l’AFNOR. On peut cependant arriver à la dénicher en pdf dans sa version anglaise en cherchant bien dans Google, mais je ne suis pas persuadé que le lien direct soit bien légal, donc si cela vous intéresse, jouez du “filetype:pdf”, ça ne devrait pas être trop compliqué ;-). Cette difficulté d’accès explique sans doute :

  • le faible usage de cette norme dans le milieu académique
  • la référence fréquente à la 2e édition dans différents guides et recommandations, alors que cette version est censée être caduque.

Les différences entre les prescriptions de la 2e édition et la 3e sont paraît-il minimes, mais je n’ai trouvé nulle part un comparatif détaillé (encore un contrecoup de  la difficulté d’accès).

Il y a heureusement de nombreux guides d’implémentation rédigés par des universités ou des écoles. Parmi les complets et faciles d’accès, je citerais:

Une des particularités de la norme ISO 690 par rapport à d’autres styles de citations est d’être un cadre assez souple, sujet à interprétation, ce qui explique les divergences (souvent minimes) entre les différents guides. Dans le cadre d’une intégration à Zotero, la gestion de certaines de ces variations supposent un paramétrage du fichier CSL générant les références à intégrer au texte rédigé. D’autres seront plus facilement gérées au moment de l’import des données bibliographiques dans Zotero. Et il est probable que certaines ne pourront pas l’être de manière automatique (par exemple, comment Zotero pourrait-il décider qu’un titre est “long” et peut être abrégé?)

Pour la construction des références, voici quelques exemples de ces choix reposant sur le jugement ou les besoins du créateur de la bibliographie :

  • la norme ne prescrit pas de ponctuation ni de choix typographiques particuliers (§ 4.4)
  • dans certains cas, le responsable éditorial d’un document collectif peut être cité en auteur principal (§ 5.1). Dans d’autres cas, en auteur secondaire. La distinction semble assez délicate, surtout dans le cadre d’une implémentation informatique.
  • s’il y a plusieurs auteurs, le nom des auteurs suivant le premier peuvent être sous la forme “NOM, Prénom” comme le 1er auteur, mais également “Prénom, NOM” (§ 5.4.1)
  • s’il y a plusieurs auteurs, “il peut être approprié” de débuter la référence par le titre ou la collection, au lieu des auteurs (§ 5.4.1). L’exemple donné est une compilation musicale.
  • s’il y a plus de 3 auteurs, il est préférable de tous les indiquer, mais il est aussi possible d’en omettre certains. En cas d’omission, le 1er auteur doit obligatoirement être donne, suivi de “et al.” ou “et autres”. L’exemple de la norme ne donne que le 1er auteur, mais j’imagine qu’un nombre indéfini d’auteurs peut être donné (§ 5.4.2)
  • la mention des auteurs secondaires (qui se fait après le titre) est facultative : “Pour faciliter l’identification d’une ressource donnée, ou compte tenu de l’objectif de la citation” (§ 5.4.5)
  • si des auteurs secondaires sont mentionnés, l’indication de leur fonction n’est pas normalisée, mais doit être faite “de façon à identifier clairement la relation entre la fonction considérée et tout ou partie de la ressource” (§ 5.4.5)
  • si le véritable nom d’un pseudonyme est connu, il est possible de l’indiquer entre [ ] après son pseudonyme (§ 5.5)
  • les références à des oeuvres anonymes “peuvent” (sans que cela soit une obligation) être introduites par “Anon.” dans le cas d’une citation de type “auteur-date”, et par le titre dans les autres cas (§ 5.6)
  • si la ressource est plus connue sous un titre alternatif, ce titre “peut” être ajouté entre [] après le titre privilégié (§ 6.1.3)
  • un titre très long “peut” être abrégé (§ 6.1.4)
  • les sous-titres “peuvent” être omis s’ils ne donnent pas d’information essentielle sur la ressource (§ 6.1.5)
  • un titre ambigu ou comprenant une abréviation peu claire “peut” être explicité entre [] (§ 6.1.6)
  • “si des conférences régulières se sont tenues sous le même titre, il peut s’avérer nécessaire d’ajouter la date et le lieu de la conférence à titre de précision” (§ 6.5)
  • le “In:” est nécessaire devant un titre de monographie, mais facultatif devant un nom de périodique. Et il peut être remplacé le cas échéant par des équivalents dans d’autres langues (“dans” en français ?) (§ 6.4)
  • “si nécessaire”, la nature de la ressource doit être précisée entre [] (§ 7)
  • en cas de ressource mise à jour, il est possible d’indiquer uniquement la date de mise à jour, ou bien “pour plus de clarté” la date de publication initiale et la date de mise à jour (§ 8.2)
  • le terme “volume” ou les termes équivalents pour décrire des parties de publication en série “peuvent” être omis si la typographie et la ponctuation permettent de les remplacer (§ 10.3)
  • la collection et le numéro dans la collection “peuvent” être donnés (§ 11)
  • la classification, les dimensions, le  prix et la disponibilité, la langue de la ressource ou une marque déposée “peuvent” être transcrits (§ 14.2 à 6)
  • la citation des normes, rapports techniques en collection et publications similaires fait l’objet d’un paragraphe (§ 15.10), mais leur traitement reste assez allusif: la norme indique que la collection et le numéro constituent des éléments essentiels, et que la collection peut être abrégée. Mais dans les exemples donnés, l’emplacement de ces mentions au sein des références n’est pas claire : doivent-ils figurer après le titre ou après la date? Et peut-on étendre ces conseils à des rapports parlementaires, aux rapports thématiques de l’inspection générale des bibliothèques, ou aux rapports d’activité d’une organisation?

Pour l’utilisation des références dans des citations, la norme permet également plusieurs techniques, détaillées dans l’annexe A (auteur-date, numéro de la référence, note). Mais cette annexe n’a de valeur qu’informative, et les choix qui y sont présentés peuvent donc être discutés. Ainsi, dans le cas des citations sous forme de notes :

  • la norme ne prévoit pas que la note puisse contenir une référence sous une forme courte, ou adaptée (par exemple en utilisant la forme “Prénom NOM”), et qu’une bibliographie finale contienne la version détaillée de la référence. Cette pratique se rencontre pourtant.
  • la norme n’évoque pas la possibilité d’avoir recours les abréviations “op. cit” et “ibid”, couramment utilisées dans les travaux de SHS francophones. Si une note renvoie à une ressource citée dans une note précédente, elle peut soit répéter la référence intégrale, soit donner le nom de l’auteur et la référence de la note précédente, en précisant si nécessaire la pagination. Par exemple, la note 2 “2. STIEG, M.F., The information needs of historians. College and Research Libraries. 1981. 42(6). p. 549-560″ peut être suivie d’une note 3  “3. STIEG, réf. 2. p. 555″.

Ces pratiques sont-elles pour autant contraires à la norme? Je serais tenté de répondre non, dans la mesure où l’annexe A n’a pas de valeur normative…

 Zotero et la norme ISO 690

That’s all folks

La suite au prochain épisode

 

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Quel tarif pour les lecteurs extérieurs en bibliothèque universitaire?

Pas de considérations métaphysiques dans ce billet. Des faits, rien que des faits, et surtout des sous ! ;-)

La question, qui s’inscrit dans la préparation de mon mémoire : combien coûte l’inscription dans une BU pour un lecteur absolument extérieur au monde universitaire, et ne bénéficiant d’aucune des réductions possibles (la liste des réductions varie fortement d’un établissement à l’autre. Disons que notre Monsieur Lambda n’est ni chômeur, ni étudiant d’une autre université, ni retraité de l’éducation nationale unijambiste inscrit dans une formation continue co-organisée par un établissement conventionné, etc) ?

Pour répondre à cette question j’ai dû dresser un tableau en examinant un par un les sites des BU françaises. J’ai exclu pour l’instant les BIU parisiennes (et la BU LSH de Lyon), les INSA et autres écoles, et les BU de Nouvelle Calédonie et du Pacifique (les tarifs sont en Francs Pacifique). J’ai par contre inclus les 3 universités technologiques (Troyes, Compiègne, Belfort).

[Mais quel est le sadique qui  a inventé la grammaire française? Pourquoi j'ai exclu mais j'ai inclus? Hein? Pourquoi?]

Restent 73 établissements, dont j’ai repris les intitulés “ESGBU” pour simplifier.

Bilan :

- une bibliothèque où apparemment aucun extérieur ne peut s’inscrire : Paris 2 (Assas). Accès limité sans doute lié à l’histoire particulière de Paris 2 qui a longtemps été privée de BU (mais vous me direz, c’était aussi le cas de Paris 7…)

- 2 BU qui n’indiquent pas les tarifs sur leurs sites (et j’ai cherché!) : Paris 1 (Panthéon-Sorbonne) et Paris 5 (Descartes)

- 70 BU fournissant cette information

Parmi ces 70, le tarif médian est de 35 euros.

Dans le détail, le “pivot” est de 34 euros, autrement dit le montant des droits versés par les étudiants pour la bibliothèque lors de leur inscription (montant fixé par arrêté pour l’année 2013-2014, et revalorisé régulièrement), qui sert donc de référence à la plupart des établissements pour fixer leurs tarifs pour le grand public.
Certaines bibliothèques utilisent ce montant de référence comme un “tarif réduit”, dont bénéficient par exemple les étudiants d’autres universités, ou les personnels de l’Education nationale. Dans ce cas, elles établissent fréquemment le tarif plein en affectant le montant de 34 euros d’un coefficient multiplicateur (x2, ou plus rarement x1,5, ce qui nous donne soit 68 soit 51 euros) ou en rajoutant 10 euros. Dans une minorité de cas le tarif d’inscription semble totalement décorrélé des 34 euros.

Tarif plein Nombre de bibliothèques
Moins de 34 euros 6
34 euros 28
Entre 34 et 68 euros 24
68 euros 8
Plus de 68 euros 4

Une partie des 4 tarifs inférieurs à 34 euros sont probablement des erreurs liés à une mise à jour irrégulière des sites.
Enfin, signalons deux cas particuliers sur lesquels je reviendrai sans doute :
- Toulouse 1, qui propose à ses lecteurs (étudiants, enseignants ou extérieurs) un droit supplémentaire facultatif de 15 euros permettant emprunter plus de documents (politique qui a fait vivement réagir des collègues de Reims et d’Angers en 2010). Le tarif que j’ai retenu ici est le tarif de base pour les extérieurs (44 euros), sans ces 15 eurs.
- Angers, qui propose des tarifs différenciés, mais pour les extérieurs uniquement : avec ou sans accès à la documentation électronique. Jusqu’à cette année, l’inscription “sans documentation électronique” était gratuite, et l’inscription premium à 34 euros. A partir de l’année prochaine, l’inscription de base passera à 15 euros, et l’inscription premium à 50 euros. J’ai retenu 34 euros (pour pouvoir comparer avec un service rendu équivalent dans les autres BU)

Et voila le détail

Nom Zone géographique Type de bibliothèque Type d'établissement Montant plein tarif (€)
PARIS-DAUPHINE Ile-de-France BU Université 200
TROYES Province BU Université 200
PARIS 10 Ile-de-France BU Université 110
COMPIEGNE Province BU Université technologique 73
BORDEAUX Province BU Université 68
BORDEAUX 3 Province BU Université 68
GRENOBLE 1-INPG Province BIU BIU généraliste 68
GRENOBLE 2 et 3 Province BIU BIU généraliste 68
LYON 1 Province BU Université 68
MONTPELLIER Province BIU BIU généraliste 68
PARIS 11 Ile-de-France BU Université 68
PARIS 6 Ile-de-France BU Université 68
LYON 3 Province BU Université 64
LA REUNION Province BU Université 55
AMIENS Province BU Université 51
CAEN Province BU Université 51
NANTES Province BU Université 51
TOULON Province BU Université 51
ANGERS Province BU Université 34
LORRAINE Province BU Université 50
LA ROCHELLE Province BU Université 48
ALBI (CUFR CHAMPOLLION) Province BU Université 44
TOULOUSE 1 Province BU Université 44
TOULOUSE 2 Province BU Université 44
TOULOUSE 3 Province BU Université 44
VERSAILLES-ST-QUENTIN Ile-de-France BU Université 43,5
RENNES 1 Province BU Université 42
BREST Province BU Université 40
LILLE 1 Province BU Université 40
RENNES 2 Province BU Université 40
AVIGNON Province BU Université 38
LILLE 2 Province BU Université 38
MULHOUSE Province BU Université 36,6
AIX-MARSEILLE Province BU Université 36
MARNE-LA-VALLEE Ile-de-France BU Université 35
SAINT-ETIENNE Province BU Université 35
BESANCON Province BU Université 34,7
ANTILLES GUYANE Province BU Université 34
ARTOIS Province BU Université 34
BRETAGNE-SUD Province BU Université 34
CHAMBERY Province BU Université 34
CLERMONT-FERRAND Province BIU BIU généraliste 34
EVRY VAL-D'ESSONNE Ile-de-France BU Université 34
LE HAVRE Province BU Université 34
LE MANS Province BU Université 34
LILLE 3 Province BU Université 34
LITTORAL Province BU Université 34
LYON 2 Province BU Université 34
NICE Province BU Université 34
NÎMES Province BU Université 34
ORLEANS Province BU Université 34
PARIS 12 Ile-de-France BU Université 34
PARIS 13 Ile-de-France BU Université 34
PARIS 3 Ile-de-France BU Université 34
PARIS 4 Ile-de-France BU Université 34
PARIS 7 Ile-de-France BU Université 34
PARIS 8 Ile-de-France BU Université 34
PAU Province BU Université 34
PERPIGNAN Province BU Université 34
POITIERS Province BU Université 34
REIMS Province BU Université 34
ROUEN Province BU Université 34
STRASBOURG Province BU Université 34
VALENCIENNES Province BU Université 34
DIJON Province BU Université 33
TOURS Province BU Université 33
CERGY-PONTOISE Ile-de-France BU Université 32
LIMOGES Province BU Université 32
BELFORT MONTBELIARD Province BU Université technologique 30
CORTE Province BU Université 30

Une analyse? Pas pour l’instant. Mais j’ai quelques petites idées tout de même…

 

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Ouvrir la BU aux étudiants et chercheurs d’autres universités : l’exemple britannique

J’évoquerai dans ce billet le dispositif ACCESS mis en place au Royaume-Uni et en Irlande (l’Eire) par la SCONUL (Society of College, National and University Libraries). Il vise à garantir au personnel et aux chercheurs, ainsi qu’aux étudiants avancés ou ayant des besoins particuliers un accès à de la documentation universitaire en dehors de leur établissement de rattachement.

La SCONUL

logo Sconul

 

 

 

 

 

Tout d’abord, quelques mots sur la SCONUL : cette association fondée en 1950 représente toutes les bibliothèques universitaires du Royaume-Uni et d’Irlande, ainsi que les bibliothèques nationales et (depuis 2001) celles de la plupart des « collèges d’enseignement supérieur ». (établissements d’enseignement supérieur, souvent techniques, et n’ayant pas le statut d’université). Son objectif est d’après son plan stratégique 2012-2015 d’ « aider ses membres à fournir des services de pointe à leurs étudiants, chercheurs et universitaires, afin de permettre à leurs institutions d’atteindre l’excellence dans l’enseignement et la recherche ».

À noter : il existe une autre instance regroupant un certain nombre de bibliothèques universitaires sur le même territoire (UK+Irlande) mais de manière plus sélective : la Research libraries UK, dont 34 bibliothèques seulement sont membres. La RLUK a une vocation de soutien à la recherche, plus qu’à l’enseignement. Elle a été à l’origine de COPAC, l’équivalent du Sudoc.

Je ne me lancerai pas dans une comparaison avec la situation française, sinon pour préciser (mais vous l’aurez compris) que ces associations n’ont pas d’équivalent strict chez nous : l’ADBU est historiquement une association d’individus (même si elle cherche a devenir une association d’établissements), et les périmètres fonctionnels (BU+bibliothèques de recherche) et géographiques (deux pays) de la SCONUL et de RLUK sont plus larges.

Une problématique générale dans les bibliothèques de l’enseignement supérieur

Le dispositif ACCESS répond à une problématique identifiée de longue date outre-Manche, mais à laquelle les bibliothèques de l’enseignement supérieur sont confrontées dans tous les pays: des étudiants ou des chercheurs peuvent avoir besoin ou envie de fréquenter une bibliothèque dépendant d’une université à laquelle ils ne sont pas affiliés.

Plusieurs cas de figure peuvent motiver le recours à une autre bibliothèque. Je distinguerais deux types de motivations :

  • la recherche de documents spécifiques (documents patrimoniaux, littérature grise, etc.) absents de la bibliothèque habituelle de l’usager ;
  • la difficulté ou l’impossibilité de recourir aux services de la bibliothèque de rattachement, pour des raisons géographiques, d’emploi du temps, ou de handicap. L’essor de l’enseignement à distance et des formations en alternance rend certainement ces difficultés plus prégnantes aujourd’hui.

À quoi peut-on s’attendre en frappant à la porte d’une bibliothèque ne dépendant pas de son université ? En France, la réponse dépendra de la bibliothèque, et en particulier de sa situation géographique :

  • de manière générale (cela mériterait d’être nuancé, mais aucune synthèse n’existe pour le moment), l’entrée et l’usage sur place des documents sont généralement libres et gratuits en Province, mais réservés aux lecteurs inscrits (membres de l’université et lecteurs autorisés) à Paris.
  • par contre, l’emprunt et les autres services (accès aux ressources électroniques, PEB…) sont réservés aux membres de l’université dont dépend la bibliothèque, sauf en cas d’accord de réciprocité entre établissements. Ces accords peuvent être formalisés dans le cadre d’une Communauté d’universités et d’établissements (COMUE), d’un partenariat régional (feu le Réseau Universitaire Ouest Atlantique) ou d’une simple convention.

À quoi faut-il s’attendre au Royaume-Uni (faisons pour l’instant abstraction du dispositif ACCESS…) ?

  • Pour autant qu’on puisse en juger, la consultation gratuite des collections dans l’enceinte de la bibliothèque semble exceptionnelle, contrairement à la France. À l’université du Bedforshire, la consultation sur place est ainsi facturée aux extérieurs 25£ (avec des possibilités de réduction ou de gratuité dans certains cas) À l’université de Manchester, l’accès libre n’est possible qu’une seule fois, la règle étant qu’un usager extérieur doit s’inscrire, pour 75£ (cette inscription donne droit au prêt, de manière limitée). On peut cependant trouver quelques contre-exemples, comme la bibliothèque de l’université d’Huddersfield ou d’Edinburgh dont les collections sont accessibles gratuitement, mais pas nécessairement librement : à Edinburgh, en période de forte affluence, la bibliothèque est réservée aux étudiants et enseignants de l’université.
  • D’autre part, des accords entre établissements existent, comme en France, et sont souvent signalés avec moult détails sur les sites des bibliothèques. Mais leur périmètre peut être plus restreint qu’en France, et se limiter aux enseignants-chercheurs et étudiants avancés. C’est par exemple le cas du programme liant entre elles les bibliothèques de recherche du Grand Londres (M25).

La politique d’accès des bibliothèques universitaires anglaises est donc historiquement moins « libérale » que celle de leurs homologues françaises. Peut-être est-ce un des facteurs expliquant que plusieurs programmes aient vu le jour à la fin du XXe siècle pour faciliter la vie des étudiants et des chercheurs.

Une histoire ancienne

ACCESS est issu de la fusion en 2007 de deux dispositifs plus anciens :

  • SCONUL Research Extra (SRX) qui s’adressait destiné au personnel et aux étudiants avancés (doctorants),
  • UK Libraries Plus (UKLP), qui s’adressait aux étudiants « postgraduate » (en gros l’équivalent de notre niveau Master) ainsi qu’aux étudiants à distance, en alternance ou à temps partiel.

Lors de son lancement en 1999, UK Libraries Plus ne concernait que les aux étudiants à distance, en alternance ou à temps partiel, et a été étendu en 2005 aux étudiants « postgraduate » à plein temps (voir une actualité de l’université de Southampton)

Un article de 2007, dont un préprint est en ligne, donne un aperçu intéressant de la mise en place du service (E. J. Adam, A vital lifeline: UK Libraries Plus 1999-2006. (lien vers le pdf). SCONUL Focus, 40 . pp. 89-93).

Je traduis le résumé, et je souligne :

Il peut sembler incroyable aujourd’hui qu’il y a seulement huit ans il n’existait aucun programme national pour permettre aux étudiants d’accéder et d’emprunter dans les bibliothèques de l’enseignement supérieur. Pourtant le besoin était clair. Avec toujours plus d’étudiants à temps partiel, étudiant souvent loin de l’université ou du “collège” dans lequel ils se sont inscrits, les bibliothèques étaient confrontées aux plaintes continuelles des étudiants ne pouvant obtenir un accès facile aux documents dont la lecture était attendue dans leur cursus. Les étudiants en alternance, passant souvent plusieurs semaines loin de leur établissement et pourtant censés réaliser des travaux dans leurs cursus, faisaient face aux mêmes problèmes. Dans certaines régions, des dispositifs comme London Plus (depuis 1988) permettaient en partie de répondre à ces besoins, mais il suffisait que l’usager change de région pour ne plus rien avoir. Encore pire, de nombreuses bibliothèques, même lorsqu’elles avaient mis en place des dispositions détaillées pour les étudiants à temps partiel de leur propre institution, faisaient en sorte que des barrières soient en place pour que le service ne soit pas débordé par les malotrus de l’université voisine. Lorsque j’étais en poste à l’université South Bank, je me souviens que je devais maintenir une longue liste de ceux que nous laissions entrer ou pas.

SCONUL Research Extra a été mis en place plus tardivement, en 2003, le dispositif UK Libraries Plus ayant servi de modèle. Il a fait suite à plusieurs initiatives prises dans les années 1990 pour faciliter l’accès à la documentation aux chercheurs en déplacement, comme le rappelle un article de 2006 (J. Hall, SCONUL Research Extra. Liber Quarterly, 2006). Il a notamment pris la suite du Research Support Libraries Programme, initié en 1999, dont l’objectif était plus large, mais qui a contribué à populariser l’idée d’une « collection nationale répartie des ressources documentaires universitaires »

En 2007 ces deux programmes ont donc fusionné, mais leur périmètre était différent, tant en ce qui concerne les publics ciblés que les établissements partenaires, ce qui explique l’apparente complexité d’ACCESS : une identité unique recouvrant des services différenciés destinés à des publics clairement identifiés.

Profiter d’ACCESS aujourd’hui

Le dispositif est basé sur la réciprocité entre établissements et sur une catégorisation des usagers en quatre groupes (« bands »). Quasiment toutes les bibliothèques universitaires adhèrent au système (environ 180), mais chaque bibliothèque peut très bien ne faire profiter du dispositif que les usagers du groupe A (par exemple la Queen’s University de Belfast), du groupe B, du groupe A et B, etc. Seules certaines utilisent toutes les possibilités du dispositif (la London School of Economics par exemple)

Les trois premiers groupes sont :

  • groupe A :
    • personnel (enseignants et support)
    • étudiants « post-graduate » effectuant un travail de recherche
  • groupe B :
    • étudiants « undergraduate » ou « post-graduate » à temps partiel (statut en général accordé pour des raisons familiales ou médicales, ou en cas de travail salarié)
    • étudiants suivant un enseignement à distance
    • étudiants suivant un enseignement en alternance (“placement”)
  • groupe C : étudiants « post-graduate » n’effectuant pas de travail de recherche (« taught courses students », mutatis mutandis, l’équivalent d’un Master pro chez nous)

Le dernier groupe, R, est particulier, car il n’est pas destiné à permettre l’emprunt de documents, contrairement aux trois premiers, mais la simple consultation sur place (« reference »). Il concerne les étudiants « undergraduate » ordinaires.

Enfin, il existe un dispositif complémentaire (utile pour les établissements ne donnant pas de droits au groupe R, si je comprends bien), qui permet à des étudiants « undergraduate » d’utiliser les services d’une bibliothèque qui n’est pas la leur, pendant les périodes de vacances universitaires.

Pour profiter du dispositif, l’usager doit se rendre sur la rubrique dédiée sur le site de la SCONUL. Une FAQ détaille les différents cas de figure. Un formulaire en ligne lui permet de préciser à quelle catégorie il appartient, et à quelle université. Il doit choisir l’université dont il souhaite utiliser la bibliothèque (mais son inscription sera valide dans d’autres établissements après acceptation). La demande est traitée par son université de rattachement, qui lui envoie un courriel de confirmation. Lors de la première visite dans l’établissement auquel il souhaite accéder, il devra se présenter avec sa carte d’étudiant ou professionnelle, et une copie du courriel afin d’établir une carte. Certaines bibliothèques demandent en outre une photo d’identité. L’émission de la carte est normalement gratuite, mais certaines bibliothèques la facturent tout de même quelques livres.

182 BU ouvertes pour un chercheur de l'université West London

182 BU ouvertes pour un chercheur de l’université West London

Le dispositif se caractérise par sa grande souplesse pour les établissements : outre l’existence de quatre catégories, chaque bibliothèque décide des services exacts qu’il propose aux bénéficiaires : condition de prêt, accès au PEB, au matériel informatique ou aux ressources électroniques. En général seul le prêt est possible, avec parfois un accès à quelques ressources électroniques, sur place uniquement.

De plus, une bibliothèque peut tout à fait restreindre temporairement l’accès ou le prêt pour une catégorie d’usagers, ou pour l’ensemble des extérieurs, notamment pendant les périodes d’examens. L’accès aux étudiants extérieurs a par exemple été bloqué dans les bibliothèques de l’université de Glasgow du 14 avril au 1er juin 2014.

En guise de conclusion : expérience exotique ou source d’inspiration ?

Sans vouloir tomber dans le cliché facile, la grande flexibilité du dispositif et le fait qu’il soit géré par une association d’établissements et non par les pouvoirs publics dénote un « pragmatisme » dont nous avons parfois du mal à faire preuve de ce côté de la Manche. Ouups, je suis tombé dans le cliché facile :wink:

Bien sûr, ce dispositif ne pourrait pas être transposé tel quel en France. Certains de ses volets seraient globalement inutiles chez nous : l’accès sans possibilité de prêt (groupe R et accès pendant les vacances universitaires) aurait peu de sens en France compte tenu de nos pratiques actuelles, sauf peut être dans les BU parisiennes.

Par contre, permettre aux chercheurs, étudiants avancés et aux étudiants « empêchés » à un titre ou un autre (étudiants à distance, en alternance, handicapés, etc) d’emprunter des documents dans la BU de leur choix pourrait être une piste intéressante d’amélioration du service rendu par les BU. Resterait à calculer le coût d’une telle mesure (je n’ai pas trouvé d’évaluation du coût d’ACCESS), et à trouver un pilote…

Qu’en pensez-vous ?

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bilan du concours de conservateur d’Etat

Ou: comment j’ai appris à ne plus m’en faire et à aimer les déménagements.

À la demande du peuple, je réveille le blog au bois dormant pour faire un point sur les épreuves du concours de conservateur d’Etat, en particulier sur les oraux qui ont eu lieu il y a trois semaines.
En interne, nous étions vingt admissibles, pour sept postes. Six de moins qu’en 2008… Les promotions sont nettement plus réduites qu’il y a quelques années, mais j’ignore si c’est un effet de la démographie, ou une volonté délibérée de “repyramider” la filière bibliothèque en réduisant le nombre de conservateurs, comme le souhaite clairement l’IGB (voir son dernier rapport sur les emplois en bibliothèques).
Bref, inutile de faire durer le suspense, j’ai été pris en 6e position, en grande partie grâce aux notes obtenues aux épreuves écrites (plutôt inhabituel pour moi, en général les oraux me sont plutôt profitables). Je vais revenir brièvement sur les épreuves écrites, avant d’aborder dans une deuxième partie les épreuves orales, et de conclure dans une envolée lyrique sur la troisième mi-temps qui s’annonce. (ça c’est du plan, n’est-il pas?)

Les écrits

Ils se sont déroulés à la mi avril. Les sujets en interne étaient :

  • pour la dissertation (5h) : “Quel sens l’érudition peut-elle avoir aujourd’hui ?”
  • pour la note de synthèse (4h) : un dossier sur la musique en bibliothèque : “En matière musicale, l’offre des bibliothèques est-elle le reflet de la préoccupation des publics ?”.

La note de synthèse

Je n’ai pas conservé mes brouillons mais voici ce qui surnage de mes souvenirs. Le dossier était assez facile à traiter, et un axe de lecture était clairement suggéré (offre vs “préoccupation” des publics). Les documents étaient plutôt anciens (une dizaine d’années), mais cela n’a pas d’incidence sur ce genre d’exercice, où il faut à tout prix éviter d’insérer des idées ne figurant pas dans le dossier. J’ai très peu traité un ou deux documents que j’arrivais pas à caser dans mon plan, notamment un texte de l’ACIM peu compréhensible, et un article du BBF écrit – ô surprise – en langue BBF.

En gros, j’ai dégagé

1/ la crise d’un ancien modèle

a/ définition de cet ancien modèle (les “discothèques” séparées du reste de la bibliothèque, centrées sur le disque etc)

b/ pourquoi est-il en crise (notamment parce qu’il n’est plus adapté aux “préoccupation des publics”)

2/ vers un nouveau modèle

a/ des efforts d’adaptations de l’offre aux préoccupations des publics

b/ mais lents et pas encore suffisants

Oui, on ne peut pas faire plus bateau, mais en 4h à moins d’être un génie ou un pro de la lecture rapide, il ne faut pas s’amuser à chercher midi à 14h ! L’essentiel est d’avoir un plan cohérent et équilibré, qui réponde à une problématique pas trop farfelue, et d’y caser toutes les idées principales du dossier, la plupart des idées secondaires, et un ou deux exemples.

Pour ceux qui voudraient tenter ce concours, il faut éviter de formater la note comme on le ferait pour un concours administratif (pas de timbre, pas de destinataire etc). Il faut faire une introduction et une conclusion, et ne pas titrer les parties. Enfin, on ne plaisante pas avec le respect de la longueur imposée (4 pages) et l’équilibre des parties et sous-parties (petite astuce : faire des marques au crayon de papier sur la copie pour ne pas se laisser déborder par son inspiration…)

La dissertation

Un érudit 100% pur humaniste

Erasme par Holbein le jeune : garanti 100% érudit humaniste

Au concours de conservateur territorial, en interne, le sujet de culture générale portait sur les politiques culturelles des 40 dernières années. Le sujet du concours d’Etat était très différent, puisqu’il nous invitait à réfléchir sur la notion d’érudition et son sens aujourd’hui. Autrement dit, il demandait moins de connaissances culturelles “précises” et laissait je pense plus de marge de manoeuvre aux candidats. Plutôt le genre de sujet que j’apprécie.

Sans refaire la dissert, une erreur aurait sans doute été de considérer l’érudition comme un vague synonyme de “culture générale”. D’autre part l’érudition est plutôt caricaturée dans la société d’aujourd’hui, mais cela n’a pas toujours été le cas. Ma thèse a été de montrer que l’érudition est “en crise” depuis plusieurs siècles. Les premiers humanistes faisaient preuve d’érudition (disons d’une culture à la fois large et très approfondie reposant sur l’étude de textes anciens et supposant des connaissances linguistiques et une méthode critique) pour connaître l’histoire, la littérature, les arts et les sciences. Mais le XVIIe et le XVIIIe siècles marquent je pense un repli de l’érudition sur la connaissance proprement historique. J’ai cité Descartes tentant de refonder la science sur une base an-historique (la méthode, les mathématiques, l’expérimentation…). Mais même dans le domaine de l’histoire, si l’érudition a été fondamentale (de Mabillon à l’école méthodique du XIXe), et reste appréciée, elle n’est plus la qualité première d’un historien, qui ne peut pas se contenter d’établir naïvement des “faits” à partir de documents. Enfin, j’ai défini l’érudition comme une sorte de “passion pour la constitution et le partage du savoir”, qui pouvait prendre des formes nouvelles aujourd’hui, notamment avec Wikipédia (avec une forme d’investissement personnel plus “éparpillé” qu’autrefois, sur des sujets souvent moins “nobles”, mais je pense que l’analogie peut se défendre)

Pour aller plus loin, la définition de l’érudition dans le Trésor de la langue française : sens A : “Pratique d’une méthode consistant à rassembler des documents nombreux et souvent exhaustifs autour d’une recherche” ; sens B :Connaissances accumulées par l’emploi de cette méthode.”. Le TLF cite plusieurs emplois péjoratifs : “fausse érudition” (ce qui laisse entendre que la vraie érudition peut avoir un sens), “poussiéreux travaux d’érudition”.

Pour Wikipédia, “L’érudition désigne une grande étendue de savoir conférant une connaissance profonde et étendue en littérature, en philologie, résultant le plus souvent de l’étude et de la lecture étendue des documents consacrés au sujet plutôt qu’à des études scolaires.”

Enfin, je découvre l’intéressant article de l’Encyclopédie, écrit par D’Alembert : “Ce mot, qui vient du latin erudire, enseigner, signifie proprement & à la lettre, savoir, connoissance ; mais on l’a plus particulierement appliqué au genre de savoir qui consiste dans la connoissance des faits, & qui est le fruit d’une grande lecture. On a réservé le nom de science pour les connoissances qui ont plus immédiatement besoin du raisonnement & de la réflexion, telles que la Physique, les Mathématiques, &c. & celui de belles-lettres pour les productions agréables de l’esprit, dans lesquelles l’imagination a plus de part, telles que l’Eloquence, la Poésie, &c. L’érudition, considérée par rapport à l’état présent des lettres, renferme trois branches principales, la connoissance de l’Histoire, celle des Langues, & celle des Livres.”

A la fin du XVIIIe siècle, l’érudition se distingue donc couramment de la “science” et des arts. Cela me rassure, vu que j’ai évoqué cette idée dans ma 1re partie ;-)

Les oraux

En interne comme en externe, l’oral comprend trois épreuves : langue étrangère, culture générale, entretien sur la motivation professionnelle.

L’épreuve de langue

L’épreuve de langue est très légère en interne, puisqu’il s’agit de traduire un texte d’une dizaine ou d’une quinzaine de lignes, avec l’aide d’un dictionnaire, puis de discuter en français avec le jury (sur des points de traduction et de civilisation). Dans son dernier rapport, le jury semble souhaiter que les exigences linguistiques soient renforcées pour les internes. Je serais assez d’accord : on pourrait ne maintenir qu’une seule langue (contre deux en interne), mais en faire une véritable épreuve, ce qui implique une conversation dans la langue souhaitée.

J’avais choisi l’anglais, et j’ai eu à traduire un texte du journal the Independant sur la critique faite par le maire de Londres au gouvernement Cameron, coupable de “mollesse” envers les syndicalistes anglais, en particulier ceux du métro. En filigrane, on percevait les ambitions nationales de Boris Jonhson. Rien à dire, sinon que j’ai appris que le métro de Londres était beaucoup plus profond que le métro parisien.

Le jury m’a demandé de lire le texte, ce qui n’est apparemment pas systématique. Quelques légères difficultés : traduire : backbenchers (j’ai traduit par “parlementaires de base” mais il n’y a pas d’équivalent exact en français), traduire le titre (la traduction littérale me semblait très lourde en français. J’ai reformulé, le jury m’a demandé ensuite la raison de mes choix). J’ai failli buter sur le faux ami “to curb”. Dans le contexte, j’ai traduit “union members” par “travailleurs syndiqués” plutôt que par un simple “syndicalistes”. Enfin ma traduction de “clampdown” était assez alambiquée. Le jury m’a demandé la signification de “clamp” tout court, que j’ignorais.

Voici le texte :

Boris : toughen up union strikes rules

By: David Hughes

Tories have demanded a clampdown on trade unions in a show of “Thatcherite zeal” aimed at stopping a wave of industrial unrest.
Mayor of London Boris Johnson is backing calls for tough laws to make it harder to call strikes.

London Mayor Boris Johnson and backbench MPs want tough laws to make it harder to call strikes in an echo of Baroness Thatcher’s campaign to curb union powers in the 1980s. Mr Johnson said it was “farcical” that a strike could be called with the backing of just a fraction of union members eligible to vote.

A recent report by the Conservative group on the London Assembly said Tube strikes in the capital cost the economy £48 million a day, estimating that industrial action between 2005 and 2009 cost £1 billion.

Mr Johnson told The Sun: “The idea that a strike can be called by a majority of those that vote, rather than a majority of all those balloted, is farcical. It often results in a strike backed by just one in 10 union members, antagonising millions of commuters in the process and costing London and the UK billions every year. I’d urge the Government to act with some Thatcherite zeal and at the very least legislate against strikes supported by less than half of all union members.”

The call for new laws making it illegal to take action without the support of more than 50% of members follows unions raising the prospect of a general strike in protest at the Government’s austerity measures.

 L’entretien de culture générale

Le texte à commenter était un extrait du discours de réception de Simone Veil à l’Académie française par Jean d’Ormesson. Le discours complet est consultable sur le site de l’Académie. L’extrait ne comprenait que les premiers paragraphes, où J. d’Ormesson évoque Racine et quelques figures plus ou moins oubliées. La carrière de Simone Veil n’y est pas développée, mais simplement évoquée en quelques mots. J’ai donc centré le commentaire sur l’institution elle même, profondément traditionnelle (par son héritage et son fonctionnement), et sur le portrait des académiciens esquissé par l’auteur (quelques grands auteurs, beaucoup d’anonymes, quelques grandes figures, et une ouverture tardive aux femmes). Mon commentaire était assez vasouilleux, mais la discussion avec le jury s’est bien passée et m’a sans doute permis de corriger le tir.

Les questions liées au texte ont porté sur :

- l’Académie

- l’Institut de France (combien d’Académies ? expertise scientifique de l’Académie des Sciences que l’on ne retrouve pas dans les autres Académies)

- le comportement des Académiciens pendant et après la guerre : Pétain et Maurras furent condamnés à l’indignité nationale, mais leurs sièges furent laissés vacants jusqu’à leur mort. Ainsi, en 1953, Pierre Benoît fut élu au fauteuil de Pétain et prononça comme le veut la tradition l’éloge de son prédécesseur, en concédant que “Le Maréchal Pétain a tracé dans notre histoire des pages dont les unes demeurent lumineuses et dont les autres prêtent à des interprétations qui se heurtent encore et suscitent des passions toujours vives”

- le caractère “républicain” de l’Académie (auquel l’auteur faisait allusion). J’ai soutenu que ce n’était qu’un vernis, son histoire et son recrutement par cooptation en faisant plutôt un héritage de l’Ancien Régime. Mais on m’a fait remarquer que c’est le président de la République qui patronne l’Académie. Les détails sont exposés ici

- Henri de Régnier, évoqué dans le texte. Je ne connaissais pas

- Albert de Mun, idem. Je l’ai confondu avec Marc Sangnier, mais je me suis repris in extremis

- Xavier Darcos (récemment élu contre A. Compagnon)

- les intellectuels (parce que j’avais dit que certains Académiciens ne le sont pas vraiment…)

Les questions “libres” ont portés sur :

- le bloc de constitutionnalité

- la Convention européenne des droits de l’homme

- la fracture numérique

- le livre récemment commis par A. Minc sur Bousquet et Jean Moulin

- le film Lacombe Lucien de Louis Malle (que je n’ai pas vu…) et son co-scénariste, l’écrivain Modiano

- et enfin, qui je placerais à l’Académie Française et au Panthéon si j’en avais le pouvoir

L’entretien sur la motivation professionnelle

Le texte à commenter était un article du Monde consacré aux inégalités salariales entre hommes et femmes, et aux mesures prévues par la loi du 9/11/2010 pour contraindre les entreprises à élaborer des plans afin de les corriger. J’ai replacé cette mesure dans le cadre plus général des luttes contre les discriminations (loi de 2005). Après avoir détaillé les objectifs de la loi de 2010 et sa mise en application, j’ai indiqué que d’autres actions seraient nécessaires et possibles pour aller plus loin dans l’égalité entre hommes et femmes au travail.

Je pense avoir plutôt bien commenté le texte, ce qui ne m’a pas empêché d’avoir une note très faible… Cela confirme en tout cas ce que le jury écrit dans le dernier rapport : dans cette épreuve, le commentaire compte beaucoup moins que l’entretien. Je pense également que, comme dans les concours ITRF, le jury profite de cette épreuve pour classer les candidats plutôt que pour “évaluer” leur qualité supposée. Autrement dit, il est sans doute assez facile d’avoir une très bonne note si le jury a clairement envie de travailler avec vous, ou une très mauvaise dès qu’il a un doute. Mais il faudrait en parler avec le jury pour confirmer cette impression…

Le jury m’a posé quelques questions sur le texte et le thème de l’égalité hommes / femmes :

- Quels sont les dispositifs concrets (non cités dans le texte) qu’une entreprise peut détailler dans un plan, pour se conformer à la loi de 2010 ? Je n’ai pas répondu de manière très précise…

- Si les hommes prennent plus de congés parentaux, est-ce que cela ne va pas nuire à leur carrière? Question posée par un homme ;-)

- Et la fonction publique dans tout ça? Pour moi l’égalité salariale entre personnes chargées de la même tâche est réglée par le régime statutaire, mais pas l’égalité dans la progression des carrières, et l’accès à des postes de direction.

- Quel organe dans une Université pourrait avoir à discuter des primes, des horaires de travail, etc? J’ai évoqué le comité technique

Le jury ne m’a posé que très peu de questions directes sur mon parcours (il avait mon dossier RAEP) : pourquoi avoir quitté l’enseignement (il y a 7 ans environ) ? pourquoi avoir commencé ma carrière dans un IUFM ? En quoi consiste le service d’informatique documentaire dans mon établissement actuel? Il ne m’a posé aucune question concrète sur mon travail, ni sur les documents que j’avais joints au dossier RAEP, ce qui m’a plutôt surpris.

Les principales questions “personnelles” furent :

- mon départ de l’enseignement. Je pensais avoir bien présenté les choses, mais cela n’a peut être pas convenu au jury.

- la différence entre bibliothécaire et conservateur.

- quel serait mon “style de management” (j’ai été peut être un peu confus, faisant l’éloge de la communication interne dans les organisation au lieu de répondre clairement à la question. J’aurais dû répondre “le management par la peuuuur”, ça aurait eu le mérite d’être clair!)

- si j’étais attiré par le patrimoine (à cause de mon cursus). J’ai essayé de montrer que oui, pour ne pas passer pour le geek de service.

- pourquoi j’avais conclu mon dossier RAEP en envisageant mon avenir comme responsable d’un service informatique? J’aurais sans doute dû être plus “ouvert” au lieu d’insister sur ce point…

- la question-peau-de-banane : “Que pensez-vous de la situation de la bibliothèque [biiiip] ?”. Lors de la discussion, j’ai évoqué une bibliothèque, ce qui a fait réagir l’inspectrice des bibliothèques présente dans le jury, qui m’a demandé mon avis sur sa situation. J’ai sans doute manqué de diplomatie en évoquant surtout des points négatifs, ce qui a pu faire conclure au jury que j’aurais mal vécu une affectation dans cet établissement.

Bref, au final, une sale note, sans doute à cause de quelques maladresses lors de l’oral et dans mon dossier, mais je ne saurais pas en dire plus, ce qui est un peu frustrant!

Et maintenant?

Je viens de recevoir les papiers de l’ENSSIB : la scolarité débute le 6 janvier et dure 18 mois (oui, ce n’est pas un scoop ;-) ). Je vais donc continuer de sévir à Rennes 2 jusqu’en décembre.

Et, tant qu’on y est, si vous libérez un grand studio ou un F2 sympa à Villeurbanne ou Lyon en janvier, je suis preneur!

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bilan d’étape

Voici trois mois jour pour jour que j’ai débarqué à Villeurbanne pour y suivre la formation initiale des bibliothécaires d’Etat. Autrement dit, dans trois mois, adieu quenelles, saucisson et tarte à la pralines! Car depuis cette année, la formation ne dure plus que six mois, à l’issue desquels les bibliothécaires rejoignent leur lieu d’affectation (l’université de Rennes 2 en ce qui me concerne).

Quenelles de brochet

Quenelles de brochet (posté sur Flickr par stu_spivack sous licence cc-by-sa 2.0)

Quel meilleur moment pour un petit bilan ?

Je n’ai rien publié sur ce blog depuis septembre. Certes, je n’avais jamais été très assidu, mais ce silence commence à être long. D’autant que, pendant cette période, j’ai été assez bavard sur Twitter… Mais il s’agit de deux outils complémentaires, aux logiques différentes. Twitter ne me permet pas de développer une réflexion construite, ni de rendre compte d’une expérience un tant soit peu complexe comme j’ai pu essayer de le faire par le passé dans certains billets de blog. Par contre, c’est un outil précieux pour formuler quelques remarques générales, s’informer des projets des uns et des autres, échanger rapidement des informations, et lancer quelques blagounettes plus ou moins bibliothéconomiques. Je suis encore plus Twittodépendant depuis que j’ai troqué mon brave Nokia pour un HTC qui me permet enfin de surfer partout et n’importe quand (je ne sais pas comment j’ai pu m’en passer si longtemps!).

Donc, pas de nouveau billet depuis un bon bout de temps. Pourtant ce ne sont pas les idées qui manquent, mais en cette période de transition j’ai l’impression d’avoir deux ou trois morceaux de cerveau qui ont du mal à se connecter :

  • Demain il me faudra – avant tout – administrer un SIGB et réfléchir à des projets informatiques innovants. Mais j’ai beau m’y intéresser dès maintenant, tant que je n’aurai pas pris mon poste et que je n’aurai pas les deux mains dans le cambouis, cela restera assez théorique pour moi.
  • Hier, j’achetais et je traitais des livres, je participais à l’accueil, à l’information et à la formation des étudiants. Mon identité professionnelle s’était peu à peu cristallisée autour des problématiques liées au catalogage. Or, on ne peut pas vraiment dire cette activité soit unanimement valorisée par la profession… ;-). Et après trois mois, j’ai déjà l’impression d’avoir perdu la main, oublié beaucoup de choses, être déconnecté des débats et des évolutions en cours. Alors, que faire des connaissances et des compétences (beurk, je cause comme à l’IUFM…) liées au traitement des documents ? Passer un coup de chiffon définitif, ou bien les intégrer à mes nouvelles fonctions, mais en prenant un peu de hauteur, en changeant de point de vue ? A la manière de présenter les choses, on comprendra quelle solution a ma préférence… J’ai du mal à admettre que tout ce que j’ai pu apprendre deviennent subitement et totalement inutile. Mais  je ne sais pas trop ce qu’il adviendra : peut-être que dans un an ou deux tout cela sera vraiment de l’histoire ancienne pour moi…
  • Enfin, aujourd’hui, me voilà redevenu étudiant à plus de trente ans. J’attends deux fois par jour – avec des pleurs de joie indescriptibles – la sacro-sainte fiche d’émargement, et je prend – très sagement – des notes en écoutant des collègues évoquer la diversité des publics, la médiation numérique, la communication, les innovations, la gestion de projet, la réinformatisation, etc etc. Bref, tout cela est intéressant, mais la plupart des sujets ne peuvent être qu’évoqués assez rapidement à mon goût.

La formation est en effet très brève, si l’on songe qu’elle vise à former des cadres. Mais la durée étant fixée par décret, l’école n’est pas libre de la modifier… Je pense que le recrutement hétérogène complique également la tâche des formateurs. Il faut à la fois donner un solide aperçu des bibliothèques à des étudiants qui n’y ont jamais travaillé, et permettre aux vrais et faux internes (majoritaires) d’approfondir leurs connaissances tout en sortant d’une vision parfois très technique ou très spécialisée du métier. Pas facile… Je tire mon chapeau au coordinateur ! Pour ma part, la plupart des cours m’ont intéressés, mais sans que j’y apprenne énormément de choses, à quelques exceptions près (comme le cours sur la réinformatisation ou l’interopérabilité des données, mais, promis, il y en a eu d’autres…). Ce que j’ai le plus apprécié, c’est que, le plus souvent, les intervenants se sont positionnés comme des collègues venant nous faire part d’une expérience et/ou d’une expertise, tout en faisant naître de véritables échanges avec notre groupe.

Bref, cela sera à nous de compléter et d’approfondir nos connaissances une fois en poste, en profitant de la formation continue - dont le financement est bien entendu une priorité absolue pour nos universités au bord de la faillite -, ou  plus probablement en nous débrouillant tout seuls comme des grands ;-).

Tout autant que les cours, et peut-être même plus, les contacts noués pendant cette formation me marqueront sur la durée. Mélanger internes et externes est sans doute complexe sur le plan pédagogique, mais extrêmement enrichissant. Etudiant(e)s tout frais sorti de l’école, BAS aguerri(e)s, anciens profs, anciennes salariés de l’édition ou des musées, féru(e)s de cuisine, de communication, de webdesign (plutôt classe non?), d’anthropologie urbaine, de vampires… Il est rare de pouvoir rencontrer autant de personnes si différentes et pourtant animées par une passion commune, le babyfoot les bibliothèques.

babyfoot

Que serait l'Enssib sans son babyfoot ? (posté sur Wikimedia Commons par Jean-no, licence Artlibre)

C’est à tous ceux-là, et à tous les autres…, que je souhaite une très bonne année, aussi riche en epubs qu’en pubs , aussi remplie de découvertes que d’outils de découverte ! (Oui, je sais c’est mauvais, mais c’est sincère, si si…)

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Une fonction Javascript pour éliminer accents et diacritiques

Et pour quoi faire d’abord?

Le français est une langue qui s’accentue, se trématise, se cédille, et qui pousse le vice jusqu’à l’OdansleEïsation. Et notre alphabet est loin d’être le plus riche : crochets, barres obliques, points souscrits, ogoneks, doubles accents, lettres inversées et autres zigouigouis font le charme (et l’utilité) des alphabets exotiques. Prenez l’alphabet vietnamien, ou Quốc ngữ : ne serait-ce pas un crime d’en faire un vulgaire Quoc ngu ?

C’est pourtant ce qu’on est parfois obligé de faire pour utiliser certains outils informatiques qui digèrent mal les accents et autres diacritiques, et ne supportent que les fades caractères ASCII (127 caractères, sans aucun accent).

C’est justement le cas d’IdRef, du moins dans les index de type mot. Or je suis toujours en train de bricoler le script décrit dans le dernier billet, et je ne désespère pas d’obtenir quelque chose de présentable, mais pour ce faire, j’avais besoin d’une fonction dépouillant une chaîne de ses accents et diacritiques afin de construire une requête compréhensible par l’API d’IdRef.

Après quelques recherches, il m’a semblé qu’une telle fonction existait dans d’autres langages de programmation, mais pas en Javascript. Peut-être me suis-je trompé, mais en tout cas cela m’aura permis de découvrir plein de langues rigolotes rares. J’avais d’abord recopié une fonction trouvé sur un forum, mais elle ne me satisfaisait pas, car elle ne traitait que les 256 caractères les plus usuels (correspondant à l’ASCII étendu). J’ai donc essayé de construire une fonction qui puisse également traiter des caractères plus rares, et qui soit facilement paramétrable pour s’adapter à divers besoins.

Pour ne rien vous cacher, ma fonction s’avère finalement inadaptée à IdRef, du moins dans son état actuel (je reviendrai sur le sujet), mais elle peut être reprise dans d’autres contextes et modifiée pour répondre à des besoins différents.

Le code de la fonction est en ligne ici. Je la recopie sans les commentaires initiaux:

Sous le code, l’unicode…

Comment ça marche ?

Concrètement, nous avons besoin d’une fonction qui transforme une chaîne telle que “œil école Điện słowiańskie” en “oeil ecole Dien slowianskie” (c’est du franco-polono-vietnamien), et plus généralement les 526 caractères “ªÁáÀàĂăẮắẰằẴẵẲẳÂâẤấẦầẪẫẨẩǍǎÅåǺǻÄäÃãĄąĀāẢảȀȁȂȃẠạẶặẬậḀḁÆæǼǽẚȺḂḃḄḅḆḇĆćĈĉČčĊċÇçḈḉȻȼĎďḊḋḐḑḌḍḒḓḎḏĐđÐðDZDzdzDŽDždžÉéÈèĔĕÊêẾếỀềỄễỂểĚěËëẼẽĖėȨȩḜḝĘęĒēḖḗḔḕẺẻȄȅȆȇẸẹỆệḘḙḚḛḞḟƒǴǵĞğĜĝĠġĢģḠḡĤĥḦḧḢḣḨḩḤḥḪḫẖĦħÍíÌìĬĭÎîǏǐÏïḮḯĨĩİĮįĪīỈỉȈȉȊȋỊịḬḭIJijıĴĵḰḱĶķḲḳḴḵĹ弾ĻļḶḷḸḹḼḽḺḻŁłĿŀLJLjljȽḾḿṀṁṂṃŃńǸǹŇňÑñṄṅŅņṆṇṊṋṈṉNJNjnjºÓóÒòŎŏÔôỐốỒồỖỗỔổǑǒÖöȪȫŐőÕõṌṍṎṏȬȭȮȯȰȱØøǾǿŌōṒṓṐṑỎỏȌȍȎȏƠơỚớỜờỠỡỞởỢợỌọỘộŒœṔṕṖṗŔŕŘřṘṙŖŗȐȑȒȓṚṛṜṝṞṟŚśṤṥŜŝŠšṦṧṠṡŞşṢṣṨṩȘșſẛßẞȿŤťẗṪṫŢţṬṭȚțṰṱṮṯŦŧȾÚúÙùŬŭÛûǓǔŮůÜüǗǘǛǜǙǚǕǖŰűŨũṸṹŲųŪūṺṻỦủȔȕȖȗƯưỨứỪừỮữỬửỰựỤụṲṳṶṷṴṵṼṽṾṿẂẃẀẁŴŵẘẄẅẆẇẈẉẌẍẊẋÝýỲỳŶŷẙÿŸỸỹẎẏȲȳỶỷỴỵŹźẐẑŽžŻżẒẓẔẕɀÞþ”

en leur équivalent simple : “aAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAeaeAeaeaABbBbBbCcCcCcCcCcCcCcDdDdDdDdDdDdDdDdDZDZdzDZDZdzEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeFffGgGgGgGgGgGgHhHhHhHhHhHhhHhIiIiIiIiIiIiIiIiIIiIiIiIiIiIiIiIJijiJjKkKkKkKkLlLlLlLlLlLlLlLlLlLJLjljLMmMmMmNnNnNnNnNnNnNnNnNnNJNjnjoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOeoePpPpRrRrRrRrRrRrRrRrRrSsSsSsSsSsSsSsSsSsSsssssSSsTttTtTtTtTtTtTtTtTUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuVvVvWwWwWwwWwWwWwXxXxYyYyYyyyYYyYyYyYyYyZzZzZzZzZzZzzThth”

Il faut savoir qu’en Javascript et dans tous les outils modernes, les chaînes de caractère sont encodées en Unicode, standard qui attribue à chaque caractère un nom, et surtout un identifiant unique codé au maximum sur 21 bits. Pour les caractères es plus usuels (et donc pour les langues qui nous intéressent), le codage se fait  sur 16 bits, c’est à dire deux octets, soit 65536 caractères possibles.

Pour assurer une compatibilité avec les standards “préhistoriques”, les 256 premiers caractères correspondent aux caractères ASCII (pour la tranche 0-127) et aux caractères ISO 8859-1 (pour la tranche 128-255). Il faut juste ajouter un octet égal à 00 avant celui qui contient la valeur du caractère en ASCII ou en 8859-1. Le codepoint U+0065 correspond ainsi au caractère “e” (65 en ASCII, valeur hexadécimale), et le codepoint U+00E9 correspond au caractère “é” (E9 en ISO 8859-1, valeur hexadécimale).

Au delà, les caractères Unicode n’ont pas d’équivalent en ASCII ou en ISO 8859-1. C’est le cas par exemple du caractère “ł” utilisé en polonais, codé 0141 et dénommé “LATIN SMALL LETTER L WITH STROKE”.

Certains caractères sont des modificateurs : il y a souvent deux manières de coder une lettre modifiés par un diacritique : en utilisant un caractère unique comme U+00E9 pour “é” ou U+00F1 pour “ñ”, ou en saisissant à la suite un caractère de base (par exemple U+006E  pour “n”) et un ou plusieurs modificateurs (par exemple U+0303 = “◌̃”).

Enfin, certains caractères unicode sont des ligatures de plusieurs lettres simples, comme “œ”, qui représente “oe” en français.

Nous avons donc besoin d’une fonction qui :

  1. élimine les caractères modificateurs. Ex : n◌̃ –> n
  2. remplace tout caractère modifié par un diacritique par son équivalent simple. Ex : é –> e
  3. résolve les ligatures. Ex : œ –> oe
  4. ne s’intéresse qu’aux caractères latins, ignore les alphabets non latins (grec, cyrillique, arabe, hébreu, coréen…), et les écritures non alphabétiques (chinois…).
  5. et plus précisément soit valable pour le français, les langues européennes modernes, quelques langues exotiques (notamment le Vietnamien),  mais sans nécessairement prendre en compte les langues mortes ou rarissimes (alphabets expérimentaux africains, etc.), ni les caractères utilisés dans l’alphabet phonétique international, ce qui ne servirait qu’à ralentir le script

Fausse piste

L’élimination des modificateurs ne pose pas de problèmes : ils sont regroupés dans des “blocs” Unicode qu’il suffit de cibler, essentiellement le bloc “Combining Diacritical Marks” (U+0300–U+036F), et le bloc des suppléments (U+1DC0-U+1DFF). On peut facilement éliminer tous ces caractères en utilisant une fonction “replace”.

Le reste est un peu plus délicat : on peut récupérer sur le site du consortium Unicode un fichier listant tous les caractères, et qui indique les règles de “décomposition” d’un caractère complexe. La ligne

00EB;LATIN SMALL LETTER E WITH DIAERESIS;Ll;0;L;0065 0308;;;;N;LATIN SMALL LETTER E DIAERESIS;;00CB;;00CB

signifie que le caractère U+00EB dénommé “LATIN SMALL LETTER E WITH DIAERESIS” (ë) peut se décomposer en U+0065 (e) + U+0308 (¨), et que son équivalent en majuscule est U+00CB.

Je pensais utiliser ce fichier, mais il n’est malheureusement pas assez précis. Certains caractères que l’on peut légitimement considérer comme composés ne sont pas signalés comme tels. C’est le cas notamment du l barré polonais :

0141;LATIN CAPITAL LETTER L WITH STROKE;Lu;0;L;;;;;N;LATIN CAPITAL LETTER L SLASH;;;0142;

Tout ce que donne le fichier c’est un équivalent en majuscule…

Tripatouillage tabulé

J’ai donc privilégié une autre piste : recopier dans un fichier tabulé tous les caractères qui m’intéressaient, en utilisant les tableaux disponibles par wikipédia (mais les mêmes données sont aussi sur le site d’unicode) dans les pages décrivant les principaux blocs de caractères latins, et exploiter le nom de chaque caractère pour en déduire avec quelques formules son équivalent simple. Par exemple, “LATIN CAPITAL LETTER L WITH STROKE” désigne un L majuscule modifié par une barre. Son équivalent simple est donc “L”.

D’autre part, j’ai fait une sélection dans ce fichier pour ne pas tenir compte de quelques caractères extrêmement rares ou obsolètes, et surtout de lettres “exotiques” qui bien que faisant partie en théorie de l’alphabet “latin” au sens large, n’ont pas d’équivalent strict dans la série [a-z] : “glottal stop”, “whynn” et autre “kra” (utilisé en Inuit)…

Les caractères conservés ont été recopié dans une nouvelle feuille de calcul, puis à l’aide d’un tableau croisés dynamique assorti de quelques formules de concaténation et de remplacement, j’ai pu obtenir une série d’expressions de ce genre :

['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

Ensuite, il me suffit de remplir un array Javascript avec toutes ces expressions :

[
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

['Z',/[\u0179\u017B\u017D\u1E90\u1E92\u1E94]/g], // Z
]

et de passer les éléments tableau en argument à une fonction “replace”.

J’ai travaillé dans Excel, mais j’ai recopié le fichier tabulé dans Google Docs (il a fallu refaire les tableaux dynamique, les filtres, etc.). Il est consultable ici.

Un traitement en deux étapes

Je me suis aperçu que ma fonction risquait de trop ralentir le script, même si ça se compte en millisecondes.

Donc, dans la mesure où dans 9 cas sur 10, les mots récupérés dans un catalogue de bibliothèque français ou dans IdRef ne comprennent que des caractères “ordinaires” (entendez par là, codés sur un octet), j’ai repris mon fichier tabulé pour créer deux autres onglets : un qui traite les caractères codés sur un octet (+3 caractères sur deux octets que l’on peut trouver en français :Ÿ Œ œ), et un second qui traite tous les autres caractères.

On peut donc faire un premier tableau javascript traitant les lettres susceptibles d’être rencontrées en français :

['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5]/g], // a

et un second pour les lettres plus rares :

['a',/[\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

A l’issu de la première phase du traitement, si on ne détecte aucun caractère codé sur deux octets, on peut sortir de la fonction. Dans le cas contraire, la fonction peut approfondir l’examen de la chaîne à traiter.

Finalement…

La fonction traite :

  1. tous les caractères latins codés sur 1 octet en Unicode (blocs C0 Controls and Basic Latin, also called Basic Latin et C1 Controls and Latin-1 Supplement), dont les lettres islandaises  Thorn et Eth, remplacées par “Th” et “D” (choix qui n’a aucune valeur officielle…)
  2. une sélection de caractères codés sur 2 octets en Unicode :

En plus des caractères modifiés par des diacritiques, elle “résout” les ligatures et digrammes suivants : SS/ss ; ae/Ae ; Oe/oe ; IJ/ij ; DZ/Dz/dz ; NJ/Nj/nj ; LJ/Lj/lj

Elle ne traite pas :

  1. les caractères de l’alphabet phonétique international, du bloc Latin Extended-C 2C60–2C7F et du bloc Extended-D A720–A7FF.
  2. les lettres “exotiques” qui bien que faisant partie de l’alphabet “latin” au sens large, n’ont pas d’équivalent strict dans la série [a-z] : “glottal stop”, “whynn”, “kra”, etc., sauf Eth et Thorn

Quelques remarques :

  • En Unicode, les umlaut allemands sont considérés comme des trémas -> ä, ü et ö deviennent a, u, o et non ae, ue, oe
  • O et o barré sont remplacés par O et o, mais on pourrait les transcrire également par Oe/oe
  • les d/D barrés sont transcrits d/D : normal en Vietnamien, mais ils sont usuellement transcrit par Dj dans les langues balkaniques
http://unicode.org/charts/PDF/UA720.pdf
Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bricolons un peu avec IdRef…

[Note du 1er septembre 2011 : le script décrit dans ce billet a été légèrement modifié depuis. Je travaille à d'autres changements qui feront l'objet d'un prochain billet]

Cela ne saute sans doute pas aux yeux de nos lecteurs, mais l’un des manques du catalogue (HIP = Horizon information portal) de ma bibliothèque est l’absence d’import des autorités du Sudoc.

Pour parler français, lorsque dans le Sudoc il existe une fiche détaillant les différentes identités d’une personne (par exemple “Stendhal” = “Henri Beyle”, etc.) ou les (quasi-)synonymies entre certains concepts (par exemple “philosophie des arts” = “esthétique”), nous ne récupérons toujours que la forme de référence (Stendhal, esthétique).

Du coup, une recherche sur Henri Beyle ou Georges Rémi ne donnera rien, ou si peu, dans notre catalogue.

La solution idéale serait de changer de catalogue, mais comme ce n’est pas le genre de chose qui se fait en claquant des doigts, cela nous laisse le temps d’essayer de bricoler un peu.

Quand l’ABES a annoncé le lancement d’IdRef, j’ai tout de suite pensé qu’on pourrait utiliser cette application pour enrichir notre catalogue avec les autorités du Sudoc. J’ai d’ailleurs trouvé la même idée dans ce billet de Bibliothèques [reloaded]:

Exemple : (hypothèse de départ) mon opac permet d’afficher un message spécifique si l’internaute trouve 0 résultat. S’il y a 0 résultat, l’opac va interroger les autorités Sudoc, et trouver que les mots recherchés correspondent à une forme rejetée d’une notice d’autorités (exemple typique lié à des questions de translittération). Il récupère alors la forme retenue (celle qui est effectivement présente dans mes notices bibliographiques) et le propose comme rebond de recherche à l’internaute (rebond de recherche sur ma base, toujours).

Mais comme cela impliquait d’explorer à fond la syntaxe d’IdRef, et de se plonger la tête la première dans le javascript et/ou le php, je ne me suis pas senti pressé, vu que je n’ai jamais écrit un script fonctionnel de plus de 20 lignes jusqu’à présent. ;-)

Je ne sais pas si je dois remercier la météo, mais j’ai fini par m’attaquer au morceau au début de mes vacances… Le résultat est ce fichier javascript (700 lignes, mais beaucoup de blabla…) qui pourra se charger (bouton vert Install) dans Google Chrome sans autre forme de procès, ou bien dans Firefox après avoir au préalable installé l’extension Greasemonkey.

Le fonctionnement de mon script ne correspond pas exactement à la suggestion de Lully : la recherche dans IdRef est faite systématiquement, et pas seulement lorsque notre catalogue ne ramène aucune réponse.

Tout cela est très expérimental, et ne saurait être présenté à des lecteurs en l’état actuel. Mon but était avant tout de voir si cette idée pouvait avoir un début d’application, et quelles en étaient les limites (et accessoirement d’apprendre à programmer en javascript! D’ailleurs, il serait judicieux de rédiger une partie du code en php, mais c’est une autre histoire…)

La recherche simple

Le script ajoute aux pages de recherche simple et avancée de notre catalogue un nouveau panneau intitulé “Essai d’ajout de fonctions avec Greasemonkey“, qui présente plusieurs options.

nouveau panneau dans l'opac

nouveau panneau dans l'opac

Lors d’une recherche simple sur “Beyle”, en gardant les options par défaut, le nouveau panneau nous indique :

  • l’URL utilisée pour faire la requête dans idref : http://www.idref.fr/Sru/Solr?q=all:%22beyle%22&start=&rows=15&wt=json&fl=affcourt_z
  • l’index utilisé : “all” (on le retrouve dans l’URL)
  • le nombre de réponses trouvées : 5
  • le nombre de formes alternatives conservées : 1
  • l’url permettant d’avoir le résultat final dans notre catalogue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=%28beyle%20or%20stendhal%29&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims
recherche de Beyle

recherche de Beyle

Dans cet exemple précis, le script a trouvé 5 formes correspondant à Beyle dans IdRef (dont la dernière serait sans doute à corriger…) : “Beyle, Thad L. (1934-)”, “Beyle, Paul”, “Beyle, Pauline (1786-18..)”, “Stendhal (1783-1842)”, “Stendhal, Henri Beyle (1783-1842). Vie de Henry Brulard”.

Un peu de nettoyage

Mais toutes les formes commençant par “Beyle” ne nous sont pas très utiles, puisqu’elles ne font que reprendre notre terme de recherche. De plus, si l’on réinjecte ces expressions dans le catalogue, la présence des parenthèses va gravement perturber la recherche (c’est un défaut de HIP que j’ai découvert à cette occasion… :-( ). Il est donc nécessaire de “nettoyer” les formes obtenues, avant de les comparer avec la forme saisie par l’usager.

Par défaut, le script supprime donc tout ce qu’il trouve après la virgule, ce qui nous donne  : “Beyle”, “Beyle”, “Beyle”, “Stendhal, “Stendhal”, et ne garde que les formes nouvelles. En l’occurrence, il n’y en a qu’une : “Stendhal”.

Il est possible de modifier ce fonctionnement en cochant le bouton “”supprime les parenthèses uniquement”. Dans ce cas les prénoms sont conservés. Cela génère une équation de recherche plus fine, mais aussi plus lourde. On peut faire l’essai en cliquant à nouveau sur “Chercher”.

recherche de Beyle en changeant une option

recherche de Beyle en changeant une option

L’URL de recherche dans IdRef est la même, mais l’URL pour HIP est beaucoup plus longue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=(beyle%20or%20%22beyle%2C%20thad%20l.%22%20or%20%22beyle%2C%20paul%22%20or%20%22beyle%2C%20pauline%22%20or%20stendhal%20or%20%22stendhal%2C%20henri%20beyle%20.%20vie%20de%20henry%20brulard%22)&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims

Cela fonctionne de la même manière avec les expressions entre guillemets, qu’il faudra saisir bien de manière conforme à la structure des vedettes (“Blair, Eric” par exemple (avec la virgule!), et non “Eric Blair” pour obtenir la forme d’autorité, à savoir “Orwell, Georges”).

La recherche avancée

De même, on peut utiliser la recherche avancée, dont les champs seront “interprétés” avant d’être croisés les uns avec les autres (cela m’a demandé plus de travail, car il faut gérer plusieurs index, les opérateurs booléens, etc.)

Voici par exemple ce que donne une recherche (Auteur = beyle ET Sujet = beyle) :

Recherche Auteur Beyle et Sujet Beyle

Recherche Auteur Beyle et Sujet Beyle

L’URL pour HIP renvoit 26 réponses : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.AW&term=(beyle%20or%20stendhal)%20and%20.SW%3D(beyle%20or%20stendhal)&session=131EG779H4849.791973&menu=search&aspect=advanced&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=advanced&limitbox_1=&limitbox_2=&ultype=&uloper=%3D&ullimit=&ultype=&uloper=%3D&ullimit=&sort=&source=~!scdreims

On y trouve notamment la correspondance de Stendhal, puisque ce type d’ouvrage est indexé avec une vedette sujet au nom de l’auteur.

correspondance de Stendhal

correspondance de Stendhal

Quels index interroger dans IdRef  et avec quelle troncature?

Je n’ai pas évoqué l’option proposé concernant le “mode d’interrogation d’IdRef” : par défaut, on procède à une recherche “tous mots” dans IdRef, au moyen de l’index “all”. Mais cette recherche peut être parfois trop générale, et ramener trop de réponses. Par exemple, si vous cherchez “Michel” dans un catalogue, il y a des chances que ce soit le nom de famille de la personne (Louise Michel par ex.) qui vous intéresse, et pas son prénom! Mais vous pourrez injurier votre index tous mots tant que vous voudrez, jamais il ne vous fera le plaisir de distinguer les noms et les prénoms. Il renverra donc imperturbablement 17 607 réponses comportant le mot “Michel”. Difficilement exploitable…

Comme on ne peut malheureusement pas faire des recherches par noms de famille dans IdRef (comme je l’expliquais dans le billet précédent), j’ai eu recours à un expédient : utiliser les index de type “phrase”, qui sont alimentés par le contenu entier et exact des zones indexées, et non par les mots qui les composent. Concrètement (j’espère que je ne dis pas de bêtises), en explorant les index de type mot d’IdRef, on peut accéder à l’autorité “Michel, Louise (1830-1905)” en cherchant “Michel”, “Louise, ” (1830-1905)”, “Michel, Louise”, “Michel, Louise (1830-1905)” et même “Louise (1830-1905)”!

Par contre, en explorant les index de type phrase, il faut impérativement saisir la forme complète et exacte de son nom : “Michel, Louise (1830-1905)”. Si l’on omet le prénom, ou même les dates, la réponse sera vide. Donc, si on veut trouver toutes les personnes dont le nom de famille est Michel, ou toutes les Louise Michel (quelque soit leur date de naissance), il faut utiliser une troncature.

(Je suis en train de réaliser qu’une armée de juges a dû rêver de troncaturer Louise Michel. Louise, si tu me lis, promis, ma troncature est pacifique…)

Louise Michel en 1871

Louise Michel en 1871

En cliquant sur “plusieurs index ‘phrase’ (avec les diacritiques ; troncature grossière)” on créera une équation de recherche assez longue, qui additionne tous les index de type “phrase” disponibles dans IdRef. J’étais curieux de voir si les résultats seraient différents, et effectivement, ils le sont parfois. Pour “Michel”, cette option permet de ne récupérer “que” 1090 réponses.

Je vais illustrer cette option par la recherche (Auteur Beyle et Sujet Beyle) que j’avais déjà commenté plus haut.

recherche Auteur Beyle et Sujet Beyle en changeant le mode d'interrogation

recherche Auteur Beyle et Sujet Beyle en changeant le mode d'interrogation

Voici l’URL d’interrogation de IdRef générée pour compléter l’index Auteur de HIP : http://www.idref.fr/Sru/Solr?q=%28persname_s:beyle*%20or%20corpname_s:beyle*%20or%20geogname_s:beyle*%20or%20famname_s:beyle*%20or%20uniformtitle_s:beyle*%20or%20name_title_s:beyle*%20or%20trademark_s:beyle*%29&start=&rows=15&wt=json&fl=affcourt_z.

L’URL pour l’index Sujet de HIP est un peu plus longue, car j’ai ajouté une interrogation de l’index “nom commun” (autrement dit, Rameau et Fmesh) de IdRef (subjectheading_s), qui aurait été inutile pour enrichir l’index Auteur (puisqu’un nom commun ne peut pas être auteur d’un document, alors qu’un nom propre peut être à la fois auteur et sujet…)

La troncature est cependant grossière, ce qui peut engendrer du bruit : un joker ( * ) est tout simplement ajouté après l’expression saisie par l’usager.

Dans le cas d’une recherche sur “Beyle”, on récupère non seulement 3 des formes que l’on avait trouvées en utilisant l’index “all” (“Beyle, Thad L. (1934-)”, “Beyle, Pauline (1786-18..)”, “Stendhal (1783-1842)”) mais également Van Beylen, Marcel Beyleveld, Deryck Beyler, Louis Beylerian, Onnig (1947-….) Beyler, Jean-Noël (19..-….) Beyleryan, Arthur A.

En cherchant “Beyle*” ou “Michel*”, on a donc encore trop de bruit, car a priori ni Jean-Noël Beyler ni Jules Michelet ne nous intéressent.

J’ai donc essayé de faire une troncature plus fine construite ainsi : (mot OU mot+espace+* OU mot+point+* OU mot+virgule+*). Logiquement, cela devrait couvrir tous les types d’autorités.

Pour “Michel”, cette option donne encore 708 réponses, ce qui fait encore beaucoup, mais ce n’est pas surprenant car Michel est un nom de famille courant.

Pour “Beyle”, voici l’URL d’interrogation de IdRef générée avec cette option : http://www.idref.fr/Sru/Solr?q=%28persname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20corpname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20geogname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20famname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20uniformtitle_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20name_title_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20trademark_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%29&start=&rows=15&wt=json&fl=affcourt_z

Cette fois, on ne trouve que 3 réponses : “Stendhal (1783-1842)”, “Beyle, Pauline (1786-18..)” et “Beyle, Thad L. (1934-)”.

Wanted : Paul Beyle. Forte récompense.

Tout serait parfait si ce n’était la disparition mystérieuse de “Beyle, Paul” que nous avions trouvé avec la première options (la recherche avec l’index global ‘all’), mais qui n’apparait pas avec l’index persname_s, que ce soit avec la troncature grossière ou plus fine.

La preuve : http://www.idref.fr/Sru/Solr?q=all:%22beyle,%20paul%22 permet de retrouver sa fiche, alors que http://www.idref.fr/Sru/Solr?q=persname_s:beyle,\%20paul* ne donne aucune réponse…

Je pense avoir trouvé un début d’explication en examinant le détail de la réponse à la première de ces requêtes. Voici le code XML généré :

Quelques remarques sur ce code :

  • J’imagine que les balises “arr” désignent des tableaux (arrays), comprenant un ou plusieurs composants, et que les balises “str” contiennent des chaînes (string).
  • Les attributs “name” désignent des noms d’index : “all” (l’index général), “persname_t”, “ppn_z”, et plein d’index permettant de faire des limitations (dates, langue, nationalité, type de notice, emploi, etc.)
  • Le nom complet figure deux fois dans l’index “all”. J’ignore pourquoi.
  • Tous les index spécifiques sont repris dans l’index “all”
  • Il n’y a pas d’index “persname_s” (index de type ‘phrase’ pour les personnes physiques)

J’en conclus que l’absence d’index “persname_s” dans cette fiche est une anomalie qui empêche de retrouver “Beyle, Paul” dans cet index.

Par comparaison, voici la fiche de “Beyle, Pauline” en XML (uniquement la partie <doc>…</doc>) :

Dans les dernières lignes on trouve bien une double indexation persname_t (personne, index mot) et en persname_s (personne, index phrase).

Dieu et l’ABES seuls savent pourquoi Paul Beyle y a échappé (absence de dates entre parenthèses ? manque de bol ? mauvais karma ?)

Mais ce n’est pas tout : en dépouillant ces fichiers XML, j’ai eu surprise encore plus mauvaise : Trrremblez mortels, car la faucheuse rôde sur IdRef!

IdRef, mis KO par la mort…

La danse des morts dans IdRef, vue par Holbein

Les morts dansant la gigue dans les serveurs d'IdRef (Holbein)

Dans l’index tous mots “all”, on trouve non seulement les noms et dates des entités décrites, mais aussi le PPN ou des mots clés comme  “FR” ou “fre”. Jusque là, rien de gênant. Cela pourrait même être pratique.

Là où les choses se gâtent, c’est quand des informations concernant les règles d’usage de l’autorité ou le statut des personnes vis à vis de l’état civil sont codés au moyen de mots qui ont une signification en français : “mort”, “autre”, “ko”, “ok”, “a”.

Faites donc l’expérience de rechercher dans l’interface publique d’IdRef des mots comme “mort” ou “ko” en sélectionnant le dernier index (“Tout”) du menu déroulant, et vous aurez une mauvaise surprise :

La mort rôde dans IdRef

La mort rôde dans IdRef

La recherche “ko” en tous mots donne 2212960 résultats. La recherche “mort”, 309329 résultats, et la recherche “autre”, 1957180 résultats !

Je pense qu’il serait bon que ces clés d’index soient renommées (ou ne soient plus interrogeables par “all”, mais ce serait dommage).

Enfin, je finirai ce billet par quelques remarques sur la syntaxes d’IdRef, qui ne sont pas encore toutes documentées par l’ABES.

La syntaxe d’IdRef : échapper pour que rien ne s’échappe

Toutes mes requêtes commencent ainsi : “http://www.idref.fr/Sru/Solr?q=”, puis j’ajoute les paramètres, et je les termine par “&start=&rows=15&wt=json&fl=affcourt_z”

  • “fl=affcourt_z” signifie que je ne veux obtenir qu’un seul élément : la forme d’autorité. Pas besoin du PPN, des formes rejetées ou d’autres champs.
  • “start=&rows=15″ signifie que ne je veux les 15 premières réponses. On pourrait très bien mettre 30, 300 ou 3000, mais le risque est de récupérer un flot de données trop importantes à exploiter… Cette option est modifiable au moyen d’une la liste déroulante dans le panneau de gauche.
  • “wt=json” signifie que je souhaite obtenir les résultats au format JSON. On pourrait les récupérer en XML, mais bon, c’était l’occasion de découvrir JSON…

La construction des paramètres, voila le gros morceau! D’autant plus  que les règles sont différentes selon les types d’index…

Voici comment cela se présente pour la troisième option (la plus complexe, index phrase avec troncature “fine”) :

  • ((INDEX1) or (INDEX2) or (INDEX3)…. )
  • chaque expression (INDEXn) est en fait elle-même composite. Voici la première : (persname_s:(beyle beyle\ * beyle.* beyle,*)

Quelques remarques :

  • entre chaque index, il faut utiliser le booléen “or”, mais au sein d’un même index, pour avoir le même effet, il faut séparer les termes par un espace. Sinon, le mot “or” sera interprété comme la vedette décrivant le métal précieux…
  • dans les index phrase, tout doit être mis en minuscules mais contrairement aux index mot, les diacritiques (accents, cédilles, etc.) doivent être conservés, y compris les majuscules accentuées
  • Dans l’url, ces diacritiques doivent être codés en  ISO 8859 et non en UFT-8. Par exemple “é” doit être codé %E9 et non %C3%A9. Ce qui a pour conséquence la non indexation de mots comprenant des caractères non représentables en ISO 8859.
  • il faut ajouter “\” devant certains caractères pour empêcher que le script leur attribue une valeur spéciale. En informatique, c’est ce qu’on appelle un “échappement”. Cela s’applique :
    • aux parenthèses ouvrantes et fermantes
    • à l’espace

Ainsi, pour rechercher le géographe “Reclus, Élisée (1830-1905)” avec cet index, et sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=persname_s:reclus,\%20%C9lis%E9e\%20\%281830-1905\%29

Par contre, pour les index mot, comme l’index “all” :

  • il ne faut pas “échapper” les espaces et les parenthèses
  • on peut utiliser les guillemets doubles ” ” pour encadrer les expressions composés de plusieurs mots séparés par un espace
  • tout doit être mis en minuscule, mais il faut aussi supprimer les diacritiques

Pour rechercher la même personne avec l’index “all”, toujours sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=all:%22reclus%2C%20elisee%22

Je reviens sur cette histoire d’encodage des caractères qui n’est pas évidente. Prenons par exemple un nom polonais, comme Kościuk, Jacek. Une URL ne peut pas comprendre de caractères spéciaux, c’est à dire non inclus dans le code ASCII original (128 caractères), et ne doit d’ailleurs pas comprendre certains caractères comme l’espace, le point, etc…  Pour qu’un navigateur comprenne le “s accentué”, il faut donc l’encoder selon le standard UTF-8. Le code hexadécimal correspondant est “%C5%9B”. Il est faut donc deux octets pour le représenter (C5 et 9B).

Par contre, coup de bol, la plupart des caractères propres au français (sauf Ÿ, Œ, œ) peuvent certes être représentés sur deux caractères en UTF-8, mais aussi en un seul caractère selon d’autres standards.

Le Sudoc, et la plupart des sites modernes sont capables de gérer une URL comprenant des caractères en UTF-8. Voici un lien dans le Sudoc vers le livre dont ce monsieur est l’auteur : http://www.sudoc.abes.fr/DB=2.1/CMD?ACT=SRCHA&IKT=1004&SRT=RLV&TRM=Ko%C5%9Bciuk%2C+Jacek

Or, dans IdRef, que ce soit l’interface publique (0 résultats pour le terme ” Tout=Kościuk, Jacek”) ou le webservice, impossible de retrouver notre ami polonais! Même en remplaçant le “s accentué” par un “s” normal ou par “?”, et en interrogeant l’index “all”…

Conclusion

J’ai monté une vraie usine à gaz, qui n’est pas très fonctionnelle. Je doute que l’idée de départ soit finalement applicable, car IdRef renvoie souvent trop de réponses pour construire une URL qui ne fasse pas des km dans HIP. En plus je me demande si interroger le serveur de notre catalogue avec des équations si longues ne risque pas de le faire “surcharger” d’une manière ou d’une autre. Mais il faudrait quelqu’un de plus compétent que moi en informatique pour le dire.

Par contre, cela m’a permis d’aiguiser mes compétences en javascript, et de mieux comprendre le fonctionnement d’IdRef, et de relever quelques points délicats (échappement dans les index phrase) ou gênants (non indexation de certaines notices, pollution de l’index all par des certains mots clés).

J’espère que cela pourra être utile à d’autres personnes. Si vous voulez copier des morceaux de mon code pour votre usage, n’hésitez pas.

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

IDREF : une application qui pourrait être encore plus puissante

Depuis quelques semaines, je tripote dans tous les sens Idref, l’application de l’ABES permettant de consulter les autorités du Sudoc (et des autres bases de l’ABES : Calames et STAR).

L’application est en ligne depuis octobre 2010, mais l’ABES a depuis quelques mois ajouté plusieurs fonctionnalités. En plus d’une précieuse documentation technique, l’ABES a mis en ligne une page de démonstration illustrant la possibilité d’établir des liens et d’échanger des données entre Idref et des applications externes.

Je voudrais faire une petite démonstration, et surtout évoquer une limitation d’IdRef que j’ai découvert à cette occasion.

Votre appli >IdRef > votre appli

Le fonctionnement du dispositif est expliqué dans ce billet du blog technique de l’ABES, qui renvoie à d’autres liens.

Précisons que la page de démonstration utilise une “base de test”, donc les résultats ne sont pas forcément ceux qu’on aurait en interrogeant directement IdRef, mais cela ne change absolument rien au principe (pour interroger la base de production, si j’ai bien compris, il suffirait de remplacer dans le code de la page var remoteSrv="http://193.52.69.127:8080/autorites/remoteAutorites.html" par var remoteSrv="http://www.idref.fr/autorites/remoteAutorites.html")

Petite démonstration en images :

Remplissons les champs “nom” et “prénom” avec ceux de la personne recherchée.  Au hasard, un certain Yann Nicolas…

Page de test d'IDREF : recherche de Nicolas, Yann

Page de test d'IDREF : recherche de Nicolas, Yann

Après validation du formulaire, une nouvelle page s’ouvre, dans laquelle IdRef renvoie les trois notices correspondant à notre recherche :

Les 3 Yann Nicolas dans IDREF

Les 3 Yann Nicolas dans IDREF

Cliquons sur le Yann qui nous intéresse (le spécialiste des Maoris…) :

IdRef : notice de Yann Nicolas (1973)

IdRef : notice de Yann Nicolas (1973)

Et maintenant, laissons nous-tenter par cet alléchant bouton “lier la notice” en bas de la page. Son activation va automatiquement envoyer dans notre page “votre appli > IdRef > votre appli” les informations tirées de la notice en cours d’affichage.

Page de test d'IDREF : après récupération des données

Page de test d'IDREF : après récupération des données

Plutôt cool non?

Mais un détail me chiffonne néanmoins…

Une gestion des noms qui manque de finesse

Videz les formulaires, et refaites la même requête en inversant le nom et le prénom :

De Yann Nicolas à Nicolas Yann

De Yann Nicolas à Nicolas Yann

Surprise! Le formulaire renverra les même trois notices dans IdRef.

Autrement dit, tout se passe comme si nom et prénom étaient interchangeables…

J’ai d’abord cru à une petite erreur dans le code, mais après un bon moment passé à essayer de décortiquer tout cela (merci Firebug!), je pense qu’il s’agit d’une limitation plus fondamentale d’IdRef (et peut-être de Solr, sur lequel l’application est construite).

Voici les différentes étapes de la requête :

  1. Le formulaire concatène tous les paramètres de la recherche dans une chaîne et les envoie à une page externe.  Voici à quoi ressemble cette chaîne : “Index1=Nom%20de%20personne&Index1Value=yann%20nicolas&Index2=&Index2Value=&Index3=Langues&Index3Value=&Filtre1=Type%20de%20notice/Personne&z200_a=nicolas&z200_b=yann&z101_a=&z103_a=20100101&z810_a=une%20autre&AutoClick=true”. On y trouve à la fois le nom (index z200_a), le prénom (index z200_b) et une chaine nom+prénom.
  2. Cette chaîne est traitée par une page http://www.idref.fr/autorites/remoteAutorites.html qui ne s’affiche pas mais renvoie la requête vers une 3e page.
  3. La 3e page http://www.idref.fr/autorites/autorites.html est celle où les informations seront affichées, en fonction des réponses du serveur.
  4. Cette page interroge le serveur en envoyant la requête suivante : “http://www.idref.fr/Sru/Solr?q=persname_t:%20(nicolas%20AND%20yann)%20AND%20recordtype_z:a&sort=score%20desc&version=2.2&start=0&rows=30&indent=on&fl=id,ppn_z,recordtype_z,affcourt_z”. Dans les paramètres, on ne retrouve plus que “(nicolas AND yann)”, sans distinction du nom et du prénom.

CQFD.

Dans la documentation technique, rien n’indique la possibilité d’interroger spécifiquement le nom, le prénom, la date de naissance, la date de mort, ou tout autre élément de ce genre. A tout hasard, j’ai essayer de bricoler l’url avec des requêtes du genre “http://www.idref.fr/Sru/Solr?z200_a=nicolas”, mais tout ce que j’obtiens ce sont des messages d’erreur.

Est-ce si grave? Sans doute pas, mais c’est un peu agaçant tout de même, car les notices comportent des informations potentiellement intéressantes, qu’il est impossible d’interroger. Alors, certes, dans le Sudoc et dans WinIBW (notre outil de catalogage), il n’est pas non plus possible de faire ce genre de recherches, mais il est dommage qu’un nouvel outil comme IdRef ne le permette pas. Je ne sais pas si c’est une limitation due au fonctionnement même de l’outil, ou si l’ABES a choisi volontairement de restreindre le nombre d’index.

Peut-être quelqu’un de bien informé pourrait-il m’en dire plus?

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Google scholar ratisse (trop) large

Tous les documentalistes et bibliothécaires savent qu’il ne faut utiliser Google scholar qu’avec prudence lorsqu’on recherche des articles scientifiques.

Car, ainsi que l’explique ce wiki réalisé par l’URFIST PACA (mais de nombreux tutoriels donnent les mêmes informations) on peut faire de nombreuses reproches au moteur :

  • Pas de listes des éditeurs commerciaux et des serveurs d’archives qu’il indexe
  • Pas d’informations sur le type de document traité et la période couverte
  • Couverture réelle non précisément connue
  • Opacité de l’algorithme de classement des résultats et de celui du calcul des citations
  • Des résultats moins complets que l’interface d’interrogation des bases natives

Mais je pensais du moins que Google Scholar se contenait d’interroger des sources scientifiquement fiables : sites d’éditeurs, archives institutionnelles, etc.

Quelle n’a pas été ma surprise en constatant que le moteur avait indexé mon mémoire de DUT déposé uniquement sur ma page personnelle!

Sans vouloir jouer les faux modestes, mon mémoire de DUT n’est qu’un mémoire de DUT… Et rien ne garantit sa qualité, ni même son authenticité. Je pourrais très bien ne jamais avoir soutenu ce mémoire (ce qui n’est pas le cas, heureusement pour moi), ou bien l’avoir largement remanié après sa soutenance (d’ailleurs, si je me souviens bien, j’avais corrigé quelques broutilles avant de le mettre en ligne. Ce n’est donc pas une copie exacte au mot près à l’exemplaire de soutenance, déposée à la bibliothèque de l’IUT de Nancy II).

J’imagine que mon cas est loin d’être isolé. J’ignore comment procède Google, mais je suppose qu’il doit rechercher des documents pdf contenant certains mots clés (“mémoire” “soutenu sous la direction de…”, “bibliographie”…), ou contenant des références bibliographiques, sans quoi tous les fichiers pdf de la toile seraient indexés. Un algorithme doit également permettre de retrouver mon nom à partir de la page de titre du mémoire, à moins que Google n’utilise pour cela les informations de mon site personnel.

En tout cas, cela m’aura permis de me faire une idée des technologies de pointe utilisées pour alimenter Google Scholar…

Au coeur des serveurs de Google, une technologie de pointe...

Au coeur des serveurs de Google, une technologie de pointe...

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks