Quel tarif pour les lecteurs extérieurs en bibliothèque universitaire?

Pas de considérations métaphysiques dans ce billet. Des faits, rien que des faits, et surtout des sous ! ;-)

La question, qui s’inscrit dans la préparation de mon mémoire : combien coûte l’inscription dans une BU pour un lecteur absolument extérieur au monde universitaire, et ne bénéficiant d’aucune des réductions possibles (la liste des réductions varie fortement d’un établissement à l’autre. Disons que notre Monsieur Lambda n’est ni chômeur, ni étudiant d’une autre université, ni retraité de l’éducation nationale unijambiste inscrit dans une formation continue co-organisée par un établissement conventionné, etc) ?

Pour répondre à cette question j’ai dû dresser un tableau en examinant un par un les sites des BU françaises. J’ai exclu pour l’instant les BIU parisiennes (et la BU LSH de Lyon), les INSA et autres écoles, et les BU de Nouvelle Calédonie et du Pacifique (les tarifs sont en Francs Pacifique). J’ai par contre inclus les 3 universités technologiques (Troyes, Compiègne, Belfort).

[Mais quel est le sadique qui  a inventé la grammaire française? Pourquoi j'ai exclu mais j'ai inclus? Hein? Pourquoi?]

Restent 73 établissements, dont j’ai repris les intitulés “ESGBU” pour simplifier.

Bilan :

- une bibliothèque où apparemment aucun extérieur ne peut s’inscrire : Paris 2 (Assas). Accès limité sans doute lié à l’histoire particulière de Paris 2 qui a longtemps été privée de BU (mais vous me direz, c’était aussi le cas de Paris 7…)

- 2 BU qui n’indiquent pas les tarifs sur leurs sites (et j’ai cherché!) : Paris 1 (Panthéon-Sorbonne) et Paris 5 (Descartes)

- 70 BU fournissant cette information

Parmi ces 70, le tarif médian est de 35 euros.

Dans le détail, le “pivot” est de 34 euros, autrement dit le montant des droits versés par les étudiants pour la bibliothèque lors de leur inscription (montant fixé par arrêté pour l’année 2013-2014, et revalorisé régulièrement), qui sert donc de référence à la plupart des établissements pour fixer leurs tarifs pour le grand public.
Certaines bibliothèques utilisent ce montant de référence comme un “tarif réduit”, dont bénéficient par exemple les étudiants d’autres universités, ou les personnels de l’Education nationale. Dans ce cas, elles établissent fréquemment le tarif plein en affectant le montant de 34 euros d’un coefficient multiplicateur (x2, ou plus rarement x1,5, ce qui nous donne soit 68 soit 51 euros) ou en rajoutant 10 euros. Dans une minorité de cas le tarif d’inscription semble totalement décorrélé des 34 euros.

Tarif plein Nombre de bibliothèques
Moins de 34 euros 6
34 euros 28
Entre 34 et 68 euros 24
68 euros 8
Plus de 68 euros 4

Une partie des 4 tarifs inférieurs à 34 euros sont probablement des erreurs liés à une mise à jour irrégulière des sites.
Enfin, signalons deux cas particuliers sur lesquels je reviendrai sans doute :
- Toulouse 1, qui propose à ses lecteurs (étudiants, enseignants ou extérieurs) un droit supplémentaire facultatif de 15 euros permettant emprunter plus de documents (politique qui a fait vivement réagir des collègues de Reims et d’Angers en 2010). Le tarif que j’ai retenu ici est le tarif de base pour les extérieurs (44 euros), sans ces 15 eurs.
- Angers, qui propose des tarifs différenciés, mais pour les extérieurs uniquement : avec ou sans accès à la documentation électronique. Jusqu’à cette année, l’inscription “sans documentation électronique” était gratuite, et l’inscription premium à 34 euros. A partir de l’année prochaine, l’inscription de base passera à 15 euros, et l’inscription premium à 50 euros. J’ai retenu 34 euros (pour pouvoir comparer avec un service rendu équivalent dans les autres BU)

Et voila le détail

Nom Zone géographique Type de bibliothèque Type d'établissement Montant plein tarif (€)
PARIS-DAUPHINE Ile-de-France BU Université 200
TROYES Province BU Université 200
PARIS 10 Ile-de-France BU Université 110
COMPIEGNE Province BU Université technologique 73
BORDEAUX Province BU Université 68
BORDEAUX 3 Province BU Université 68
GRENOBLE 1-INPG Province BIU BIU généraliste 68
GRENOBLE 2 et 3 Province BIU BIU généraliste 68
LYON 1 Province BU Université 68
MONTPELLIER Province BIU BIU généraliste 68
PARIS 11 Ile-de-France BU Université 68
PARIS 6 Ile-de-France BU Université 68
LYON 3 Province BU Université 64
LA REUNION Province BU Université 55
AMIENS Province BU Université 51
CAEN Province BU Université 51
NANTES Province BU Université 51
TOULON Province BU Université 51
ANGERS Province BU Université 34
LORRAINE Province BU Université 50
LA ROCHELLE Province BU Université 48
ALBI (CUFR CHAMPOLLION) Province BU Université 44
TOULOUSE 1 Province BU Université 44
TOULOUSE 2 Province BU Université 44
TOULOUSE 3 Province BU Université 44
VERSAILLES-ST-QUENTIN Ile-de-France BU Université 43,5
RENNES 1 Province BU Université 42
BREST Province BU Université 40
LILLE 1 Province BU Université 40
RENNES 2 Province BU Université 40
AVIGNON Province BU Université 38
LILLE 2 Province BU Université 38
MULHOUSE Province BU Université 36,6
AIX-MARSEILLE Province BU Université 36
MARNE-LA-VALLEE Ile-de-France BU Université 35
SAINT-ETIENNE Province BU Université 35
BESANCON Province BU Université 34,7
ANTILLES GUYANE Province BU Université 34
ARTOIS Province BU Université 34
BRETAGNE-SUD Province BU Université 34
CHAMBERY Province BU Université 34
CLERMONT-FERRAND Province BIU BIU généraliste 34
EVRY VAL-D'ESSONNE Ile-de-France BU Université 34
LE HAVRE Province BU Université 34
LE MANS Province BU Université 34
LILLE 3 Province BU Université 34
LITTORAL Province BU Université 34
LYON 2 Province BU Université 34
NICE Province BU Université 34
NÎMES Province BU Université 34
ORLEANS Province BU Université 34
PARIS 12 Ile-de-France BU Université 34
PARIS 13 Ile-de-France BU Université 34
PARIS 3 Ile-de-France BU Université 34
PARIS 4 Ile-de-France BU Université 34
PARIS 7 Ile-de-France BU Université 34
PARIS 8 Ile-de-France BU Université 34
PAU Province BU Université 34
PERPIGNAN Province BU Université 34
POITIERS Province BU Université 34
REIMS Province BU Université 34
ROUEN Province BU Université 34
STRASBOURG Province BU Université 34
VALENCIENNES Province BU Université 34
DIJON Province BU Université 33
TOURS Province BU Université 33
CERGY-PONTOISE Ile-de-France BU Université 32
LIMOGES Province BU Université 32
BELFORT MONTBELIARD Province BU Université technologique 30
CORTE Province BU Université 30

Une analyse? Pas pour l’instant. Mais j’ai quelques petites idées tout de même…

 

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Ouvrir la BU aux étudiants et chercheurs d’autres universités : l’exemple britannique

J’évoquerai dans ce billet le dispositif ACCESS mis en place au Royaume-Uni et en Irlande (l’Eire) par la SCONUL (Society of College, National and University Libraries). Il vise à garantir au personnel et aux chercheurs, ainsi qu’aux étudiants avancés ou ayant des besoins particuliers un accès à de la documentation universitaire en dehors de leur établissement de rattachement.

La SCONUL

logo Sconul

 

 

 

 

 

Tout d’abord, quelques mots sur la SCONUL : cette association fondée en 1950 représente toutes les bibliothèques universitaires du Royaume-Uni et d’Irlande, ainsi que les bibliothèques nationales et (depuis 2001) celles de la plupart des « collèges d’enseignement supérieur ». (établissements d’enseignement supérieur, souvent techniques, et n’ayant pas le statut d’université). Son objectif est d’après son plan stratégique 2012-2015 d’ « aider ses membres à fournir des services de pointe à leurs étudiants, chercheurs et universitaires, afin de permettre à leurs institutions d’atteindre l’excellence dans l’enseignement et la recherche ».

À noter : il existe une autre instance regroupant un certain nombre de bibliothèques universitaires sur le même territoire (UK+Irlande) mais de manière plus sélective : la Research libraries UK, dont 34 bibliothèques seulement sont membres. La RLUK a une vocation de soutien à la recherche, plus qu’à l’enseignement. Elle a été à l’origine de COPAC, l’équivalent du Sudoc.

Je ne me lancerai pas dans une comparaison avec la situation française, sinon pour préciser (mais vous l’aurez compris) que ces associations n’ont pas d’équivalent strict chez nous : l’ADBU est historiquement une association d’individus (même si elle cherche a devenir une association d’établissements), et les périmètres fonctionnels (BU+bibliothèques de recherche) et géographiques (deux pays) de la SCONUL et de RLUK sont plus larges.

Une problématique générale dans les bibliothèques de l’enseignement supérieur

Le dispositif ACCESS répond à une problématique identifiée de longue date outre-Manche, mais à laquelle les bibliothèques de l’enseignement supérieur sont confrontées dans tous les pays: des étudiants ou des chercheurs peuvent avoir besoin ou envie de fréquenter une bibliothèque dépendant d’une université à laquelle ils ne sont pas affiliés.

Plusieurs cas de figure peuvent motiver le recours à une autre bibliothèque. Je distinguerais deux types de motivations :

  • la recherche de documents spécifiques (documents patrimoniaux, littérature grise, etc.) absents de la bibliothèque habituelle de l’usager ;
  • la difficulté ou l’impossibilité de recourir aux services de la bibliothèque de rattachement, pour des raisons géographiques, d’emploi du temps, ou de handicap. L’essor de l’enseignement à distance et des formations en alternance rend certainement ces difficultés plus prégnantes aujourd’hui.

À quoi peut-on s’attendre en frappant à la porte d’une bibliothèque ne dépendant pas de son université ? En France, la réponse dépendra de la bibliothèque, et en particulier de sa situation géographique :

  • de manière générale (cela mériterait d’être nuancé, mais aucune synthèse n’existe pour le moment), l’entrée et l’usage sur place des documents sont généralement libres et gratuits en Province, mais réservés aux lecteurs inscrits (membres de l’université et lecteurs autorisés) à Paris.
  • par contre, l’emprunt et les autres services (accès aux ressources électroniques, PEB…) sont réservés aux membres de l’université dont dépend la bibliothèque, sauf en cas d’accord de réciprocité entre établissements. Ces accords peuvent être formalisés dans le cadre d’une Communauté d’universités et d’établissements (COMUE), d’un partenariat régional (feu le Réseau Universitaire Ouest Atlantique) ou d’une simple convention.

À quoi faut-il s’attendre au Royaume-Uni (faisons pour l’instant abstraction du dispositif ACCESS…) ?

  • Pour autant qu’on puisse en juger, la consultation gratuite des collections dans l’enceinte de la bibliothèque semble exceptionnelle, contrairement à la France. À l’université du Bedforshire, la consultation sur place est ainsi facturée aux extérieurs 25£ (avec des possibilités de réduction ou de gratuité dans certains cas) À l’université de Manchester, l’accès libre n’est possible qu’une seule fois, la règle étant qu’un usager extérieur doit s’inscrire, pour 75£ (cette inscription donne droit au prêt, de manière limitée). On peut cependant trouver quelques contre-exemples, comme la bibliothèque de l’université d’Huddersfield ou d’Edinburgh dont les collections sont accessibles gratuitement, mais pas nécessairement librement : à Edinburgh, en période de forte affluence, la bibliothèque est réservée aux étudiants et enseignants de l’université.
  • D’autre part, des accords entre établissements existent, comme en France, et sont souvent signalés avec moult détails sur les sites des bibliothèques. Mais leur périmètre peut être plus restreint qu’en France, et se limiter aux enseignants-chercheurs et étudiants avancés. C’est par exemple le cas du programme liant entre elles les bibliothèques de recherche du Grand Londres (M25).

La politique d’accès des bibliothèques universitaires anglaises est donc historiquement moins « libérale » que celle de leurs homologues françaises. Peut-être est-ce un des facteurs expliquant que plusieurs programmes aient vu le jour à la fin du XXe siècle pour faciliter la vie des étudiants et des chercheurs.

Une histoire ancienne

ACCESS est issu de la fusion en 2007 de deux dispositifs plus anciens :

  • SCONUL Research Extra (SRX) qui s’adressait destiné au personnel et aux étudiants avancés (doctorants),
  • UK Libraries Plus (UKLP), qui s’adressait aux étudiants « postgraduate » (en gros l’équivalent de notre niveau Master) ainsi qu’aux étudiants à distance, en alternance ou à temps partiel.

Lors de son lancement en 1999, UK Libraries Plus ne concernait que les aux étudiants à distance, en alternance ou à temps partiel, et a été étendu en 2005 aux étudiants « postgraduate » à plein temps (voir une actualité de l’université de Southampton)

Un article de 2007, dont un préprint est en ligne, donne un aperçu intéressant de la mise en place du service (E. J. Adam, A vital lifeline: UK Libraries Plus 1999-2006. (lien vers le pdf). SCONUL Focus, 40 . pp. 89-93).

Je traduis le résumé, et je souligne :

Il peut sembler incroyable aujourd’hui qu’il y a seulement huit ans il n’existait aucun programme national pour permettre aux étudiants d’accéder et d’emprunter dans les bibliothèques de l’enseignement supérieur. Pourtant le besoin était clair. Avec toujours plus d’étudiants à temps partiel, étudiant souvent loin de l’université ou du “collège” dans lequel ils se sont inscrits, les bibliothèques étaient confrontées aux plaintes continuelles des étudiants ne pouvant obtenir un accès facile aux documents dont la lecture était attendue dans leur cursus. Les étudiants en alternance, passant souvent plusieurs semaines loin de leur établissement et pourtant censés réaliser des travaux dans leurs cursus, faisaient face aux mêmes problèmes. Dans certaines régions, des dispositifs comme London Plus (depuis 1988) permettaient en partie de répondre à ces besoins, mais il suffisait que l’usager change de région pour ne plus rien avoir. Encore pire, de nombreuses bibliothèques, même lorsqu’elles avaient mis en place des dispositions détaillées pour les étudiants à temps partiel de leur propre institution, faisaient en sorte que des barrières soient en place pour que le service ne soit pas débordé par les malotrus de l’université voisine. Lorsque j’étais en poste à l’université South Bank, je me souviens que je devais maintenir une longue liste de ceux que nous laissions entrer ou pas.

SCONUL Research Extra a été mis en place plus tardivement, en 2003, le dispositif UK Libraries Plus ayant servi de modèle. Il a fait suite à plusieurs initiatives prises dans les années 1990 pour faciliter l’accès à la documentation aux chercheurs en déplacement, comme le rappelle un article de 2006 (J. Hall, SCONUL Research Extra. Liber Quarterly, 2006). Il a notamment pris la suite du Research Support Libraries Programme, initié en 1999, dont l’objectif était plus large, mais qui a contribué à populariser l’idée d’une « collection nationale répartie des ressources documentaires universitaires »

En 2007 ces deux programmes ont donc fusionné, mais leur périmètre était différent, tant en ce qui concerne les publics ciblés que les établissements partenaires, ce qui explique l’apparente complexité d’ACCESS : une identité unique recouvrant des services différenciés destinés à des publics clairement identifiés.

Profiter d’ACCESS aujourd’hui

Le dispositif est basé sur la réciprocité entre établissements et sur une catégorisation des usagers en quatre groupes (« bands »). Quasiment toutes les bibliothèques universitaires adhèrent au système (environ 180), mais chaque bibliothèque peut très bien ne faire profiter du dispositif que les usagers du groupe A (par exemple la Queen’s University de Belfast), du groupe B, du groupe A et B, etc. Seules certaines utilisent toutes les possibilités du dispositif (la London School of Economics par exemple)

Les trois premiers groupes sont :

  • groupe A :
    • personnel (enseignants et support)
    • étudiants « post-graduate » effectuant un travail de recherche
  • groupe B :
    • étudiants « undergraduate » ou « post-graduate » à temps partiel (statut en général accordé pour des raisons familiales ou médicales, ou en cas de travail salarié)
    • étudiants suivant un enseignement à distance
    • étudiants suivant un enseignement en alternance (“placement”)
  • groupe C : étudiants « post-graduate » n’effectuant pas de travail de recherche (« taught courses students », mutatis mutandis, l’équivalent d’un Master pro chez nous)

Le dernier groupe, R, est particulier, car il n’est pas destiné à permettre l’emprunt de documents, contrairement aux trois premiers, mais la simple consultation sur place (« reference »). Il concerne les étudiants « undergraduate » ordinaires.

Enfin, il existe un dispositif complémentaire (utile pour les établissements ne donnant pas de droits au groupe R, si je comprends bien), qui permet à des étudiants « undergraduate » d’utiliser les services d’une bibliothèque qui n’est pas la leur, pendant les périodes de vacances universitaires.

Pour profiter du dispositif, l’usager doit se rendre sur la rubrique dédiée sur le site de la SCONUL. Une FAQ détaille les différents cas de figure. Un formulaire en ligne lui permet de préciser à quelle catégorie il appartient, et à quelle université. Il doit choisir l’université dont il souhaite utiliser la bibliothèque (mais son inscription sera valide dans d’autres établissements après acceptation). La demande est traitée par son université de rattachement, qui lui envoie un courriel de confirmation. Lors de la première visite dans l’établissement auquel il souhaite accéder, il devra se présenter avec sa carte d’étudiant ou professionnelle, et une copie du courriel afin d’établir une carte. Certaines bibliothèques demandent en outre une photo d’identité. L’émission de la carte est normalement gratuite, mais certaines bibliothèques la facturent tout de même quelques livres.

182 BU ouvertes pour un chercheur de l'université West London

182 BU ouvertes pour un chercheur de l’université West London

Le dispositif se caractérise par sa grande souplesse pour les établissements : outre l’existence de quatre catégories, chaque bibliothèque décide des services exacts qu’il propose aux bénéficiaires : condition de prêt, accès au PEB, au matériel informatique ou aux ressources électroniques. En général seul le prêt est possible, avec parfois un accès à quelques ressources électroniques, sur place uniquement.

De plus, une bibliothèque peut tout à fait restreindre temporairement l’accès ou le prêt pour une catégorie d’usagers, ou pour l’ensemble des extérieurs, notamment pendant les périodes d’examens. L’accès aux étudiants extérieurs a par exemple été bloqué dans les bibliothèques de l’université de Glasgow du 14 avril au 1er juin 2014.

En guise de conclusion : expérience exotique ou source d’inspiration ?

Sans vouloir tomber dans le cliché facile, la grande flexibilité du dispositif et le fait qu’il soit géré par une association d’établissements et non par les pouvoirs publics dénote un « pragmatisme » dont nous avons parfois du mal à faire preuve de ce côté de la Manche. Ouups, je suis tombé dans le cliché facile :wink:

Bien sûr, ce dispositif ne pourrait pas être transposé tel quel en France. Certains de ses volets seraient globalement inutiles chez nous : l’accès sans possibilité de prêt (groupe R et accès pendant les vacances universitaires) aurait peu de sens en France compte tenu de nos pratiques actuelles, sauf peut être dans les BU parisiennes.

Par contre, permettre aux chercheurs, étudiants avancés et aux étudiants « empêchés » à un titre ou un autre (étudiants à distance, en alternance, handicapés, etc) d’emprunter des documents dans la BU de leur choix pourrait être une piste intéressante d’amélioration du service rendu par les BU. Resterait à calculer le coût d’une telle mesure (je n’ai pas trouvé d’évaluation du coût d’ACCESS), et à trouver un pilote…

Qu’en pensez-vous ?

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bilan du concours de conservateur d’Etat

Ou: comment j’ai appris à ne plus m’en faire et à aimer les déménagements.

À la demande du peuple, je réveille le blog au bois dormant pour faire un point sur les épreuves du concours de conservateur d’Etat, en particulier sur les oraux qui ont eu lieu il y a trois semaines.
En interne, nous étions vingt admissibles, pour sept postes. Six de moins qu’en 2008… Les promotions sont nettement plus réduites qu’il y a quelques années, mais j’ignore si c’est un effet de la démographie, ou une volonté délibérée de “repyramider” la filière bibliothèque en réduisant le nombre de conservateurs, comme le souhaite clairement l’IGB (voir son dernier rapport sur les emplois en bibliothèques).
Bref, inutile de faire durer le suspense, j’ai été pris en 6e position, en grande partie grâce aux notes obtenues aux épreuves écrites (plutôt inhabituel pour moi, en général les oraux me sont plutôt profitables). Je vais revenir brièvement sur les épreuves écrites, avant d’aborder dans une deuxième partie les épreuves orales, et de conclure dans une envolée lyrique sur la troisième mi-temps qui s’annonce. (ça c’est du plan, n’est-il pas?)

Les écrits

Ils se sont déroulés à la mi avril. Les sujets en interne étaient :

  • pour la dissertation (5h) : “Quel sens l’érudition peut-elle avoir aujourd’hui ?”
  • pour la note de synthèse (4h) : un dossier sur la musique en bibliothèque : “En matière musicale, l’offre des bibliothèques est-elle le reflet de la préoccupation des publics ?”.

La note de synthèse

Je n’ai pas conservé mes brouillons mais voici ce qui surnage de mes souvenirs. Le dossier était assez facile à traiter, et un axe de lecture était clairement suggéré (offre vs “préoccupation” des publics). Les documents étaient plutôt anciens (une dizaine d’années), mais cela n’a pas d’incidence sur ce genre d’exercice, où il faut à tout prix éviter d’insérer des idées ne figurant pas dans le dossier. J’ai très peu traité un ou deux documents que j’arrivais pas à caser dans mon plan, notamment un texte de l’ACIM peu compréhensible, et un article du BBF écrit – ô surprise – en langue BBF.

En gros, j’ai dégagé

1/ la crise d’un ancien modèle

a/ définition de cet ancien modèle (les “discothèques” séparées du reste de la bibliothèque, centrées sur le disque etc)

b/ pourquoi est-il en crise (notamment parce qu’il n’est plus adapté aux “préoccupation des publics”)

2/ vers un nouveau modèle

a/ des efforts d’adaptations de l’offre aux préoccupations des publics

b/ mais lents et pas encore suffisants

Oui, on ne peut pas faire plus bateau, mais en 4h à moins d’être un génie ou un pro de la lecture rapide, il ne faut pas s’amuser à chercher midi à 14h ! L’essentiel est d’avoir un plan cohérent et équilibré, qui réponde à une problématique pas trop farfelue, et d’y caser toutes les idées principales du dossier, la plupart des idées secondaires, et un ou deux exemples.

Pour ceux qui voudraient tenter ce concours, il faut éviter de formater la note comme on le ferait pour un concours administratif (pas de timbre, pas de destinataire etc). Il faut faire une introduction et une conclusion, et ne pas titrer les parties. Enfin, on ne plaisante pas avec le respect de la longueur imposée (4 pages) et l’équilibre des parties et sous-parties (petite astuce : faire des marques au crayon de papier sur la copie pour ne pas se laisser déborder par son inspiration…)

La dissertation

Un érudit 100% pur humaniste

Erasme par Holbein le jeune : garanti 100% érudit humaniste

Au concours de conservateur territorial, en interne, le sujet de culture générale portait sur les politiques culturelles des 40 dernières années. Le sujet du concours d’Etat était très différent, puisqu’il nous invitait à réfléchir sur la notion d’érudition et son sens aujourd’hui. Autrement dit, il demandait moins de connaissances culturelles “précises” et laissait je pense plus de marge de manoeuvre aux candidats. Plutôt le genre de sujet que j’apprécie.

Sans refaire la dissert, une erreur aurait sans doute été de considérer l’érudition comme un vague synonyme de “culture générale”. D’autre part l’érudition est plutôt caricaturée dans la société d’aujourd’hui, mais cela n’a pas toujours été le cas. Ma thèse a été de montrer que l’érudition est “en crise” depuis plusieurs siècles. Les premiers humanistes faisaient preuve d’érudition (disons d’une culture à la fois large et très approfondie reposant sur l’étude de textes anciens et supposant des connaissances linguistiques et une méthode critique) pour connaître l’histoire, la littérature, les arts et les sciences. Mais le XVIIe et le XVIIIe siècles marquent je pense un repli de l’érudition sur la connaissance proprement historique. J’ai cité Descartes tentant de refonder la science sur une base an-historique (la méthode, les mathématiques, l’expérimentation…). Mais même dans le domaine de l’histoire, si l’érudition a été fondamentale (de Mabillon à l’école méthodique du XIXe), et reste appréciée, elle n’est plus la qualité première d’un historien, qui ne peut pas se contenter d’établir naïvement des “faits” à partir de documents. Enfin, j’ai défini l’érudition comme une sorte de “passion pour la constitution et le partage du savoir”, qui pouvait prendre des formes nouvelles aujourd’hui, notamment avec Wikipédia (avec une forme d’investissement personnel plus “éparpillé” qu’autrefois, sur des sujets souvent moins “nobles”, mais je pense que l’analogie peut se défendre)

Pour aller plus loin, la définition de l’érudition dans le Trésor de la langue française : sens A : “Pratique d’une méthode consistant à rassembler des documents nombreux et souvent exhaustifs autour d’une recherche” ; sens B :Connaissances accumulées par l’emploi de cette méthode.”. Le TLF cite plusieurs emplois péjoratifs : “fausse érudition” (ce qui laisse entendre que la vraie érudition peut avoir un sens), “poussiéreux travaux d’érudition”.

Pour Wikipédia, “L’érudition désigne une grande étendue de savoir conférant une connaissance profonde et étendue en littérature, en philologie, résultant le plus souvent de l’étude et de la lecture étendue des documents consacrés au sujet plutôt qu’à des études scolaires.”

Enfin, je découvre l’intéressant article de l’Encyclopédie, écrit par D’Alembert : “Ce mot, qui vient du latin erudire, enseigner, signifie proprement & à la lettre, savoir, connoissance ; mais on l’a plus particulierement appliqué au genre de savoir qui consiste dans la connoissance des faits, & qui est le fruit d’une grande lecture. On a réservé le nom de science pour les connoissances qui ont plus immédiatement besoin du raisonnement & de la réflexion, telles que la Physique, les Mathématiques, &c. & celui de belles-lettres pour les productions agréables de l’esprit, dans lesquelles l’imagination a plus de part, telles que l’Eloquence, la Poésie, &c. L’érudition, considérée par rapport à l’état présent des lettres, renferme trois branches principales, la connoissance de l’Histoire, celle des Langues, & celle des Livres.”

A la fin du XVIIIe siècle, l’érudition se distingue donc couramment de la “science” et des arts. Cela me rassure, vu que j’ai évoqué cette idée dans ma 1re partie ;-)

Les oraux

En interne comme en externe, l’oral comprend trois épreuves : langue étrangère, culture générale, entretien sur la motivation professionnelle.

L’épreuve de langue

L’épreuve de langue est très légère en interne, puisqu’il s’agit de traduire un texte d’une dizaine ou d’une quinzaine de lignes, avec l’aide d’un dictionnaire, puis de discuter en français avec le jury (sur des points de traduction et de civilisation). Dans son dernier rapport, le jury semble souhaiter que les exigences linguistiques soient renforcées pour les internes. Je serais assez d’accord : on pourrait ne maintenir qu’une seule langue (contre deux en interne), mais en faire une véritable épreuve, ce qui implique une conversation dans la langue souhaitée.

J’avais choisi l’anglais, et j’ai eu à traduire un texte du journal the Independant sur la critique faite par le maire de Londres au gouvernement Cameron, coupable de “mollesse” envers les syndicalistes anglais, en particulier ceux du métro. En filigrane, on percevait les ambitions nationales de Boris Jonhson. Rien à dire, sinon que j’ai appris que le métro de Londres était beaucoup plus profond que le métro parisien.

Le jury m’a demandé de lire le texte, ce qui n’est apparemment pas systématique. Quelques légères difficultés : traduire : backbenchers (j’ai traduit par “parlementaires de base” mais il n’y a pas d’équivalent exact en français), traduire le titre (la traduction littérale me semblait très lourde en français. J’ai reformulé, le jury m’a demandé ensuite la raison de mes choix). J’ai failli buter sur le faux ami “to curb”. Dans le contexte, j’ai traduit “union members” par “travailleurs syndiqués” plutôt que par un simple “syndicalistes”. Enfin ma traduction de “clampdown” était assez alambiquée. Le jury m’a demandé la signification de “clamp” tout court, que j’ignorais.

Voici le texte :

Boris : toughen up union strikes rules

By: David Hughes

Tories have demanded a clampdown on trade unions in a show of “Thatcherite zeal” aimed at stopping a wave of industrial unrest.
Mayor of London Boris Johnson is backing calls for tough laws to make it harder to call strikes.

London Mayor Boris Johnson and backbench MPs want tough laws to make it harder to call strikes in an echo of Baroness Thatcher’s campaign to curb union powers in the 1980s. Mr Johnson said it was “farcical” that a strike could be called with the backing of just a fraction of union members eligible to vote.

A recent report by the Conservative group on the London Assembly said Tube strikes in the capital cost the economy £48 million a day, estimating that industrial action between 2005 and 2009 cost £1 billion.

Mr Johnson told The Sun: “The idea that a strike can be called by a majority of those that vote, rather than a majority of all those balloted, is farcical. It often results in a strike backed by just one in 10 union members, antagonising millions of commuters in the process and costing London and the UK billions every year. I’d urge the Government to act with some Thatcherite zeal and at the very least legislate against strikes supported by less than half of all union members.”

The call for new laws making it illegal to take action without the support of more than 50% of members follows unions raising the prospect of a general strike in protest at the Government’s austerity measures.

 L’entretien de culture générale

Le texte à commenter était un extrait du discours de réception de Simone Veil à l’Académie française par Jean d’Ormesson. Le discours complet est consultable sur le site de l’Académie. L’extrait ne comprenait que les premiers paragraphes, où J. d’Ormesson évoque Racine et quelques figures plus ou moins oubliées. La carrière de Simone Veil n’y est pas développée, mais simplement évoquée en quelques mots. J’ai donc centré le commentaire sur l’institution elle même, profondément traditionnelle (par son héritage et son fonctionnement), et sur le portrait des académiciens esquissé par l’auteur (quelques grands auteurs, beaucoup d’anonymes, quelques grandes figures, et une ouverture tardive aux femmes). Mon commentaire était assez vasouilleux, mais la discussion avec le jury s’est bien passée et m’a sans doute permis de corriger le tir.

Les questions liées au texte ont porté sur :

- l’Académie

- l’Institut de France (combien d’Académies ? expertise scientifique de l’Académie des Sciences que l’on ne retrouve pas dans les autres Académies)

- le comportement des Académiciens pendant et après la guerre : Pétain et Maurras furent condamnés à l’indignité nationale, mais leurs sièges furent laissés vacants jusqu’à leur mort. Ainsi, en 1953, Pierre Benoît fut élu au fauteuil de Pétain et prononça comme le veut la tradition l’éloge de son prédécesseur, en concédant que “Le Maréchal Pétain a tracé dans notre histoire des pages dont les unes demeurent lumineuses et dont les autres prêtent à des interprétations qui se heurtent encore et suscitent des passions toujours vives”

- le caractère “républicain” de l’Académie (auquel l’auteur faisait allusion). J’ai soutenu que ce n’était qu’un vernis, son histoire et son recrutement par cooptation en faisant plutôt un héritage de l’Ancien Régime. Mais on m’a fait remarquer que c’est le président de la République qui patronne l’Académie. Les détails sont exposés ici

- Henri de Régnier, évoqué dans le texte. Je ne connaissais pas

- Albert de Mun, idem. Je l’ai confondu avec Marc Sangnier, mais je me suis repris in extremis

- Xavier Darcos (récemment élu contre A. Compagnon)

- les intellectuels (parce que j’avais dit que certains Académiciens ne le sont pas vraiment…)

Les questions “libres” ont portés sur :

- le bloc de constitutionnalité

- la Convention européenne des droits de l’homme

- la fracture numérique

- le livre récemment commis par A. Minc sur Bousquet et Jean Moulin

- le film Lacombe Lucien de Louis Malle (que je n’ai pas vu…) et son co-scénariste, l’écrivain Modiano

- et enfin, qui je placerais à l’Académie Française et au Panthéon si j’en avais le pouvoir

L’entretien sur la motivation professionnelle

Le texte à commenter était un article du Monde consacré aux inégalités salariales entre hommes et femmes, et aux mesures prévues par la loi du 9/11/2010 pour contraindre les entreprises à élaborer des plans afin de les corriger. J’ai replacé cette mesure dans le cadre plus général des luttes contre les discriminations (loi de 2005). Après avoir détaillé les objectifs de la loi de 2010 et sa mise en application, j’ai indiqué que d’autres actions seraient nécessaires et possibles pour aller plus loin dans l’égalité entre hommes et femmes au travail.

Je pense avoir plutôt bien commenté le texte, ce qui ne m’a pas empêché d’avoir une note très faible… Cela confirme en tout cas ce que le jury écrit dans le dernier rapport : dans cette épreuve, le commentaire compte beaucoup moins que l’entretien. Je pense également que, comme dans les concours ITRF, le jury profite de cette épreuve pour classer les candidats plutôt que pour “évaluer” leur qualité supposée. Autrement dit, il est sans doute assez facile d’avoir une très bonne note si le jury a clairement envie de travailler avec vous, ou une très mauvaise dès qu’il a un doute. Mais il faudrait en parler avec le jury pour confirmer cette impression…

Le jury m’a posé quelques questions sur le texte et le thème de l’égalité hommes / femmes :

- Quels sont les dispositifs concrets (non cités dans le texte) qu’une entreprise peut détailler dans un plan, pour se conformer à la loi de 2010 ? Je n’ai pas répondu de manière très précise…

- Si les hommes prennent plus de congés parentaux, est-ce que cela ne va pas nuire à leur carrière? Question posée par un homme ;-)

- Et la fonction publique dans tout ça? Pour moi l’égalité salariale entre personnes chargées de la même tâche est réglée par le régime statutaire, mais pas l’égalité dans la progression des carrières, et l’accès à des postes de direction.

- Quel organe dans une Université pourrait avoir à discuter des primes, des horaires de travail, etc? J’ai évoqué le comité technique

Le jury ne m’a posé que très peu de questions directes sur mon parcours (il avait mon dossier RAEP) : pourquoi avoir quitté l’enseignement (il y a 7 ans environ) ? pourquoi avoir commencé ma carrière dans un IUFM ? En quoi consiste le service d’informatique documentaire dans mon établissement actuel? Il ne m’a posé aucune question concrète sur mon travail, ni sur les documents que j’avais joints au dossier RAEP, ce qui m’a plutôt surpris.

Les principales questions “personnelles” furent :

- mon départ de l’enseignement. Je pensais avoir bien présenté les choses, mais cela n’a peut être pas convenu au jury.

- la différence entre bibliothécaire et conservateur.

- quel serait mon “style de management” (j’ai été peut être un peu confus, faisant l’éloge de la communication interne dans les organisation au lieu de répondre clairement à la question. J’aurais dû répondre “le management par la peuuuur”, ça aurait eu le mérite d’être clair!)

- si j’étais attiré par le patrimoine (à cause de mon cursus). J’ai essayé de montrer que oui, pour ne pas passer pour le geek de service.

- pourquoi j’avais conclu mon dossier RAEP en envisageant mon avenir comme responsable d’un service informatique? J’aurais sans doute dû être plus “ouvert” au lieu d’insister sur ce point…

- la question-peau-de-banane : “Que pensez-vous de la situation de la bibliothèque [biiiip] ?”. Lors de la discussion, j’ai évoqué une bibliothèque, ce qui a fait réagir l’inspectrice des bibliothèques présente dans le jury, qui m’a demandé mon avis sur sa situation. J’ai sans doute manqué de diplomatie en évoquant surtout des points négatifs, ce qui a pu faire conclure au jury que j’aurais mal vécu une affectation dans cet établissement.

Bref, au final, une sale note, sans doute à cause de quelques maladresses lors de l’oral et dans mon dossier, mais je ne saurais pas en dire plus, ce qui est un peu frustrant!

Et maintenant?

Je viens de recevoir les papiers de l’ENSSIB : la scolarité débute le 6 janvier et dure 18 mois (oui, ce n’est pas un scoop ;-) ). Je vais donc continuer de sévir à Rennes 2 jusqu’en décembre.

Et, tant qu’on y est, si vous libérez un grand studio ou un F2 sympa à Villeurbanne ou Lyon en janvier, je suis preneur!

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bilan d’étape

Voici trois mois jour pour jour que j’ai débarqué à Villeurbanne pour y suivre la formation initiale des bibliothécaires d’Etat. Autrement dit, dans trois mois, adieu quenelles, saucisson et tarte à la pralines! Car depuis cette année, la formation ne dure plus que six mois, à l’issue desquels les bibliothécaires rejoignent leur lieu d’affectation (l’université de Rennes 2 en ce qui me concerne).

Quenelles de brochet

Quenelles de brochet (posté sur Flickr par stu_spivack sous licence cc-by-sa 2.0)

Quel meilleur moment pour un petit bilan ?

Je n’ai rien publié sur ce blog depuis septembre. Certes, je n’avais jamais été très assidu, mais ce silence commence à être long. D’autant que, pendant cette période, j’ai été assez bavard sur Twitter… Mais il s’agit de deux outils complémentaires, aux logiques différentes. Twitter ne me permet pas de développer une réflexion construite, ni de rendre compte d’une expérience un tant soit peu complexe comme j’ai pu essayer de le faire par le passé dans certains billets de blog. Par contre, c’est un outil précieux pour formuler quelques remarques générales, s’informer des projets des uns et des autres, échanger rapidement des informations, et lancer quelques blagounettes plus ou moins bibliothéconomiques. Je suis encore plus Twittodépendant depuis que j’ai troqué mon brave Nokia pour un HTC qui me permet enfin de surfer partout et n’importe quand (je ne sais pas comment j’ai pu m’en passer si longtemps!).

Donc, pas de nouveau billet depuis un bon bout de temps. Pourtant ce ne sont pas les idées qui manquent, mais en cette période de transition j’ai l’impression d’avoir deux ou trois morceaux de cerveau qui ont du mal à se connecter :

  • Demain il me faudra – avant tout – administrer un SIGB et réfléchir à des projets informatiques innovants. Mais j’ai beau m’y intéresser dès maintenant, tant que je n’aurai pas pris mon poste et que je n’aurai pas les deux mains dans le cambouis, cela restera assez théorique pour moi.
  • Hier, j’achetais et je traitais des livres, je participais à l’accueil, à l’information et à la formation des étudiants. Mon identité professionnelle s’était peu à peu cristallisée autour des problématiques liées au catalogage. Or, on ne peut pas vraiment dire cette activité soit unanimement valorisée par la profession… ;-). Et après trois mois, j’ai déjà l’impression d’avoir perdu la main, oublié beaucoup de choses, être déconnecté des débats et des évolutions en cours. Alors, que faire des connaissances et des compétences (beurk, je cause comme à l’IUFM…) liées au traitement des documents ? Passer un coup de chiffon définitif, ou bien les intégrer à mes nouvelles fonctions, mais en prenant un peu de hauteur, en changeant de point de vue ? A la manière de présenter les choses, on comprendra quelle solution a ma préférence… J’ai du mal à admettre que tout ce que j’ai pu apprendre deviennent subitement et totalement inutile. Mais  je ne sais pas trop ce qu’il adviendra : peut-être que dans un an ou deux tout cela sera vraiment de l’histoire ancienne pour moi…
  • Enfin, aujourd’hui, me voilà redevenu étudiant à plus de trente ans. J’attends deux fois par jour – avec des pleurs de joie indescriptibles – la sacro-sainte fiche d’émargement, et je prend – très sagement – des notes en écoutant des collègues évoquer la diversité des publics, la médiation numérique, la communication, les innovations, la gestion de projet, la réinformatisation, etc etc. Bref, tout cela est intéressant, mais la plupart des sujets ne peuvent être qu’évoqués assez rapidement à mon goût.

La formation est en effet très brève, si l’on songe qu’elle vise à former des cadres. Mais la durée étant fixée par décret, l’école n’est pas libre de la modifier… Je pense que le recrutement hétérogène complique également la tâche des formateurs. Il faut à la fois donner un solide aperçu des bibliothèques à des étudiants qui n’y ont jamais travaillé, et permettre aux vrais et faux internes (majoritaires) d’approfondir leurs connaissances tout en sortant d’une vision parfois très technique ou très spécialisée du métier. Pas facile… Je tire mon chapeau au coordinateur ! Pour ma part, la plupart des cours m’ont intéressés, mais sans que j’y apprenne énormément de choses, à quelques exceptions près (comme le cours sur la réinformatisation ou l’interopérabilité des données, mais, promis, il y en a eu d’autres…). Ce que j’ai le plus apprécié, c’est que, le plus souvent, les intervenants se sont positionnés comme des collègues venant nous faire part d’une expérience et/ou d’une expertise, tout en faisant naître de véritables échanges avec notre groupe.

Bref, cela sera à nous de compléter et d’approfondir nos connaissances une fois en poste, en profitant de la formation continue - dont le financement est bien entendu une priorité absolue pour nos universités au bord de la faillite -, ou  plus probablement en nous débrouillant tout seuls comme des grands ;-).

Tout autant que les cours, et peut-être même plus, les contacts noués pendant cette formation me marqueront sur la durée. Mélanger internes et externes est sans doute complexe sur le plan pédagogique, mais extrêmement enrichissant. Etudiant(e)s tout frais sorti de l’école, BAS aguerri(e)s, anciens profs, anciennes salariés de l’édition ou des musées, féru(e)s de cuisine, de communication, de webdesign (plutôt classe non?), d’anthropologie urbaine, de vampires… Il est rare de pouvoir rencontrer autant de personnes si différentes et pourtant animées par une passion commune, le babyfoot les bibliothèques.

babyfoot

Que serait l'Enssib sans son babyfoot ? (posté sur Wikimedia Commons par Jean-no, licence Artlibre)

C’est à tous ceux-là, et à tous les autres…, que je souhaite une très bonne année, aussi riche en epubs qu’en pubs , aussi remplie de découvertes que d’outils de découverte ! (Oui, je sais c’est mauvais, mais c’est sincère, si si…)

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Une fonction Javascript pour éliminer accents et diacritiques

Et pour quoi faire d’abord?

Le français est une langue qui s’accentue, se trématise, se cédille, et qui pousse le vice jusqu’à l’OdansleEïsation. Et notre alphabet est loin d’être le plus riche : crochets, barres obliques, points souscrits, ogoneks, doubles accents, lettres inversées et autres zigouigouis font le charme (et l’utilité) des alphabets exotiques. Prenez l’alphabet vietnamien, ou Quốc ngữ : ne serait-ce pas un crime d’en faire un vulgaire Quoc ngu ?

C’est pourtant ce qu’on est parfois obligé de faire pour utiliser certains outils informatiques qui digèrent mal les accents et autres diacritiques, et ne supportent que les fades caractères ASCII (127 caractères, sans aucun accent).

C’est justement le cas d’IdRef, du moins dans les index de type mot. Or je suis toujours en train de bricoler le script décrit dans le dernier billet, et je ne désespère pas d’obtenir quelque chose de présentable, mais pour ce faire, j’avais besoin d’une fonction dépouillant une chaîne de ses accents et diacritiques afin de construire une requête compréhensible par l’API d’IdRef.

Après quelques recherches, il m’a semblé qu’une telle fonction existait dans d’autres langages de programmation, mais pas en Javascript. Peut-être me suis-je trompé, mais en tout cas cela m’aura permis de découvrir plein de langues rigolotes rares. J’avais d’abord recopié une fonction trouvé sur un forum, mais elle ne me satisfaisait pas, car elle ne traitait que les 256 caractères les plus usuels (correspondant à l’ASCII étendu). J’ai donc essayé de construire une fonction qui puisse également traiter des caractères plus rares, et qui soit facilement paramétrable pour s’adapter à divers besoins.

Pour ne rien vous cacher, ma fonction s’avère finalement inadaptée à IdRef, du moins dans son état actuel (je reviendrai sur le sujet), mais elle peut être reprise dans d’autres contextes et modifiée pour répondre à des besoins différents.

Le code de la fonction est en ligne ici. Je la recopie sans les commentaires initiaux:

Sous le code, l’unicode…

Comment ça marche ?

Concrètement, nous avons besoin d’une fonction qui transforme une chaîne telle que “œil école Điện słowiańskie” en “oeil ecole Dien slowianskie” (c’est du franco-polono-vietnamien), et plus généralement les 526 caractères “ªÁáÀàĂăẮắẰằẴẵẲẳÂâẤấẦầẪẫẨẩǍǎÅåǺǻÄäÃãĄąĀāẢảȀȁȂȃẠạẶặẬậḀḁÆæǼǽẚȺḂḃḄḅḆḇĆćĈĉČčĊċÇçḈḉȻȼĎďḊḋḐḑḌḍḒḓḎḏĐđÐðDZDzdzDŽDždžÉéÈèĔĕÊêẾếỀềỄễỂểĚěËëẼẽĖėȨȩḜḝĘęĒēḖḗḔḕẺẻȄȅȆȇẸẹỆệḘḙḚḛḞḟƒǴǵĞğĜĝĠġĢģḠḡĤĥḦḧḢḣḨḩḤḥḪḫẖĦħÍíÌìĬĭÎîǏǐÏïḮḯĨĩİĮįĪīỈỉȈȉȊȋỊịḬḭIJijıĴĵḰḱĶķḲḳḴḵĹ弾ĻļḶḷḸḹḼḽḺḻŁłĿŀLJLjljȽḾḿṀṁṂṃŃńǸǹŇňÑñṄṅŅņṆṇṊṋṈṉNJNjnjºÓóÒòŎŏÔôỐốỒồỖỗỔổǑǒÖöȪȫŐőÕõṌṍṎṏȬȭȮȯȰȱØøǾǿŌōṒṓṐṑỎỏȌȍȎȏƠơỚớỜờỠỡỞởỢợỌọỘộŒœṔṕṖṗŔŕŘřṘṙŖŗȐȑȒȓṚṛṜṝṞṟŚśṤṥŜŝŠšṦṧṠṡŞşṢṣṨṩȘșſẛßẞȿŤťẗṪṫŢţṬṭȚțṰṱṮṯŦŧȾÚúÙùŬŭÛûǓǔŮůÜüǗǘǛǜǙǚǕǖŰűŨũṸṹŲųŪūṺṻỦủȔȕȖȗƯưỨứỪừỮữỬửỰựỤụṲṳṶṷṴṵṼṽṾṿẂẃẀẁŴŵẘẄẅẆẇẈẉẌẍẊẋÝýỲỳŶŷẙÿŸỸỹẎẏȲȳỶỷỴỵŹźẐẑŽžŻżẒẓẔẕɀÞþ”

en leur équivalent simple : “aAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAeaeAeaeaABbBbBbCcCcCcCcCcCcCcDdDdDdDdDdDdDdDdDZDZdzDZDZdzEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeFffGgGgGgGgGgGgHhHhHhHhHhHhhHhIiIiIiIiIiIiIiIiIIiIiIiIiIiIiIiIJijiJjKkKkKkKkLlLlLlLlLlLlLlLlLlLJLjljLMmMmMmNnNnNnNnNnNnNnNnNnNJNjnjoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOeoePpPpRrRrRrRrRrRrRrRrRrSsSsSsSsSsSsSsSsSsSsssssSSsTttTtTtTtTtTtTtTtTUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuVvVvWwWwWwwWwWwWwXxXxYyYyYyyyYYyYyYyYyYyZzZzZzZzZzZzzThth”

Il faut savoir qu’en Javascript et dans tous les outils modernes, les chaînes de caractère sont encodées en Unicode, standard qui attribue à chaque caractère un nom, et surtout un identifiant unique codé au maximum sur 21 bits. Pour les caractères es plus usuels (et donc pour les langues qui nous intéressent), le codage se fait  sur 16 bits, c’est à dire deux octets, soit 65536 caractères possibles.

Pour assurer une compatibilité avec les standards “préhistoriques”, les 256 premiers caractères correspondent aux caractères ASCII (pour la tranche 0-127) et aux caractères ISO 8859-1 (pour la tranche 128-255). Il faut juste ajouter un octet égal à 00 avant celui qui contient la valeur du caractère en ASCII ou en 8859-1. Le codepoint U+0065 correspond ainsi au caractère “e” (65 en ASCII, valeur hexadécimale), et le codepoint U+00E9 correspond au caractère “é” (E9 en ISO 8859-1, valeur hexadécimale).

Au delà, les caractères Unicode n’ont pas d’équivalent en ASCII ou en ISO 8859-1. C’est le cas par exemple du caractère “ł” utilisé en polonais, codé 0141 et dénommé “LATIN SMALL LETTER L WITH STROKE”.

Certains caractères sont des modificateurs : il y a souvent deux manières de coder une lettre modifiés par un diacritique : en utilisant un caractère unique comme U+00E9 pour “é” ou U+00F1 pour “ñ”, ou en saisissant à la suite un caractère de base (par exemple U+006E  pour “n”) et un ou plusieurs modificateurs (par exemple U+0303 = “◌̃”).

Enfin, certains caractères unicode sont des ligatures de plusieurs lettres simples, comme “œ”, qui représente “oe” en français.

Nous avons donc besoin d’une fonction qui :

  1. élimine les caractères modificateurs. Ex : n◌̃ –> n
  2. remplace tout caractère modifié par un diacritique par son équivalent simple. Ex : é –> e
  3. résolve les ligatures. Ex : œ –> oe
  4. ne s’intéresse qu’aux caractères latins, ignore les alphabets non latins (grec, cyrillique, arabe, hébreu, coréen…), et les écritures non alphabétiques (chinois…).
  5. et plus précisément soit valable pour le français, les langues européennes modernes, quelques langues exotiques (notamment le Vietnamien),  mais sans nécessairement prendre en compte les langues mortes ou rarissimes (alphabets expérimentaux africains, etc.), ni les caractères utilisés dans l’alphabet phonétique international, ce qui ne servirait qu’à ralentir le script

Fausse piste

L’élimination des modificateurs ne pose pas de problèmes : ils sont regroupés dans des “blocs” Unicode qu’il suffit de cibler, essentiellement le bloc “Combining Diacritical Marks” (U+0300–U+036F), et le bloc des suppléments (U+1DC0-U+1DFF). On peut facilement éliminer tous ces caractères en utilisant une fonction “replace”.

Le reste est un peu plus délicat : on peut récupérer sur le site du consortium Unicode un fichier listant tous les caractères, et qui indique les règles de “décomposition” d’un caractère complexe. La ligne

00EB;LATIN SMALL LETTER E WITH DIAERESIS;Ll;0;L;0065 0308;;;;N;LATIN SMALL LETTER E DIAERESIS;;00CB;;00CB

signifie que le caractère U+00EB dénommé “LATIN SMALL LETTER E WITH DIAERESIS” (ë) peut se décomposer en U+0065 (e) + U+0308 (¨), et que son équivalent en majuscule est U+00CB.

Je pensais utiliser ce fichier, mais il n’est malheureusement pas assez précis. Certains caractères que l’on peut légitimement considérer comme composés ne sont pas signalés comme tels. C’est le cas notamment du l barré polonais :

0141;LATIN CAPITAL LETTER L WITH STROKE;Lu;0;L;;;;;N;LATIN CAPITAL LETTER L SLASH;;;0142;

Tout ce que donne le fichier c’est un équivalent en majuscule…

Tripatouillage tabulé

J’ai donc privilégié une autre piste : recopier dans un fichier tabulé tous les caractères qui m’intéressaient, en utilisant les tableaux disponibles par wikipédia (mais les mêmes données sont aussi sur le site d’unicode) dans les pages décrivant les principaux blocs de caractères latins, et exploiter le nom de chaque caractère pour en déduire avec quelques formules son équivalent simple. Par exemple, “LATIN CAPITAL LETTER L WITH STROKE” désigne un L majuscule modifié par une barre. Son équivalent simple est donc “L”.

D’autre part, j’ai fait une sélection dans ce fichier pour ne pas tenir compte de quelques caractères extrêmement rares ou obsolètes, et surtout de lettres “exotiques” qui bien que faisant partie en théorie de l’alphabet “latin” au sens large, n’ont pas d’équivalent strict dans la série [a-z] : “glottal stop”, “whynn” et autre “kra” (utilisé en Inuit)…

Les caractères conservés ont été recopié dans une nouvelle feuille de calcul, puis à l’aide d’un tableau croisés dynamique assorti de quelques formules de concaténation et de remplacement, j’ai pu obtenir une série d’expressions de ce genre :

['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

Ensuite, il me suffit de remplir un array Javascript avec toutes ces expressions :

[
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

['Z',/[\u0179\u017B\u017D\u1E90\u1E92\u1E94]/g], // Z
]

et de passer les éléments tableau en argument à une fonction “replace”.

J’ai travaillé dans Excel, mais j’ai recopié le fichier tabulé dans Google Docs (il a fallu refaire les tableaux dynamique, les filtres, etc.). Il est consultable ici.

Un traitement en deux étapes

Je me suis aperçu que ma fonction risquait de trop ralentir le script, même si ça se compte en millisecondes.

Donc, dans la mesure où dans 9 cas sur 10, les mots récupérés dans un catalogue de bibliothèque français ou dans IdRef ne comprennent que des caractères “ordinaires” (entendez par là, codés sur un octet), j’ai repris mon fichier tabulé pour créer deux autres onglets : un qui traite les caractères codés sur un octet (+3 caractères sur deux octets que l’on peut trouver en français :Ÿ Œ œ), et un second qui traite tous les autres caractères.

On peut donc faire un premier tableau javascript traitant les lettres susceptibles d’être rencontrées en français :

['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5]/g], // a

et un second pour les lettres plus rares :

['a',/[\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a

A l’issu de la première phase du traitement, si on ne détecte aucun caractère codé sur deux octets, on peut sortir de la fonction. Dans le cas contraire, la fonction peut approfondir l’examen de la chaîne à traiter.

Finalement…

La fonction traite :

  1. tous les caractères latins codés sur 1 octet en Unicode (blocs C0 Controls and Basic Latin, also called Basic Latin et C1 Controls and Latin-1 Supplement), dont les lettres islandaises  Thorn et Eth, remplacées par “Th” et “D” (choix qui n’a aucune valeur officielle…)
  2. une sélection de caractères codés sur 2 octets en Unicode :

En plus des caractères modifiés par des diacritiques, elle “résout” les ligatures et digrammes suivants : SS/ss ; ae/Ae ; Oe/oe ; IJ/ij ; DZ/Dz/dz ; NJ/Nj/nj ; LJ/Lj/lj

Elle ne traite pas :

  1. les caractères de l’alphabet phonétique international, du bloc Latin Extended-C 2C60–2C7F et du bloc Extended-D A720–A7FF.
  2. les lettres “exotiques” qui bien que faisant partie de l’alphabet “latin” au sens large, n’ont pas d’équivalent strict dans la série [a-z] : “glottal stop”, “whynn”, “kra”, etc., sauf Eth et Thorn

Quelques remarques :

  • En Unicode, les umlaut allemands sont considérés comme des trémas -> ä, ü et ö deviennent a, u, o et non ae, ue, oe
  • O et o barré sont remplacés par O et o, mais on pourrait les transcrire également par Oe/oe
  • les d/D barrés sont transcrits d/D : normal en Vietnamien, mais ils sont usuellement transcrit par Dj dans les langues balkaniques
http://unicode.org/charts/PDF/UA720.pdf
Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Bricolons un peu avec IdRef…

[Note du 1er septembre 2011 : le script décrit dans ce billet a été légèrement modifié depuis. Je travaille à d'autres changements qui feront l'objet d'un prochain billet]

Cela ne saute sans doute pas aux yeux de nos lecteurs, mais l’un des manques du catalogue (HIP = Horizon information portal) de ma bibliothèque est l’absence d’import des autorités du Sudoc.

Pour parler français, lorsque dans le Sudoc il existe une fiche détaillant les différentes identités d’une personne (par exemple “Stendhal” = “Henri Beyle”, etc.) ou les (quasi-)synonymies entre certains concepts (par exemple “philosophie des arts” = “esthétique”), nous ne récupérons toujours que la forme de référence (Stendhal, esthétique).

Du coup, une recherche sur Henri Beyle ou Georges Rémi ne donnera rien, ou si peu, dans notre catalogue.

La solution idéale serait de changer de catalogue, mais comme ce n’est pas le genre de chose qui se fait en claquant des doigts, cela nous laisse le temps d’essayer de bricoler un peu.

Quand l’ABES a annoncé le lancement d’IdRef, j’ai tout de suite pensé qu’on pourrait utiliser cette application pour enrichir notre catalogue avec les autorités du Sudoc. J’ai d’ailleurs trouvé la même idée dans ce billet de Bibliothèques [reloaded]:

Exemple : (hypothèse de départ) mon opac permet d’afficher un message spécifique si l’internaute trouve 0 résultat. S’il y a 0 résultat, l’opac va interroger les autorités Sudoc, et trouver que les mots recherchés correspondent à une forme rejetée d’une notice d’autorités (exemple typique lié à des questions de translittération). Il récupère alors la forme retenue (celle qui est effectivement présente dans mes notices bibliographiques) et le propose comme rebond de recherche à l’internaute (rebond de recherche sur ma base, toujours).

Mais comme cela impliquait d’explorer à fond la syntaxe d’IdRef, et de se plonger la tête la première dans le javascript et/ou le php, je ne me suis pas senti pressé, vu que je n’ai jamais écrit un script fonctionnel de plus de 20 lignes jusqu’à présent. ;-)

Je ne sais pas si je dois remercier la météo, mais j’ai fini par m’attaquer au morceau au début de mes vacances… Le résultat est ce fichier javascript (700 lignes, mais beaucoup de blabla…) qui pourra se charger (bouton vert Install) dans Google Chrome sans autre forme de procès, ou bien dans Firefox après avoir au préalable installé l’extension Greasemonkey.

Le fonctionnement de mon script ne correspond pas exactement à la suggestion de Lully : la recherche dans IdRef est faite systématiquement, et pas seulement lorsque notre catalogue ne ramène aucune réponse.

Tout cela est très expérimental, et ne saurait être présenté à des lecteurs en l’état actuel. Mon but était avant tout de voir si cette idée pouvait avoir un début d’application, et quelles en étaient les limites (et accessoirement d’apprendre à programmer en javascript! D’ailleurs, il serait judicieux de rédiger une partie du code en php, mais c’est une autre histoire…)

La recherche simple

Le script ajoute aux pages de recherche simple et avancée de notre catalogue un nouveau panneau intitulé “Essai d’ajout de fonctions avec Greasemonkey“, qui présente plusieurs options.

nouveau panneau dans l'opac

nouveau panneau dans l'opac

Lors d’une recherche simple sur “Beyle”, en gardant les options par défaut, le nouveau panneau nous indique :

  • l’URL utilisée pour faire la requête dans idref : http://www.idref.fr/Sru/Solr?q=all:%22beyle%22&start=&rows=15&wt=json&fl=affcourt_z
  • l’index utilisé : “all” (on le retrouve dans l’URL)
  • le nombre de réponses trouvées : 5
  • le nombre de formes alternatives conservées : 1
  • l’url permettant d’avoir le résultat final dans notre catalogue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=%28beyle%20or%20stendhal%29&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims
recherche de Beyle

recherche de Beyle

Dans cet exemple précis, le script a trouvé 5 formes correspondant à Beyle dans IdRef (dont la dernière serait sans doute à corriger…) : “Beyle, Thad L. (1934-)”, “Beyle, Paul”, “Beyle, Pauline (1786-18..)”, “Stendhal (1783-1842)”, “Stendhal, Henri Beyle (1783-1842). Vie de Henry Brulard”.

Un peu de nettoyage

Mais toutes les formes commençant par “Beyle” ne nous sont pas très utiles, puisqu’elles ne font que reprendre notre terme de recherche. De plus, si l’on réinjecte ces expressions dans le catalogue, la présence des parenthèses va gravement perturber la recherche (c’est un défaut de HIP que j’ai découvert à cette occasion… :-( ). Il est donc nécessaire de “nettoyer” les formes obtenues, avant de les comparer avec la forme saisie par l’usager.

Par défaut, le script supprime donc tout ce qu’il trouve après la virgule, ce qui nous donne  : “Beyle”, “Beyle”, “Beyle”, “Stendhal, “Stendhal”, et ne garde que les formes nouvelles. En l’occurrence, il n’y en a qu’une : “Stendhal”.

Il est possible de modifier ce fonctionnement en cochant le bouton “”supprime les parenthèses uniquement”. Dans ce cas les prénoms sont conservés. Cela génère une équation de recherche plus fine, mais aussi plus lourde. On peut faire l’essai en cliquant à nouveau sur “Chercher”.

recherche de Beyle en changeant une option

recherche de Beyle en changeant une option

L’URL de recherche dans IdRef est la même, mais l’URL pour HIP est beaucoup plus longue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=(beyle%20or%20%22beyle%2C%20thad%20l.%22%20or%20%22beyle%2C%20paul%22%20or%20%22beyle%2C%20pauline%22%20or%20stendhal%20or%20%22stendhal%2C%20henri%20beyle%20.%20vie%20de%20henry%20brulard%22)&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims

Cela fonctionne de la même manière avec les expressions entre guillemets, qu’il faudra saisir bien de manière conforme à la structure des vedettes (“Blair, Eric” par exemple (avec la virgule!), et non “Eric Blair” pour obtenir la forme d’autorité, à savoir “Orwell, Georges”).

La recherche avancée

De même, on peut utiliser la recherche avancée, dont les champs seront “interprétés” avant d’être croisés les uns avec les autres (cela m’a demandé plus de travail, car il faut gérer plusieurs index, les opérateurs booléens, etc.)

Voici par exemple ce que donne une recherche (Auteur = beyle ET Sujet = beyle) :

Recherche Auteur Beyle et Sujet Beyle

Recherche Auteur Beyle et Sujet Beyle

L’URL pour HIP renvoit 26 réponses : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.AW&term=(beyle%20or%20stendhal)%20and%20.SW%3D(beyle%20or%20stendhal)&session=131EG779H4849.791973&menu=search&aspect=advanced&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=advanced&limitbox_1=&limitbox_2=&ultype=&uloper=%3D&ullimit=&ultype=&uloper=%3D&ullimit=&sort=&source=~!scdreims

On y trouve notamment la correspondance de Stendhal, puisque ce type d’ouvrage est indexé avec une vedette sujet au nom de l’auteur.

correspondance de Stendhal

correspondance de Stendhal

Quels index interroger dans IdRef  et avec quelle troncature?

Je n’ai pas évoqué l’option proposé concernant le “mode d’interrogation d’IdRef” : par défaut, on procède à une recherche “tous mots” dans IdRef, au moyen de l’index “all”. Mais cette recherche peut être parfois trop générale, et ramener trop de réponses. Par exemple, si vous cherchez “Michel” dans un catalogue, il y a des chances que ce soit le nom de famille de la personne (Louise Michel par ex.) qui vous intéresse, et pas son prénom! Mais vous pourrez injurier votre index tous mots tant que vous voudrez, jamais il ne vous fera le plaisir de distinguer les noms et les prénoms. Il renverra donc imperturbablement 17 607 réponses comportant le mot “Michel”. Difficilement exploitable…

Comme on ne peut malheureusement pas faire des recherches par noms de famille dans IdRef (comme je l’expliquais dans le billet précédent), j’ai eu recours à un expédient : utiliser les index de type “phrase”, qui sont alimentés par le contenu entier et exact des zones indexées, et non par les mots qui les composent. Concrètement (j’espère que je ne dis pas de bêtises), en explorant les index de type mot d’IdRef, on peut accéder à l’autorité “Michel, Louise (1830-1905)” en cherchant “Michel”, “Louise, ” (1830-1905)”, “Michel, Louise”, “Michel, Louise (1830-1905)” et même “Louise (1830-1905)”!

Par contre, en explorant les index de type phrase, il faut impérativement saisir la forme complète et exacte de son nom : “Michel, Louise (1830-1905)”. Si l’on omet le prénom, ou même les dates, la réponse sera vide. Donc, si on veut trouver toutes les personnes dont le nom de famille est Michel, ou toutes les Louise Michel (quelque soit leur date de naissance), il faut utiliser une troncature.

(Je suis en train de réaliser qu’une armée de juges a dû rêver de troncaturer Louise Michel. Louise, si tu me lis, promis, ma troncature est pacifique…)

Louise Michel en 1871

Louise Michel en 1871

En cliquant sur “plusieurs index ‘phrase’ (avec les diacritiques ; troncature grossière)” on créera une équation de recherche assez longue, qui additionne tous les index de type “phrase” disponibles dans IdRef. J’étais curieux de voir si les résultats seraient différents, et effectivement, ils le sont parfois. Pour “Michel”, cette option permet de ne récupérer “que” 1090 réponses.

Je vais illustrer cette option par la recherche (Auteur Beyle et Sujet Beyle) que j’avais déjà commenté plus haut.

recherche Auteur Beyle et Sujet Beyle en changeant le mode d'interrogation

recherche Auteur Beyle et Sujet Beyle en changeant le mode d'interrogation

Voici l’URL d’interrogation de IdRef générée pour compléter l’index Auteur de HIP : http://www.idref.fr/Sru/Solr?q=%28persname_s:beyle*%20or%20corpname_s:beyle*%20or%20geogname_s:beyle*%20or%20famname_s:beyle*%20or%20uniformtitle_s:beyle*%20or%20name_title_s:beyle*%20or%20trademark_s:beyle*%29&start=&rows=15&wt=json&fl=affcourt_z.

L’URL pour l’index Sujet de HIP est un peu plus longue, car j’ai ajouté une interrogation de l’index “nom commun” (autrement dit, Rameau et Fmesh) de IdRef (subjectheading_s), qui aurait été inutile pour enrichir l’index Auteur (puisqu’un nom commun ne peut pas être auteur d’un document, alors qu’un nom propre peut être à la fois auteur et sujet…)

La troncature est cependant grossière, ce qui peut engendrer du bruit : un joker ( * ) est tout simplement ajouté après l’expression saisie par l’usager.

Dans le cas d’une recherche sur “Beyle”, on récupère non seulement 3 des formes que l’on avait trouvées en utilisant l’index “all” (“Beyle, Thad L. (1934-)”, “Beyle, Pauline (1786-18..)”, “Stendhal (1783-1842)”) mais également Van Beylen, Marcel Beyleveld, Deryck Beyler, Louis Beylerian, Onnig (1947-….) Beyler, Jean-Noël (19..-….) Beyleryan, Arthur A.

En cherchant “Beyle*” ou “Michel*”, on a donc encore trop de bruit, car a priori ni Jean-Noël Beyler ni Jules Michelet ne nous intéressent.

J’ai donc essayé de faire une troncature plus fine construite ainsi : (mot OU mot+espace+* OU mot+point+* OU mot+virgule+*). Logiquement, cela devrait couvrir tous les types d’autorités.

Pour “Michel”, cette option donne encore 708 réponses, ce qui fait encore beaucoup, mais ce n’est pas surprenant car Michel est un nom de famille courant.

Pour “Beyle”, voici l’URL d’interrogation de IdRef générée avec cette option : http://www.idref.fr/Sru/Solr?q=%28persname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20corpname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20geogname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20famname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20uniformtitle_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20name_title_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20trademark_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%29&start=&rows=15&wt=json&fl=affcourt_z

Cette fois, on ne trouve que 3 réponses : “Stendhal (1783-1842)”, “Beyle, Pauline (1786-18..)” et “Beyle, Thad L. (1934-)”.

Wanted : Paul Beyle. Forte récompense.

Tout serait parfait si ce n’était la disparition mystérieuse de “Beyle, Paul” que nous avions trouvé avec la première options (la recherche avec l’index global ‘all’), mais qui n’apparait pas avec l’index persname_s, que ce soit avec la troncature grossière ou plus fine.

La preuve : http://www.idref.fr/Sru/Solr?q=all:%22beyle,%20paul%22 permet de retrouver sa fiche, alors que http://www.idref.fr/Sru/Solr?q=persname_s:beyle,\%20paul* ne donne aucune réponse…

Je pense avoir trouvé un début d’explication en examinant le détail de la réponse à la première de ces requêtes. Voici le code XML généré :

Quelques remarques sur ce code :

  • J’imagine que les balises “arr” désignent des tableaux (arrays), comprenant un ou plusieurs composants, et que les balises “str” contiennent des chaînes (string).
  • Les attributs “name” désignent des noms d’index : “all” (l’index général), “persname_t”, “ppn_z”, et plein d’index permettant de faire des limitations (dates, langue, nationalité, type de notice, emploi, etc.)
  • Le nom complet figure deux fois dans l’index “all”. J’ignore pourquoi.
  • Tous les index spécifiques sont repris dans l’index “all”
  • Il n’y a pas d’index “persname_s” (index de type ‘phrase’ pour les personnes physiques)

J’en conclus que l’absence d’index “persname_s” dans cette fiche est une anomalie qui empêche de retrouver “Beyle, Paul” dans cet index.

Par comparaison, voici la fiche de “Beyle, Pauline” en XML (uniquement la partie <doc>…</doc>) :

Dans les dernières lignes on trouve bien une double indexation persname_t (personne, index mot) et en persname_s (personne, index phrase).

Dieu et l’ABES seuls savent pourquoi Paul Beyle y a échappé (absence de dates entre parenthèses ? manque de bol ? mauvais karma ?)

Mais ce n’est pas tout : en dépouillant ces fichiers XML, j’ai eu surprise encore plus mauvaise : Trrremblez mortels, car la faucheuse rôde sur IdRef!

IdRef, mis KO par la mort…

La danse des morts dans IdRef, vue par Holbein

Les morts dansant la gigue dans les serveurs d'IdRef (Holbein)

Dans l’index tous mots “all”, on trouve non seulement les noms et dates des entités décrites, mais aussi le PPN ou des mots clés comme  “FR” ou “fre”. Jusque là, rien de gênant. Cela pourrait même être pratique.

Là où les choses se gâtent, c’est quand des informations concernant les règles d’usage de l’autorité ou le statut des personnes vis à vis de l’état civil sont codés au moyen de mots qui ont une signification en français : “mort”, “autre”, “ko”, “ok”, “a”.

Faites donc l’expérience de rechercher dans l’interface publique d’IdRef des mots comme “mort” ou “ko” en sélectionnant le dernier index (“Tout”) du menu déroulant, et vous aurez une mauvaise surprise :

La mort rôde dans IdRef

La mort rôde dans IdRef

La recherche “ko” en tous mots donne 2212960 résultats. La recherche “mort”, 309329 résultats, et la recherche “autre”, 1957180 résultats !

Je pense qu’il serait bon que ces clés d’index soient renommées (ou ne soient plus interrogeables par “all”, mais ce serait dommage).

Enfin, je finirai ce billet par quelques remarques sur la syntaxes d’IdRef, qui ne sont pas encore toutes documentées par l’ABES.

La syntaxe d’IdRef : échapper pour que rien ne s’échappe

Toutes mes requêtes commencent ainsi : “http://www.idref.fr/Sru/Solr?q=”, puis j’ajoute les paramètres, et je les termine par “&start=&rows=15&wt=json&fl=affcourt_z”

  • “fl=affcourt_z” signifie que je ne veux obtenir qu’un seul élément : la forme d’autorité. Pas besoin du PPN, des formes rejetées ou d’autres champs.
  • “start=&rows=15″ signifie que ne je veux les 15 premières réponses. On pourrait très bien mettre 30, 300 ou 3000, mais le risque est de récupérer un flot de données trop importantes à exploiter… Cette option est modifiable au moyen d’une la liste déroulante dans le panneau de gauche.
  • “wt=json” signifie que je souhaite obtenir les résultats au format JSON. On pourrait les récupérer en XML, mais bon, c’était l’occasion de découvrir JSON…

La construction des paramètres, voila le gros morceau! D’autant plus  que les règles sont différentes selon les types d’index…

Voici comment cela se présente pour la troisième option (la plus complexe, index phrase avec troncature “fine”) :

  • ((INDEX1) or (INDEX2) or (INDEX3)…. )
  • chaque expression (INDEXn) est en fait elle-même composite. Voici la première : (persname_s:(beyle beyle\ * beyle.* beyle,*)

Quelques remarques :

  • entre chaque index, il faut utiliser le booléen “or”, mais au sein d’un même index, pour avoir le même effet, il faut séparer les termes par un espace. Sinon, le mot “or” sera interprété comme la vedette décrivant le métal précieux…
  • dans les index phrase, tout doit être mis en minuscules mais contrairement aux index mot, les diacritiques (accents, cédilles, etc.) doivent être conservés, y compris les majuscules accentuées
  • Dans l’url, ces diacritiques doivent être codés en  ISO 8859 et non en UFT-8. Par exemple “é” doit être codé %E9 et non %C3%A9. Ce qui a pour conséquence la non indexation de mots comprenant des caractères non représentables en ISO 8859.
  • il faut ajouter “\” devant certains caractères pour empêcher que le script leur attribue une valeur spéciale. En informatique, c’est ce qu’on appelle un “échappement”. Cela s’applique :
    • aux parenthèses ouvrantes et fermantes
    • à l’espace

Ainsi, pour rechercher le géographe “Reclus, Élisée (1830-1905)” avec cet index, et sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=persname_s:reclus,\%20%C9lis%E9e\%20\%281830-1905\%29

Par contre, pour les index mot, comme l’index “all” :

  • il ne faut pas “échapper” les espaces et les parenthèses
  • on peut utiliser les guillemets doubles ” ” pour encadrer les expressions composés de plusieurs mots séparés par un espace
  • tout doit être mis en minuscule, mais il faut aussi supprimer les diacritiques

Pour rechercher la même personne avec l’index “all”, toujours sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=all:%22reclus%2C%20elisee%22

Je reviens sur cette histoire d’encodage des caractères qui n’est pas évidente. Prenons par exemple un nom polonais, comme Kościuk, Jacek. Une URL ne peut pas comprendre de caractères spéciaux, c’est à dire non inclus dans le code ASCII original (128 caractères), et ne doit d’ailleurs pas comprendre certains caractères comme l’espace, le point, etc…  Pour qu’un navigateur comprenne le “s accentué”, il faut donc l’encoder selon le standard UTF-8. Le code hexadécimal correspondant est “%C5%9B”. Il est faut donc deux octets pour le représenter (C5 et 9B).

Par contre, coup de bol, la plupart des caractères propres au français (sauf Ÿ, Œ, œ) peuvent certes être représentés sur deux caractères en UTF-8, mais aussi en un seul caractère selon d’autres standards.

Le Sudoc, et la plupart des sites modernes sont capables de gérer une URL comprenant des caractères en UTF-8. Voici un lien dans le Sudoc vers le livre dont ce monsieur est l’auteur : http://www.sudoc.abes.fr/DB=2.1/CMD?ACT=SRCHA&IKT=1004&SRT=RLV&TRM=Ko%C5%9Bciuk%2C+Jacek

Or, dans IdRef, que ce soit l’interface publique (0 résultats pour le terme ” Tout=Kościuk, Jacek”) ou le webservice, impossible de retrouver notre ami polonais! Même en remplaçant le “s accentué” par un “s” normal ou par “?”, et en interrogeant l’index “all”…

Conclusion

J’ai monté une vraie usine à gaz, qui n’est pas très fonctionnelle. Je doute que l’idée de départ soit finalement applicable, car IdRef renvoie souvent trop de réponses pour construire une URL qui ne fasse pas des km dans HIP. En plus je me demande si interroger le serveur de notre catalogue avec des équations si longues ne risque pas de le faire “surcharger” d’une manière ou d’une autre. Mais il faudrait quelqu’un de plus compétent que moi en informatique pour le dire.

Par contre, cela m’a permis d’aiguiser mes compétences en javascript, et de mieux comprendre le fonctionnement d’IdRef, et de relever quelques points délicats (échappement dans les index phrase) ou gênants (non indexation de certaines notices, pollution de l’index all par des certains mots clés).

J’espère que cela pourra être utile à d’autres personnes. Si vous voulez copier des morceaux de mon code pour votre usage, n’hésitez pas.

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

IDREF : une application qui pourrait être encore plus puissante

Depuis quelques semaines, je tripote dans tous les sens Idref, l’application de l’ABES permettant de consulter les autorités du Sudoc (et des autres bases de l’ABES : Calames et STAR).

L’application est en ligne depuis octobre 2010, mais l’ABES a depuis quelques mois ajouté plusieurs fonctionnalités. En plus d’une précieuse documentation technique, l’ABES a mis en ligne une page de démonstration illustrant la possibilité d’établir des liens et d’échanger des données entre Idref et des applications externes.

Je voudrais faire une petite démonstration, et surtout évoquer une limitation d’IdRef que j’ai découvert à cette occasion.

Votre appli >IdRef > votre appli

Le fonctionnement du dispositif est expliqué dans ce billet du blog technique de l’ABES, qui renvoie à d’autres liens.

Précisons que la page de démonstration utilise une “base de test”, donc les résultats ne sont pas forcément ceux qu’on aurait en interrogeant directement IdRef, mais cela ne change absolument rien au principe (pour interroger la base de production, si j’ai bien compris, il suffirait de remplacer dans le code de la page var remoteSrv="http://193.52.69.127:8080/autorites/remoteAutorites.html" par var remoteSrv="http://www.idref.fr/autorites/remoteAutorites.html")

Petite démonstration en images :

Remplissons les champs “nom” et “prénom” avec ceux de la personne recherchée.  Au hasard, un certain Yann Nicolas…

Page de test d'IDREF : recherche de Nicolas, Yann

Page de test d'IDREF : recherche de Nicolas, Yann

Après validation du formulaire, une nouvelle page s’ouvre, dans laquelle IdRef renvoie les trois notices correspondant à notre recherche :

Les 3 Yann Nicolas dans IDREF

Les 3 Yann Nicolas dans IDREF

Cliquons sur le Yann qui nous intéresse (le spécialiste des Maoris…) :

IdRef : notice de Yann Nicolas (1973)

IdRef : notice de Yann Nicolas (1973)

Et maintenant, laissons nous-tenter par cet alléchant bouton “lier la notice” en bas de la page. Son activation va automatiquement envoyer dans notre page “votre appli > IdRef > votre appli” les informations tirées de la notice en cours d’affichage.

Page de test d'IDREF : après récupération des données

Page de test d'IDREF : après récupération des données

Plutôt cool non?

Mais un détail me chiffonne néanmoins…

Une gestion des noms qui manque de finesse

Videz les formulaires, et refaites la même requête en inversant le nom et le prénom :

De Yann Nicolas à Nicolas Yann

De Yann Nicolas à Nicolas Yann

Surprise! Le formulaire renverra les même trois notices dans IdRef.

Autrement dit, tout se passe comme si nom et prénom étaient interchangeables…

J’ai d’abord cru à une petite erreur dans le code, mais après un bon moment passé à essayer de décortiquer tout cela (merci Firebug!), je pense qu’il s’agit d’une limitation plus fondamentale d’IdRef (et peut-être de Solr, sur lequel l’application est construite).

Voici les différentes étapes de la requête :

  1. Le formulaire concatène tous les paramètres de la recherche dans une chaîne et les envoie à une page externe.  Voici à quoi ressemble cette chaîne : “Index1=Nom%20de%20personne&Index1Value=yann%20nicolas&Index2=&Index2Value=&Index3=Langues&Index3Value=&Filtre1=Type%20de%20notice/Personne&z200_a=nicolas&z200_b=yann&z101_a=&z103_a=20100101&z810_a=une%20autre&AutoClick=true”. On y trouve à la fois le nom (index z200_a), le prénom (index z200_b) et une chaine nom+prénom.
  2. Cette chaîne est traitée par une page http://www.idref.fr/autorites/remoteAutorites.html qui ne s’affiche pas mais renvoie la requête vers une 3e page.
  3. La 3e page http://www.idref.fr/autorites/autorites.html est celle où les informations seront affichées, en fonction des réponses du serveur.
  4. Cette page interroge le serveur en envoyant la requête suivante : “http://www.idref.fr/Sru/Solr?q=persname_t:%20(nicolas%20AND%20yann)%20AND%20recordtype_z:a&sort=score%20desc&version=2.2&start=0&rows=30&indent=on&fl=id,ppn_z,recordtype_z,affcourt_z”. Dans les paramètres, on ne retrouve plus que “(nicolas AND yann)”, sans distinction du nom et du prénom.

CQFD.

Dans la documentation technique, rien n’indique la possibilité d’interroger spécifiquement le nom, le prénom, la date de naissance, la date de mort, ou tout autre élément de ce genre. A tout hasard, j’ai essayer de bricoler l’url avec des requêtes du genre “http://www.idref.fr/Sru/Solr?z200_a=nicolas”, mais tout ce que j’obtiens ce sont des messages d’erreur.

Est-ce si grave? Sans doute pas, mais c’est un peu agaçant tout de même, car les notices comportent des informations potentiellement intéressantes, qu’il est impossible d’interroger. Alors, certes, dans le Sudoc et dans WinIBW (notre outil de catalogage), il n’est pas non plus possible de faire ce genre de recherches, mais il est dommage qu’un nouvel outil comme IdRef ne le permette pas. Je ne sais pas si c’est une limitation due au fonctionnement même de l’outil, ou si l’ABES a choisi volontairement de restreindre le nombre d’index.

Peut-être quelqu’un de bien informé pourrait-il m’en dire plus?

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Google scholar ratisse (trop) large

Tous les documentalistes et bibliothécaires savent qu’il ne faut utiliser Google scholar qu’avec prudence lorsqu’on recherche des articles scientifiques.

Car, ainsi que l’explique ce wiki réalisé par l’URFIST PACA (mais de nombreux tutoriels donnent les mêmes informations) on peut faire de nombreuses reproches au moteur :

  • Pas de listes des éditeurs commerciaux et des serveurs d’archives qu’il indexe
  • Pas d’informations sur le type de document traité et la période couverte
  • Couverture réelle non précisément connue
  • Opacité de l’algorithme de classement des résultats et de celui du calcul des citations
  • Des résultats moins complets que l’interface d’interrogation des bases natives

Mais je pensais du moins que Google Scholar se contenait d’interroger des sources scientifiquement fiables : sites d’éditeurs, archives institutionnelles, etc.

Quelle n’a pas été ma surprise en constatant que le moteur avait indexé mon mémoire de DUT déposé uniquement sur ma page personnelle!

Sans vouloir jouer les faux modestes, mon mémoire de DUT n’est qu’un mémoire de DUT… Et rien ne garantit sa qualité, ni même son authenticité. Je pourrais très bien ne jamais avoir soutenu ce mémoire (ce qui n’est pas le cas, heureusement pour moi), ou bien l’avoir largement remanié après sa soutenance (d’ailleurs, si je me souviens bien, j’avais corrigé quelques broutilles avant de le mettre en ligne. Ce n’est donc pas une copie exacte au mot près à l’exemplaire de soutenance, déposée à la bibliothèque de l’IUT de Nancy II).

J’imagine que mon cas est loin d’être isolé. J’ignore comment procède Google, mais je suppose qu’il doit rechercher des documents pdf contenant certains mots clés (“mémoire” “soutenu sous la direction de…”, “bibliographie”…), ou contenant des références bibliographiques, sans quoi tous les fichiers pdf de la toile seraient indexés. Un algorithme doit également permettre de retrouver mon nom à partir de la page de titre du mémoire, à moins que Google n’utilise pour cela les informations de mon site personnel.

En tout cas, cela m’aura permis de me faire une idée des technologies de pointe utilisées pour alimenter Google Scholar…

Au coeur des serveurs de Google, une technologie de pointe...

Au coeur des serveurs de Google, une technologie de pointe...

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

La place de l’ABES dans la politique nationale de l’Information scientifique et technique

[Nombreuses coquilles corrigées le 16/7.]

Voici quelques notes faisant suite au précédent billet consacré aux Journées ABES. Il s’agit d’une petite synthèse que j’ai d’abord faite pour moi-même, mais qui pourra peut-être servir à ceux qui ont n’ont pas suivi en détail les évolutions institutionnelles de ces dernières années.

Martine réorganise l'ISTLa MISTRD

En préambule, je rappellerais que l’organisation du ministère de l’Enseignement Supérieur et de la Recherche a été profondément remaniée en par le décret du 16 mars 2009, notamment pour prendre en compte les conséquences de la LRU et de la RGPP (Révision générale des politiques publiques). Deux arrêtés ont été pris le même jour, pour préciser l’organigramme et pour créer un “pôle de contractualiation et de financement des établisssements de formation et de recherche”. Fin 2009, un article d’A. Colas paru dans le BBF a fait le point sur les conséquences pour les BU.

Les changements importants sont l’association entre la politique documentaire et l’IST et l’affirmation du caractère transversal de cette mission.

Ainsi, dans la définition des missions de la DGES (Direction générale de l’Enseignement Supérieur), avant 2009, on pouvait lire ceci :

Elle élabore la politique de développement et de modernisation de la documentation et des bibliothèques universitaires.

Depuis 2009, ce rôle est formulé différemment (la bibliothèque en tant que lieu n’est plus mentionnée, et la “politique de développement et de modernisation de la documentation” est remplacée par une “politique documentaire” autrement plus chic), il est associé à la politique de l’IST, et surtout doit s’exercer conjointement avec l’autre direction générale (DGRI, Direction générale de la recherche et de l’innovation).

Conjointement avec la direction générale pour la recherche et l’innovation, elle élabore les politiques documentaire et d’information scientifique et technique, ainsi que la politique de l’emploi scientifique, et assure la cohérence du système d’information de l’enseignement supérieur et de la recherche.

En toute logique, on retrouve une phrase symétrique dans l’article définissant le rôle de la DGRI.

En outre, depuis le 20 juillet 2010, la DGESIP “définit la politique de diffusion et d’utilisation des technologies de l’information et de la communication pour l’enseignement supérieur et favorise le développement des ressources et des services pédagogiques numériques.”. Ce point ne concerne pas directement les bibliothèques, mais il y a évidement une opportunité à saisir pour les SCD.

Concrètement, avant 2009, c’est la Sous-Direction des Bibliothèques et de l’Information Scientifique, dépendant de la DGES, était en charge de l’ABES, et indirectement des BU. Une autre structure, plus petite, le bureau de l’IST, dépendait de la DGRI.

Ces deux instances ont fusionné dans une Mission de l’information scientifique et technique et du réseau documentaire (MISTRD), dépendant du Service de la coordination stratégique et des territoires, service commun à la DGRI et à la DGESIP (Direction générale pour l’enseignement supérieur et l’insertion professionnelle), nouveau nom de la DGES.

La disparition du mot “bibliothèques”, la rétrogradation dans l’organigramme (la sous-direction devenant une simple mission) et le flou entourant les conséquences pratiques de cette réforme n’ont pas été sans entraîner une réelle appréhension chez certains collègues.

L’avenir institutionnel de l’ABES

Au grand jeu de la RGPP, il y a des gagnants et des perdants. Dans notre domaine, le perdant est incontestablement l’INIST, qui risque d’être démantelé, comme le déplorent les syndicats et l’AG du personnel.

Au contraire, le rôle de l’ABES n’est absolument pas remis en cause, et semble plutôt renforcé.

Sur le modèle des universités, l’ABES sera évaluée par l’AERES (qui cherchera surtout à établir des comparaisons entre l’ABES et ses équivalents étrangers) et un contrat d’objectif quadriennal établi pour 2012-2015 en tenant compte de cette évaluation. La question de l’articulation entre ce contrat et le projet d’établissement que l’ABES est en train d’élaborer reste encore à préciser.

La MISTRD pousse l’ABES à se nouer des partenariats avec les universités de Montpellier (campus commun, association avec des laboratoires locaux…). Les dates du contrat quadriennal ont d’ailleurs été pensées pour faciliter de tels  projets.

Enfin, l’ABES doit se rapprocher du CERIMES, avec lequel elle collabore déjà pour les Signets des universités. Les modalités devraient être fixées cet été (fusion totale, fusion partielle, collaboration renforcée ?).

De nouvelles missions pour l’ABES

Dans le cadre de la RGPP, les administrations centrales sont appelées à se recentrer sur les fonctions “stratégiques”, les fonctions “opérationnelles” étant confiées à des opérateurs.

La MISTRD n’a pas fait exception à la règle, et en 2010, elle a confié 4 missions nationales à l’ABES :

  1. Mission thèses :
    • L’ABES assure la modernisation du Fichier central des thèses, la formation professionnelle et des usagers, les aspects de la normalisation relatifs aux thèses.
    • Elle partage avec le ministère la politique de valorisation et de diffusion, le portail des thèses (l’ABES assure la partie technique, mais les choix ont été faits en collaboration avec le ministère), le conseil aux établissements, la rédaction de documents de référence.
    • Enfin, le pilotage reste du ressort du ministère : habilitation et tutelle d’établissements (universités, ANRT, Presses universitaires…), questions juridiques (propriété intellectuelle…).
  2. Normalisation : Il s’agit de suivre et d’anticiper les changements des normes et formats, de participer aux instances nationales et internationales, et  de diffuser les informations au réseau. Si j’ai bien compris, cette mission a été entièrement transférée de la MISTRD à l’ABES, qui a engagé Philippe Le Pape pour la mener à bien.
  3. Pilotage des rétroconversions : l’ABES fera réaliser une enquête par un prestataire, prélude à une refonte du dispositif de soutien financier aux établissements. Cette mission a été entièrement transférée.
  4. Réseaux et projets collaboratifs :
    • modernisation du PEB
    • refonte des relations avec les centres du SUDOC-PS sur la base d’une contractualisation
    • projet d’ERMS Couperin.

Il est sans doute trop tôt pour faire un bilan définitif de ces transferts, mais L’ABES estime que qu’ils se sont fait de manière satisfaisante (affectation de crédits et de personnel). Néanmoins cela vient s’ajouter à la longue liste des projets déjà en cours, ce qui explique que l’agence ne puisse plus consacrer autant de temps qu’il y a 4 ou 5 ans à l’assistance au réseau, notamment en matière de catalogage…

A mon sens, il y avait une réelle logique à confier certaines de ces tâches à l’ABES, compte tenu des compétences et de l’expérience accumulées à Montpellier, et des applications déjà gérées par l’agence. Le cas le plus flagrant est sans doute celui du signalement des thèses en cours. Il a toujours été imparfait et incomplet (les thèses de sciences n’étaient pas concernées), et reposait sur le Fichier central des thèses, application obsolète et peu ergonomique, gérée par Paris 10 qui souhaitait s’en débarrasser. L’ABES a profité de ce transfert pour élargir le périmètre du futur portail des thèses, auquel le contenu du FCT sera agrégé. Au final, la qualité du service rendu devrait en être nettement améliorée.

Concernant la mission Normalisation, je me demande s’il ne serait pas possible de clarifier les missions respectives de l’ABES et de la BNF, ou de faire un site commun pour ce sujet. Prenons par exemple un sujet brûlant, comme le RDA. Vous trouverez des informations au sujet de ce nouveau code de catalogage sur le site de l’ABES, sur le blog rda@abes.fr, ouvert récemment, mais aussi sur le site de la BNF (page à jour du 11/08/2010, autrement dit, à réactualiser rapidement…), et je ne compte pas le site du groupe technique sur l’adoption de RDA, qui tient plus du site institutionnel.

La BSN, nouveau cadre de l’action de la MISTRD

Les acteurs de l’IST et de la documentation sont nombreux, et de statut variés (ABES, CNRS, Adonis, Inist, CCSD, Cléo, Inria, CINES, ADERES, BNUS, Persée, BNF, Couperin…).

Le grand projet du ministère depuis plusieurs années est de créer une « Bibliothèque scientifique numérique »  qui permettrait d’encadrer et de donner le plus de cohérence et d’efficacité possible à l’action de ces différents intervenants. Contrairement à ce que laisse entendre son nom, la BSN n’est donc pas une bibliothèque, mais un dispositif de financement et de coopération, qui a le statut carrément pompeux de TGIR (Très grande infrastructure de recherche).

Je m’aperçois que je suis passé insensiblement du conditionnel au présent. Je ne corrigerai pas ce flou, qui me semble consubstantiel à ce projet, initié en 2008, budgétisé depuis 2010 (ou 2009?) , et dont l’organisation semble à peine se dessiner en 2011…

J’ai cru comprendre que des précisions sur sa gouvernance et ses missions devraient être apportées cet été. Peut-être cela a-t-il déjà été fait, mais dans ce cas l’information m’aura échappé.

L’expression “BSN” est issue du rapport France Numérique 2012, dit Rapport Besson, d’octobre 2008 (p. 55). Mais dans ce rapport, la BSN était exclusivement conçue comme une offre de formation en ligne :

Action n°97 : Construire une bibliothèque scientifique numérique accessible à tous les usagers de l’enseignement supérieur et de la recherche.

Peu de données statistiques sont disponibles sur la formation et l’orientation à distance.  Les données comparatives d’Eurostat, placent la France au 4e rang avec près de 30 % de personnes déclarant s’être formées sur ordinateur. Modalité devenue majeure de la formation tout au long de la vie, la formation à distance délivrée, au moinspartiellement, en ligne est un enjeu fort des années à venir tant pour les organismes spécialisés du domaine quepour les établissements d’enseignement supérieur impliqués depuis longtemps dans ce secteur. Afin d’augmenter la proportion des personnes formées à distance il convient d’adapter et de diversifier l’offre de formation en ligne.

Les contours actuels de la BSN, et son statut de TGIR, ont en réalité été définis dans la “feuille de route” française pour des grandes infrastructures de recherche européennes, rendue publique par V. Pécresse en décembre 2008 (p. 61) :

Nature de la TGI

BSN est une plateforme de  coopération pour  l’accès à la littérature scientifique numérique.

Description et objectifs scientifiques

BSN est un dispositif de financement et de coopération destiné à accompagner le développement  et l’usage de la littérature scientifique numérique. Il regroupe de nombreux  instruments répondant à des besoins bien identifiés d’accès direct aux ouvrages scientifiques et aux revues en y associant des outils d’intégration de sources documentaires. Forme renouvelée d’une partie du secteur communément appelé « information scientifique et technique » mais  prenant en compte l’évolution des pratiques des chercheurs, elle facilite la mise en relation et la navigation entre les documents édités (revue  numérisée ou numérique, de façon rétrospective ou actualisée) ou destinés à circuler dans les communautés scientifiques (archives ouvertes). BSN assure des missions de communication, de diffusion et de préservation de ces documents scientifiques. Il intervient :

• En appui des partenaires pour aider à la  numérisation et promouvoir des normes internationales pour une inter-opérationnalité accrue.

• Pour soutenir la mise en relation des projets français avec les projets internationaux.

• Pour assurer l’archivage pérenne de l’ensemble des documents.

La gouvernance et l’organisation  de BSN sont actuellement en cours de définition. Leurs contours dépendent étroitement des orientations prises pour le domaine de l’information scientifique et technique et retenues par le rapport Salençon.

Situation dans le monde

BSN accompagne la mise en visibilité de la littérature scientifique française, facilite leur intégration dans les dispositifs européens ou internationaux (initiative européenne sur le libre accès, août 2008) et améliore l’accès à la littérature scientifique internationale.

Communauté scientifique concernée

L’ensemble des disciplines est concerné par le  projet. Le degré d’avancement varie nettement d’un champ à un autre, la communauté française des mathématiciens figurant comme les pionniers en la matière. Les SHS se caractérisent par des besoins importants et diversifiés suscitant de nombreuses initiatives en partie coordonnées devant associer  plus étroitement l’ensemble des producteurs de recherche (établissement de recherche, écoles, université).

BSN se développera en prenant en compte les projets initiés par les acteurs publics tels le ministère de la culture et de la communication, la Bibliothèque Nationale de France, les éditeurs universitaires et les acteurs privés tels les éditeurs scientifiques et les intégrateurs.

Budget

Coûts de fonctionnement (valeur 2009) : 3 M€

En farfouillant dans les documents budgétaires, j’ai trouvé des traces de la BSN dans les PAP  2010 et 2011 de la mission “Recherche et enseignement supérieur”.

Dans le PAP 2010, on peut lire ceci p. 94 :

Dotation pour la montée en charge de la bibliothèque scientifique numérique -BSN- : 8,6 M€.

Le projet BSN a pour objectif majeur de permettre à l’ensemble des acteurs de l’enseignement supérieur et de la recherche d’accéder, sous forme numérique, à une offre de ressources scientifiques éditées abondante, de qualité et répondant aux standards internationaux. Cette offre doit constituer un indispensable instrument de travail pour tous les chercheurs et les étudiants du territoire. A ce titre, la BSN intervient sur les axes suivants : acquisition de ressources, numérisation du patrimoine scientifique (notamment le programme Persée), archives ouvertes (notamment HAL), circulation et valorisation de la production scientifique, préservation des données numériques à long terme (avec le CINES).
- PERSEE (portail d’accès à de grandes revues scientifiques numérisées en sciences humaines et sociales) : 0,6 M€,
- Groupements d’achat de ressources électroniques (hors ABES) : 0,4 M€,
- Outils collectifs (ABES, CINES pour l’archivage pérenne) : 3,6 M€
- Licences nationales, il s’agit là d’une enveloppe de départ destinée à améliorer les modalités d’accès aux ressources scientifiques numériques : 4 M€

Soit 4+3,6+0,4+0,6 = 8,6 millions d’euros. Plus que les 3 millions annoncés dans la feuille de route, mais j’y reviendrai.

Le projet se présente de manière proche en 2011 (p. 100) :

- montée en charge de la bibliothèque scientifique numérique (BSN) (6,4 M€)
Le projet BSN a pour objectif majeur de permettre à l’ensemble des acteurs de l’enseignement supérieur et de la recherche d’accéder, sous forme numérique, à une offre de ressources scientifiques éditées abondante, de qualité et répondant aux standards internationaux. Cette offre doit constituer un indispensable instrument de travail pour tous les chercheurs et les étudiants du territoire. A ce titre, la BSN intervient sur les axes suivants : acquisition de ressources, numérisation du patrimoine scientifique (notamment le programme Persée), archives ouvertes (notamment HAL), circulation et valorisation de la production scientifique, préservation des données numériques à long terme (avec le CINES). Un comité de pilotage a été mis en place en 2010, dans lequel sont représentées les universités, les organismes de recherche, ainsi que le ministère de la culture et de la communication. Il est épaulé par un comité technique ad hoc.
Sont concernés pour cette action le catalogage, dont l’opérateur national est l’ABES pour 2,6 M€ ; les groupements de commande portés par l’ABES pour 1,6 M€ ; les licences nationales pour 1,7 M€ (crédits destinés à améliorer les modalités d’accès aux ressources scientifiques numériques) ; PERSEE (portail d’accès à de grandes revues scientifiques numérisées en sciences humaines et sociales) pour 0,5 M€.

Soit 2,6+1,6+1,7+0,5 = 6,4 millions d’euros. Je pense que la somme est inférieure en 2011 en raison de la sortie du CINES de ce dispositif. Mais je m’étonne aussi d’avoir vu fondre la ligne “licences nationales” d’une année sur l’autre.

En tout cas, il ne faudrait surtout pas croire que l’Etat a sorti de sa poche en 2010 8,6 millions € pour ce “nouveau” dispositif. En fait, il a regroupé sous la même étiquette “BSN” des financements qui étaient auparavant présentés différemment, et a ajouté quelques millions.

Ainsi, en cherchant dans le PAP 2009 des actions équivalentes, (p. 88), on trouve le financement de l’ABES et du CINES  (3,1 M€), qui faisait partie de l’ensemble “Dotations aux établissements et services de coopération”, ainsi que les subventions à PERSEE (0,5 M€) et pour les groupements d’achat de ressources électroniques non pris en charge par l’ABES (0,4 M€), qui appartenaient  à l’ensemble “Dotations au titre d’actions spécifiques”, soit un total de 4 millions.

J’espère qu’il n’y a pas un chiffre qui m’échappe, mais si on compare le PAP 2009 et 2010, on constate donc une augmentation de 4,6 millions d’euros, essentiellement (4 M€) destinée à financer les “licences nationales”. Je ne sais pas trop à quoi cela correspond dans le détail. Si quelqu’un peut m’éclairer…

L’ABES et la BSN

Bref, concrètement, la BSN se compose de huit “segments”, autrement dit huit groupes de travail, tous copilotés par deux organismes. L’ABES participe au pilotage des segments 1, 3, 8, avec avec le CNRS et Couperin.

  1. Acquisition des revues (courant) et des archives : Grégory Colcanap (Couperin), Raymond Bérard (ABES).
  2. Dispositif d’accès et d’hébergement : Serge Bauin (CNRS), Richard Walter (CNRS-Adonis).
  3. Dispositifs de signalement : Raymond Bérard (ABES), Serge Bauin (CNRS).
  4. Archives ouvertes : Daniel Charnay (CNRS-CCSD), Jacques Millet (Inria).
  5. Numérisation : Gilbert Puech (Persee), Frédéric Blin (BNUS).
  6. Archivage pérenne : Olivier Rouchon (CINES), Aline Girard (BnF).
  7. Editions numériques : Marin Dacos (CNRS-Cléo), Jean-Michel Henny (Association des éditeurs de la recherche et de l’enseignement supérieur).
  8. Fourniture de documents, prêt : Serge Bauin (DIST-CNRS), Raymond Bérard (ABES).

Le segment 8 a repris l’activité du groupe de travail sur la modernisation du PEB qui préexistait, mais en recadrant sa réflexion. Sa 1re réunion s’est tenue le 9 juin 2011. Comme l’explique le site de l’ABES, un des objectifs est désormais de  “trouver une convergence entre les opérateurs de fourniture de documents, en tout premier lieu l’ABES et l’INIST-CNRS” en établissant un “guichet unique s’appuyant sur les points forts de SUPEB et de RefDoc”. Une étude est en cours, dont les résultats en seront communiqués lors de la 2ème réunion de la BSN 8 courant octobre 2011.

Conclusion

Conclusion, pas de conclusion. Ou plutôt, pas de certitudes. Il faudra suivre de près toutes ces évolutions dans les mois et années à venir pour voir si la BSN deviendra effectivement un cadre d’action efficace ou un nouveau “machin”

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks

Vers un nouveau projet d’établissement pour l’ABES

Voici quelques notes prises lors des Journées ABES et retravaillées à grands coups de copier/coller à partir des informations présentes sur le site de l’ABES, et notamment des présentations faites lors des Journées. Je ne prétends pas faire preuve d’une quelconque originalité : il s’agit juste de mettre à disposition de tous des éléments du compte-rendu que j’ai faites en interne à mes collègues. Je précise que comme certains sujets abordés lors des journées dépassent de loin mes compétences, et que je n’ai pas pu assister à tous les ateliers, il est plus que probable que de gros ou de petits contre-sens se glissent dans mes propos. N’hésitez pas à me les signaler si vous le souhaitez…

Je commence par un billet consacré au projet d’établissement de l’ABES. D’autres suivront dans quelques jours.

Du projet 2008-2011 au projet 2012-2015

Pour l’élaboration du prochain projet d’établissement, l’ABES a décidé d’impliquer un grand nombre de partenaires. Le processus est donc relativement long : les premières réflexions ont commencé en octobre 2010, et le projet devrait être validé en novembre 2011.

L’ABES a impliqué dans ce projet son Conseil Scientifique, qui a été créé à cette occasion. D’autre part, elle a pris l’avis des BUs, en organisant le 16 mai une après-midi de débats et d’échanges avec 60 membres du réseau concernant 3 thématiques : ressources électroniques, SIGB mutualisé (atelier dont Lully a rendu compte dans ce billet, patrimoine. Enfin, elle procède actuellement à une enquête sur les attentes du réseau et de quelques partenaires, qui sera complétée par des entretiens en focus groupes. La synthèse sera publiée début septembre.

Le projet d’établissement actuel (le 1er dont l’ABES se soit jamais doté) couvre la période 2008-2011. Il consiste en 96 actions réparties en 6 objectifs :

  1. Offrir des catalogues de qualité, ergonomiques et évolutifs
  2. Développer le réseau et l’associer à la définition de la politique et des objectifs de l’ABES
  3. Faciliter l’accès aux ressources documentaires des universités
  4. Mettre à la disposition des établissements des outils et services garants d’un fonctionnement optimal
  5. Améliorer la gestion de l’ABES
  6. Mieux insérer l’ABES dans son environnement universitaire et de recherche

Les objectifs prévus pour le prochain projet me semblent approfondir des éléments du projet 2008-2011, mais certains points (2,4,5) sont inédits :

  1. Faire évoluer les catalogues et applications. (prolonge le point 1 du précédent projet, en l’élargissant aux « applications », et en insistant sur leur évolution effective)
  2. L’ABES “hub” des métadonnées de la recherche française. (“hub”? Je trouve ça très vilain, mais l’ABES n’a pas cherché d’équivalent français… “porte d’entrée ?”)
  3. Signaler les ressources des universités et établissements : ressources électroniques ; patrimoine. (prolonge le point 3 du précédent projet)
  4. Développer l’achat de ressources électroniques.
  5. Proposer aux établissements un SIGB mutualisé.
  6. Développer les partenariats nationaux et internationaux. (prolonge le point 6 du précédent projet, en insistant sur la dimension internationale)
  7. Mettre la gouvernance et le pilotage en cohérence avec le développement des missions de l’ABES. (prolonge le point 5 du précédent projet)

Les pistes du « rapport TICER »

Ces pistes sont en partie issues d’une étude que l’ABES  fait réaliser par Hans Geleijnse, consultant de TICER (Tilburg Innovation Centre for Electronic Resources, Université de Tilburg). L’étude, commandée en novembre 2010, a été divulguée en mars 2011. Elle est disponible sur le site de l’ABES, uniquement en anglais (Environmental Scan : as an input for the development of a strategic plan of L’Agence Bibliographique de l’Enseignement Superieur (ABES) for the period 2012-2015)

L’enquête porte sur environnement international de l’ABES (actions et visions de l’avenir des homologues de l’ABES) et sur cinq questions spécifiques posées par l’ABES. Il faut relever que la mission du rapporteur était centrée sur l’ABES et ses homologues, sans évaluer systématiquement la place des autres acteurs français de l’IST (Information scientifique et technique), notamment de l’INIST et du CNRS, ce qui l’aurait peut-être conduit à nuancer ses conclusions.

Comment les homologues de l’ABES envisagent-il l’avenir ?

Les principales tendances internationale de l’IST dégagées par le rapport sont : d’avantage de mobilité et de flexibilité, l’importance croissante des applications mobiles, des réseaux sociaux et du « cloud computing » (ou “informatique en nuage”, dixit Legifrance), les menaces sur la protection des données personnelles, et les contraintes budgétaires croissantes.

D’après le rapport, les équivalents étrangers de l’ABES ont des missions plus larges (ex : catalogue commun BU/BM, fourniture de documents électroniques, fourniture de SIGB aux établissements…) mais un ressort territorial plus étroit (petits pays, régions). La position de l’ABES est donc atypique.

Toutes ces institutions sont en train de se recentrer vers la gestion et la fourniture de documents électroniques, et anticipent une marginalisation rapide de la documentation imprimée dans les 5 à 10 ans. Dans ce cadre, elles cherchent à réaliser des économies d’échelle, à développer la fourniture de « discovery services » (en bon français, “services de découverte”, ou “solutions de découverte”) aux bibliothèques, à favoriser les solutions libres, à profiter des opportunités offertes par l’informatique en nuage, et à faire le meilleur usage des technologies du Web 2.0 et des technologies modernes en général.

Dans un contexte de détérioration attendue des capacités financières des universités et de pression forte de la part des pouvoirs publics pour plus d’efficacité et d’efficience, les homologues de l’ABES estiment qu’ils ne pourront survivre qu’en proposant une réelle « valeur ajoutée » aux bibliothèques, et en leur faisant faire des économies grâce à une centralisation accrue : éviter à tout prix de faire plusieurs fois le même travail (saisie unique ou récupération des métadonnées, etc.), assumer une position de force dans les négociations commerciales avec les fournisseurs de services ou les éditeurs, tenir un rôle central dans les débats nationaux et internationaux, promouvoir de nouvelles idées ou de nouveaux services en capitalisant sur les initiatives des membres de leur réseau.

Pour chaque service, l’enjeu central sera la détermination de l’échelle la plus pertinente en terme de coût et d’efficacité : local, régional, national, international ? Par exemple, certains pays pourraient abandonner la gestion de catalogues nationaux au profit de Worldcat. Le rapport insiste également à de nombreuses reprises sur les changements apportés par le développement de l’informatique en nuage. Pour l’usager, peu importera le lieu de stockage de l’information et des outils.

L’auteur a fait à l’ABES cinq recommandations

On en retrouvera certaines dans les pistes pour le projet d’établissement 2012/2015 évoqué plus haut.

  1. Devenir le « hub français des métadonnées » (documents imprimés et électroniques) en collaboration avec d’autres instutions françaises et avec des entreprises. Cela pose la question des rapports avec la BNF et avec l’INIST…
  2. Harmoniser les initiatives françaises pour la gestion des métadonnées (acquisition, moissonnage, qualité) et des autorités, notamment dans le cadre d’IdRef et du VIAF. Là encore, pas sûr que la  BNF, qui participe déjà au VIAF, accepte de se faire “harmoniser” sans rien dire…
  3. Proposer des services et des outils aux bibliothèques pour leurs activités internes et leurs services aux lecteurs (Acquisition, catalogage, prêt, recherche documentaire, PEB, outils de découverte), en s’appuyant notamment sur l’informatique en nuage.
  4. Éviter de développer des outils « maison », en tout cas pour le PEB et les services de découverte : ce serait une perte de temps et d’énergie. Il vaut mieux faire appel aux solutions sur le marché.
  5. Proposer davantage de services pour la recherche : développer un CRIS (Current Research Information System) : dispositif national d’information sur la recherche en cours, qui permettrait de mettre en valeur la recherche française (avec des liens possibles vers les archives en ligne.)

Les réponses aux interrogations de l’ABES

  • Quel est l’avenir de CBS ?

Le logiciel au cœur du SUDOC, CBS, sera maintenu et mis à jour par OCLC au moins pour 5 ans. CBS pourra être adapté à RDA, car il permet déjà de lier les données entre elles. CBS peut également servir de base à un catalogue « 2.0 » (couvertures, commentaires de lecteurs, tags, étoiles, conseils personnalisés, ajouts de métadonnées par l’usager…), comme l’illustre le projet suisse Swissbib.

De son côté, WinIBW devrait être remplacé par une application web, probablement en 2012.

  • Faut-il repenser les relations avec OCLC ?

L’accord 1992-2011 arrive à échéance. Certains points pourraient être renégociés : CBS (l’application au coeur du Sudoc) est moins utile qu’il y a 20 ans, car l’essentiel de la documentation est dématerialisée, et CBS ne gère pas de manière optimale  les ressources électroniques. On pourrait donc envisager de renégocier le prix de CBS, ou demander un accès à d’autres services.

La « dépendance » envers les fournisseurs comme OCLC est aujourd’hui une réalité inévitable, qui ne doit pas susciter trop d’inquiétudes. Il faut plutôt se préoccuper de la pertinence, de l’efficacité et de la fiabilité des services offerts. Sur ces points, la position d’OCLC est plutôt rassurante (compétences, taille, nombre de partenaires, statut non lucratif), notamment par rapport à Ex Libris.

Par contre, la nationalité américaine d’OCLC peut poser problème : tous les homologues européens de l’ABES insistent sur la nécessaire maîtrise des données. Les métadonnées issues de la recherche française ont à la fois une dimension stratégique et patrimoniale. Il faut veiller à ce qu’elles ne soient pas stockées exclusivement des USA, et donc soumise à la législation américaine.

  • Les ressources électroniques doivent-elles être intégrées au SUDOC, ou dans un nouveau catalogue spécifique, encore à imaginer ?

J’ai été quelque peu surpris par cette question : cela fait des années et des années que le signalement des ressources électroniques est pour l’ABES et pour les membres du réseau la priorité des priorités, l’urgence absolue, etc etc. La question de l’outil adéquat pour ce signalement est évidemment fondamentale, mais j’avoue que j’espérais que les experts de l’ABES avaient déjà des idées claires sur les choix à faire dans ce domaine. J’espère pouvoir y revenir dans un prochain billet, mais honnêtement, je n’ai pas moi même d’idées bien claires sur la question…

Le rapporteur ne répond pas par oui ou non, mais en insistant sur l’attitude des  homologues de l’ABES, qui misent pour la plupart sur les « services de découverte ». Ces outils sont le dernier avatar de la recherche fédérée, mais contrairement aux portails développés au début des années 2000, ils utilisent les technologies modernes (traduire : du web sémantique), et cherchent à proposer une expérience de recherche conviviale et familière aux usagers (traduire : sur le modèle de Google). Ils fournissent un point d’entrée unique pour interroger simultanément plusieurs types de ressources globales (catalogues, bases de données, archives ouvertes, sites de fournisseurs d’ebooks ou de journaux en ligne…) et locales (données propres à chaque bibliothèque). Selon le rapport, les deux solutions commerciales les plus abouties sont Primo d’Ex Libris et Worldcat Local d’OCLC, mais Serial Solutions et EBSCO proposent aussi la leur.

Dans ce cadre, si j’ai bien compris, l’auteur estime qu’il serait envisageable de concevoir une base de connaissance signalant les ressources électroniques françaises, qui pourrait être gérée hors du SUDOC, mais consultée par le biais de ces services de découverte, simultanément avec d’autres ressources.

  • L’ABES peut-elle jouer un rôle de soutien ou de gestion d’outils pour les bibliothèques (SIGB ou outils appelés à les remplacer) ?

Plusieurs de ses homologues le font. Si un nombre suffisant d’universités manifestent un intérêt réel pour ce projet, et s’il est une source d’économie, l’ABES pourrait fournir ce genre de service, peut-être en en se basant sur des solutions commerciales exploitant les possibilités de l’informatique en nuage.

  • Faut-il repenser les relations avec le réseau ?

Une bonne communication entre l’ABES et le réseau est essentielle. De graves problèmes ont affecté le réseau américain OhioLink suite à des divergences entre l’opérateur et les membres du réseau. Pour un certain nombre de questions clés, l’ABES ne pourra agir que si le réseau s’engage clairement et fortement dans la même direction.

Il faudrait renforcer la présence des établissements dans le CA de l’ABES, et formaliser le rôle de conseil des établissements au sein d’un autre conseil, qui se chargerait d’examiner les questions stratégiques. Cela pourrait impliquer un renforcement du rôle de l’AURA.

Partager cet article
  • Facebook
  • Twitter
  • Diigo
  • Netvibes
  • del.icio.us
  • Digg
  • Google Bookmarks