Posté le 2 janvier 2012 par vingtseptpointsept| Mots-clefs: enssib, formation, voeux | Catégories: Non classé | - (Les commentaires sont clos) Voici trois mois jour pour jour que j’ai débarqué à Villeurbanne pour y suivre la formation initiale des bibliothécaires d’Etat. Autrement dit, dans trois mois, adieu quenelles, saucisson et tarte à la pralines! Car depuis cette année, la formation ne dure plus que six mois, à l’issue desquels les bibliothécaires rejoignent leur lieu d’affectation (l’université de Rennes 2 en ce qui me concerne).
 Quenelles de brochet (posté sur Flickr par stu_spivack sous licence cc-by-sa 2.0)
Quel meilleur moment pour un petit bilan ?
Je n’ai rien publié sur ce blog depuis septembre. Certes, je n’avais jamais été très assidu, mais ce silence commence à être long. D’autant que, pendant cette période, j’ai été assez bavard sur Twitter… Mais il s’agit de deux outils complémentaires, aux logiques différentes. Twitter ne me permet pas de développer une réflexion construite, ni de rendre compte d’une expérience un tant soit peu complexe comme j’ai pu essayer de le faire par le passé dans certains billets de blog. Par contre, c’est un outil précieux pour formuler quelques remarques générales, s’informer des projets des uns et des autres, échanger rapidement des informations, et lancer quelques blagounettes plus ou moins bibliothéconomiques. Je suis encore plus Twittodépendant depuis que j’ai troqué mon brave Nokia pour un HTC qui me permet enfin de surfer partout et n’importe quand (je ne sais pas comment j’ai pu m’en passer si longtemps!).
Donc, pas de nouveau billet depuis un bon bout de temps. Pourtant ce ne sont pas les idées qui manquent, mais en cette période de transition j’ai l’impression d’avoir deux ou trois morceaux de cerveau qui ont du mal à se connecter :
- Demain il me faudra – avant tout – administrer un SIGB et réfléchir à des projets informatiques innovants. Mais j’ai beau m’y intéresser dès maintenant, tant que je n’aurai pas pris mon poste et que je n’aurai pas les deux mains dans le cambouis, cela restera assez théorique pour moi.
- Hier, j’achetais et je traitais des livres, je participais à l’accueil, à l’information et à la formation des étudiants. Mon identité professionnelle s’était peu à peu cristallisée autour des problématiques liées au catalogage. Or, on ne peut pas vraiment dire cette activité soit unanimement valorisée par la profession…
. Et après trois mois, j’ai déjà l’impression d’avoir perdu la main, oublié beaucoup de choses, être déconnecté des débats et des évolutions en cours. Alors, que faire des connaissances et des compétences (beurk, je cause comme à l’IUFM…) liées au traitement des documents ? Passer un coup de chiffon définitif, ou bien les intégrer à mes nouvelles fonctions, mais en prenant un peu de hauteur, en changeant de point de vue ? A la manière de présenter les choses, on comprendra quelle solution a ma préférence… J’ai du mal à admettre que tout ce que j’ai pu apprendre deviennent subitement et totalement inutile. Mais je ne sais pas trop ce qu’il adviendra : peut-être que dans un an ou deux tout cela sera vraiment de l’histoire ancienne pour moi…
- Enfin, aujourd’hui, me voilà redevenu étudiant à plus de trente ans. J’attends deux fois par jour – avec des pleurs de joie indescriptibles – la sacro-sainte fiche d’émargement, et je prend – très sagement – des notes en écoutant des collègues évoquer la diversité des publics, la médiation numérique, la communication, les innovations, la gestion de projet, la réinformatisation, etc etc. Bref, tout cela est intéressant, mais la plupart des sujets ne peuvent être qu’évoqués assez rapidement à mon goût.
La formation est en effet très brève, si l’on songe qu’elle vise à former des cadres. Mais la durée étant fixée par décret, l’école n’est pas libre de la modifier… Je pense que le recrutement hétérogène complique également la tâche des formateurs. Il faut à la fois donner un solide aperçu des bibliothèques à des étudiants qui n’y ont jamais travaillé, et permettre aux vrais et faux internes (majoritaires) d’approfondir leurs connaissances tout en sortant d’une vision parfois très technique ou très spécialisée du métier. Pas facile… Je tire mon chapeau au coordinateur ! Pour ma part, la plupart des cours m’ont intéressés, mais sans que j’y apprenne énormément de choses, à quelques exceptions près (comme le cours sur la réinformatisation ou l’interopérabilité des données, mais, promis, il y en a eu d’autres…). Ce que j’ai le plus apprécié, c’est que, le plus souvent, les intervenants se sont positionnés comme des collègues venant nous faire part d’une expérience et/ou d’une expertise, tout en faisant naître de véritables échanges avec notre groupe.
Bref, cela sera à nous de compléter et d’approfondir nos connaissances une fois en poste, en profitant de la formation continue - dont le financement est bien entendu une priorité absolue pour nos universités au bord de la faillite -, ou plus probablement en nous débrouillant tout seuls comme des grands .
Tout autant que les cours, et peut-être même plus, les contacts noués pendant cette formation me marqueront sur la durée. Mélanger internes et externes est sans doute complexe sur le plan pédagogique, mais extrêmement enrichissant. Etudiant(e)s tout frais sorti de l’école, BAS aguerri(e)s, anciens profs, anciennes salariés de l’édition ou des musées, féru(e)s de cuisine, de communication, de webdesign (plutôt classe non?), d’anthropologie urbaine, de vampires… Il est rare de pouvoir rencontrer autant de personnes si différentes et pourtant animées par une passion commune, le babyfoot les bibliothèques.
 Que serait l'Enssib sans son babyfoot ? (posté sur Wikimedia Commons par Jean-no, licence Artlibre)
C’est à tous ceux-là, et à tous les autres…, que je souhaite une très bonne année, aussi riche en epubs qu’en pubs , aussi remplie de découvertes que d’outils de découverte ! (Oui, je sais c’est mauvais, mais c’est sincère, si si…)
Posté le 22 septembre 2011 par vingtseptpointsept| Mots-clefs: javascript, unicode | Catégories: bidouillages | Les commentaires sont clos Et pour quoi faire d’abord?
Le français est une langue qui s’accentue, se trématise, se cédille, et qui pousse le vice jusqu’à l’OdansleEïsation. Et notre alphabet est loin d’être le plus riche : crochets, barres obliques, points souscrits, ogoneks, doubles accents, lettres inversées et autres zigouigouis font le charme (et l’utilité) des alphabets exotiques. Prenez l’alphabet vietnamien, ou Quốc ngữ : ne serait-ce pas un crime d’en faire un vulgaire Quoc ngu ?
C’est pourtant ce qu’on est parfois obligé de faire pour utiliser certains outils informatiques qui digèrent mal les accents et autres diacritiques, et ne supportent que les fades caractères ASCII (127 caractères, sans aucun accent).
C’est justement le cas d’IdRef, du moins dans les index de type mot. Or je suis toujours en train de bricoler le script décrit dans le dernier billet, et je ne désespère pas d’obtenir quelque chose de présentable, mais pour ce faire, j’avais besoin d’une fonction dépouillant une chaîne de ses accents et diacritiques afin de construire une requête compréhensible par l’API d’IdRef.
Après quelques recherches, il m’a semblé qu’une telle fonction existait dans d’autres langages de programmation, mais pas en Javascript. Peut-être me suis-je trompé, mais en tout cas cela m’aura permis de découvrir plein de langues rigolotes rares. J’avais d’abord recopié une fonction trouvé sur un forum, mais elle ne me satisfaisait pas, car elle ne traitait que les 256 caractères les plus usuels (correspondant à l’ASCII étendu). J’ai donc essayé de construire une fonction qui puisse également traiter des caractères plus rares, et qui soit facilement paramétrable pour s’adapter à divers besoins.
Pour ne rien vous cacher, ma fonction s’avère finalement inadaptée à IdRef, du moins dans son état actuel (je reviendrai sur le sujet), mais elle peut être reprise dans d’autres contextes et modifiée pour répondre à des besoins différents.
Le code de la fonction est en ligne ici. Je la recopie sans les commentaires initiaux:
function remplace_diacritiques_latins (chaine) {
var diac_fr =[
// Tous les diacritiques codés sur un octet et Ÿ Œ œ
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5]/g], // a
['A',/[\u00C0\u00C1\u00C2\u00C3\u00C4\u00C5]/g], // A
['ae',/[\u00E6]/g], // ae
['Ae',/[\u00C6]/g], // Ae
['c',/[\u00E7]/g], // c
['C',/[\u00C7]/g], // C
['d',/[\u00F0]/g], // d
['D',/[\u00D0]/g], // D
['e',/[\u00E8\u00E9\u00EA\u00EB]/g], // e
['E',/[\u00C8\u00C9\u00CA\u00CB\u1EBA]/g], // E
['i',/[\u00EC\u00ED\u00EE\u00EF]/g], // i
['I',/[\u00CC\u00CD\u00CE\u00CF]/g], // I
['n',/[\u00F1]/g], // n
['N',/[\u00D1\u1E44]/g], // N
['o',/[\u00BA\u00F2\u00F3\u00F4\u00F5\u00F6\u00F8]/g], // o
['O',/[\u00D2\u00D3\u00D4\u00D5\u00D6\u00D8]/g], // O
['Oe',/[\u0152]/g], // Oe
['oe',/[\u0153]/g], // oe
['ss',/[\u00DF]/g], // ss
['T',/[\u1E6C]/g], // T
['Th',/[\u00DE]/g], // Th
['th',/[\u00FE]/g], // th
['u',/[\u00F9\u00FA\u00FB\u00FC\u1EE7]/g], // u
['U',/[\u00D9\u00DA\u00DB\u00DC]/g], // U
['W',/[\u1E84]/g], // W
['X',/[\u1E8C]/g], // X
['y',/[\u00FD\u00FF]/g], // y
['Y',/[\u00DD\u0178]/g], // Y
];
var diac_autres =[
// Tous les diacritiques sauf ceux codés sur un octet et Ÿ Œ œ
['A',/[\u0100\u0102\u0104\u01CD\u01FA\u0200\u0202\u023A\u1E00\u1EA0\u1EA2\u1EA4\u1EA6\u1EA8\u1EAA\u1EAC\u1EAE\u1EB0\u1EB2\u1EB4\u1EB6]/g], // A
['a',/[\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a
['Ae',/[\u01FC]/g], // Ae
['ae',/[\u01FD]/g], // ae
['B',/[\u1E02\u1E04\u1E06]/g], // B
['b',/[\u1E03\u1E05\u1E07]/g], // b
['C',/[\u0106\u0108\u010A\u010C\u023B\u1E08]/g], // C
['c',/[\u0107\u0109\u010B\u010D\u023C\u1E09]/g], // c
['D',/[\u010E\u0110\u1E0A\u1E0C\u1E0E\u1E10\u1E12]/g], // D
['d',/[\u010F\u0111\u1E0B\u1E0D\u1E0F\u1E11\u1E13]/g], // d
['DZ',/[\u01C4\u01F1]/g], // DZ
['DZ',/[\u01C5\u01F2]/g], // DZ
['dz',/[\u01C6\u01F3]/g], // dz
['E',/[\u0112\u0114\u0116\u0118\u011A\u0204\u0206\u0228\u1E14\u1E16\u1E18\u1E1A\u1E1C\u1EB8\u1EBA\u1EBC\u1EBE\u1EC0\u1EC2\u1EC4\u1EC6]/g], // E
['e',/[\u0113\u0115\u0117\u0119\u011B\u0205\u0207\u0229\u1E15\u1E17\u1E19\u1E1B\u1E1D\u1EB9\u1EBB\u1EBD\u1EBF\u1EC1\u1EC3\u1EC5\u1EC7]/g], // e
['f',/[\u0192\u1E1F]/g], // f
['F',/[\u1E1E]/g], // F
['G',/[\u011C\u011E\u0120\u0122\u01F4\u1E20]/g], // G
['g',/[\u011D\u011F\u0121\u0123\u01F5\u1E21]/g], // g
['H',/[\u0124\u0126\u1E22\u1E24\u1E26\u1E28\u1E2A]/g], // H
['h',/[\u0125\u0127\u1E23\u1E25\u1E27\u1E29\u1E2B\u1E96]/g], // h
['I',/[\u0128\u012A\u012C\u012E\u0130\u01CF\u0208\u020A\u1E2C\u1E2E\u1EC8\u1ECA]/g], // I
['i',/[\u0129\u012B\u012D\u012F\u0131\u01D0\u0209\u020B\u1E2D\u1E2F\u1EC9\u1ECB]/g], // i
['IJ',/[\u0132]/g], // IJ
['ij',/[\u0133]/g], // ij
['J',/[\u0134]/g], // J
['j',/[\u0135]/g], // j
['K',/[\u0136\u1E30\u1E32\u1E34]/g], // K
['k',/[\u0137\u1E31\u1E33\u1E35]/g], // k
['L',/[\u0139\u013B\u013D\u013F\u0141\u023D\u1E36\u1E38\u1E3A\u1E3C]/g], // L
['l',/[\u013A\u013C\u013E\u0140\u0142\u1E37\u1E39\u1E3B\u1E3D]/g], // l
['LJ',/[\u01C7]/g], // LJ
['Lj',/[\u01C8]/g], // Lj
['lj',/[\u01C9]/g], // lj
['M',/[\u1E3E\u1E40\u1E42]/g], // M
['m',/[\u1E3F\u1E41\u1E43]/g], // m
['N',/[\u0143\u0145\u0147\u01F8\u1E44\u1E46\u1E48\u1E4A]/g], // N
['n',/[\u0144\u0146\u0148\u01F9\u1E45\u1E47\u1E49\u1E4B]/g], // n
['NJ',/[\u01CA]/g], // NJ
['Nj',/[\u01CB]/g], // Nj
['nj',/[\u01CC]/g], // nj
['O',/[\u014C\u014E\u0150\u01A0\u01D1\u01FE\u020C\u020E\u022A\u022C\u022E\u0230\u1E4C\u1E4E\u1E50\u1E52\u1ECC\u1ECE\u1ED0\u1ED2\u1ED4\u1ED6\u1ED8\u1EDA\u1EDC\u1EDE\u1EE0\u1EE2]/g], // O
['o',/[\u014D\u014F\u0151\u01A1\u01D2\u01FF\u020D\u020F\u022B\u022D\u022F\u0231\u1E4D\u1E4F\u1E51\u1E53\u1ECD\u1ECF\u1ED1\u1ED3\u1ED5\u1ED7\u1ED9\u1EDB\u1EDD\u1EDF\u1EE1\u1EE3]/g], // o
['P',/[\u1E54\u1E56]/g], // P
['p',/[\u1E55\u1E57]/g], // p
['R',/[\u0154\u0156\u0158\u0210\u0212\u1E58\u1E5A\u1E5C\u1E5E]/g], // R
['r',/[\u0155\u0157\u0159\u0211\u0213\u1E59\u1E5B\u1E5D\u1E5F]/g], // r
['S',/[\u015A\u015C\u015E\u0160\u0218\u1E60\u1E62\u1E64\u1E66\u1E68]/g], // S
['s',/[\u015B\u015D\u015F\u0161\u017F\u0219\u023F\u1E61\u1E63\u1E65\u1E67\u1E69\u1E9B]/g], // s
['SS',/[\u1E9E]/g], // SS
['T',/[\u0162\u0164\u0166\u021A\u023E\u1E6A\u1E6C\u1E6E\u1E70]/g], // T
['t',/[\u0163\u0165\u0167\u021B\u1E6B\u1E6D\u1E6F\u1E71\u1E97]/g], // t
['U',/[\u0168\u016A\u016C\u016E\u0170\u0172\u01AF\u01D3\u01D5\u01D7\u01D9\u01DB\u0214\u0216\u1E72\u1E74\u1E76\u1E78\u1E7A\u1EE4\u1EE6\u1EE8\u1EEA\u1EEC\u1EEE\u1EF0]/g], // U
['u',/[\u0169\u016B\u016D\u016F\u0171\u0173\u01B0\u01D4\u01D6\u01D8\u01DA\u01DC\u0215\u0217\u1E73\u1E75\u1E77\u1E79\u1E7B\u1EE5\u1EE7\u1EE9\u1EEB\u1EED\u1EEF\u1EF1]/g], // u
['V',/[\u1E7C\u1E7E]/g], // V
['v',/[\u1E7D\u1E7F]/g], // v
['W',/[\u0174\u1E80\u1E82\u1E84\u1E86\u1E88]/g], // W
['w',/[\u0175\u1E81\u1E83\u1E85\u1E87\u1E89\u1E98]/g], // w
['X',/[\u1E8A\u1E8C]/g], // X
['x',/[\u1E8B\u1E8D]/g], // x
['Y',/[\u0176\u0232\u1E8E\u1EF2\u1EF4\u1EF6\u1EF8]/g], // Y
['y',/[\u0177\u0233\u1E8F\u1E99\u1EF3\u1EF5\u1EF7\u1EF9]/g], // y
['Z',/[\u0179\u017B\u017D\u1E90\u1E92\u1E94]/g], // Z
['z',/[\u017A\u017C\u017E\u0240\u1E91\u1E93\u1E95]/g] // z
];
// suppression des signes diacritiques isolés
var diac_seuls = /[\u0300-\u036F\u1DC0-\u1DFF]/g; // bloc des diacritiques et des bloc des diacritiques suppléments
chaine = chaine.replace(diac_seuls,'');
// traitement en deux étapes, pour accélerer le traitement des chaînes sans caractères codés sur deux octets
// suppression des signes diacritiques sur 1 octet + 3 lettres pour le français français
for (var i = 0; i < diac_fr.length; i++) {
chaine = chaine.replace(diac_fr[i][1],diac_fr[i][0]);
}
// suppression des signes diacritiques sur 2 octets, uniquement s'il y en a
var car_etendus = /[\u0100-\u1EFE]/g;
if (car_etendus.test (chaine)) {
for (var i = 0; i < diac_autres.length; i++) {
chaine = chaine.replace(diac_autres[i][1],diac_autres[i][0]);
}
}
return chaine;
}
Sous le code, l’unicode…
Comment ça marche ?
Concrètement, nous avons besoin d’une fonction qui transforme une chaîne telle que « œil école Điện słowiańskie » en « oeil ecole Dien slowianskie » (c’est du franco-polono-vietnamien), et plus généralement les 526 caractères « ªÁáÀàĂăẮắẰằẴẵẲẳÂâẤấẦầẪẫẨẩǍǎÅåǺǻÄäÃãĄąĀāẢảȀȁȂȃẠạẶặẬậḀḁÆæǼǽẚȺḂḃḄḅḆḇĆćĈĉČčĊċÇçḈḉȻȼĎďḊḋḐḑḌḍḒḓḎḏĐđÐðDZDzdzDŽDždžÉéÈèĔĕÊêẾếỀềỄễỂểĚěËëẼẽĖėȨȩḜḝĘęĒēḖḗḔḕẺẻȄȅȆȇẸẹỆệḘḙḚḛḞḟƒǴǵĞğĜĝĠġĢģḠḡĤĥḦḧḢḣḨḩḤḥḪḫẖĦħÍíÌìĬĭÎîǏǐÏïḮḯĨĩİĮįĪīỈỉȈȉȊȋỊịḬḭIJijıĴĵḰḱĶķḲḳḴḵĹ弾ĻļḶḷḸḹḼḽḺḻŁłĿŀLJLjljȽḾḿṀṁṂṃŃńǸǹŇňÑñṄṅŅņṆṇṊṋṈṉNJNjnjºÓóÒòŎŏÔôỐốỒồỖỗỔổǑǒÖöȪȫŐőÕõṌṍṎṏȬȭȮȯȰȱØøǾǿŌōṒṓṐṑỎỏȌȍȎȏƠơỚớỜờỠỡỞởỢợỌọỘộŒœṔṕṖṗŔŕŘřṘṙŖŗȐȑȒȓṚṛṜṝṞṟŚśṤṥŜŝŠšṦṧṠṡŞşṢṣṨṩȘșſẛßẞȿŤťẗṪṫŢţṬṭȚțṰṱṮṯŦŧȾÚúÙùŬŭÛûǓǔŮůÜüǗǘǛǜǙǚǕǖŰűŨũṸṹŲųŪūṺṻỦủȔȕȖȗƯưỨứỪừỮữỬửỰựỤụṲṳṶṷṴṵṼṽṾṿẂẃẀẁŴŵẘẄẅẆẇẈẉẌẍẊẋÝýỲỳŶŷẙÿŸỸỹẎẏȲȳỶỷỴỵŹźẐẑŽžŻżẒẓẔẕɀÞþ »
en leur équivalent simple : « aAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAaAeaeAeaeaABbBbBbCcCcCcCcCcCcCcDdDdDdDdDdDdDdDdDZDZdzDZDZdzEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeEeFffGgGgGgGgGgGgHhHhHhHhHhHhhHhIiIiIiIiIiIiIiIiIIiIiIiIiIiIiIiIJijiJjKkKkKkKkLlLlLlLlLlLlLlLlLlLJLjljLMmMmMmNnNnNnNnNnNnNnNnNnNJNjnjoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOoOeoePpPpRrRrRrRrRrRrRrRrRrSsSsSsSsSsSsSsSsSsSsssssSSsTttTtTtTtTtTtTtTtTUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuUuVvVvWwWwWwwWwWwWwXxXxYyYyYyyyYYyYyYyYyYyZzZzZzZzZzZzzThth »
Il faut savoir qu’en Javascript et dans tous les outils modernes, les chaînes de caractère sont encodées en Unicode, standard qui attribue à chaque caractère un nom, et surtout un identifiant unique codé au maximum sur 21 bits. Pour les caractères es plus usuels (et donc pour les langues qui nous intéressent), le codage se fait sur 16 bits, c’est à dire deux octets, soit 65536 caractères possibles.
Pour assurer une compatibilité avec les standards « préhistoriques », les 256 premiers caractères correspondent aux caractères ASCII (pour la tranche 0-127) et aux caractères ISO 8859-1 (pour la tranche 128-255). Il faut juste ajouter un octet égal à 00 avant celui qui contient la valeur du caractère en ASCII ou en 8859-1. Le codepoint U+0065 correspond ainsi au caractère « e » (65 en ASCII, valeur hexadécimale), et le codepoint U+00E9 correspond au caractère « é » (E9 en ISO 8859-1, valeur hexadécimale).
Au delà, les caractères Unicode n’ont pas d’équivalent en ASCII ou en ISO 8859-1. C’est le cas par exemple du caractère « ł » utilisé en polonais, codé 0141 et dénommé « LATIN SMALL LETTER L WITH STROKE ».
Certains caractères sont des modificateurs : il y a souvent deux manières de coder une lettre modifiés par un diacritique : en utilisant un caractère unique comme U+00E9 pour « é » ou U+00F1 pour « ñ », ou en saisissant à la suite un caractère de base (par exemple U+006E pour « n ») et un ou plusieurs modificateurs (par exemple U+0303 = « ◌̃ »).
Enfin, certains caractères unicode sont des ligatures de plusieurs lettres simples, comme « œ », qui représente « oe » en français.
Nous avons donc besoin d’une fonction qui :
- élimine les caractères modificateurs. Ex : n◌̃ –> n
- remplace tout caractère modifié par un diacritique par son équivalent simple. Ex : é –> e
- résolve les ligatures. Ex : œ –> oe
- ne s’intéresse qu’aux caractères latins, ignore les alphabets non latins (grec, cyrillique, arabe, hébreu, coréen…), et les écritures non alphabétiques (chinois…).
- et plus précisément soit valable pour le français, les langues européennes modernes, quelques langues exotiques (notamment le Vietnamien), mais sans nécessairement prendre en compte les langues mortes ou rarissimes (alphabets expérimentaux africains, etc.), ni les caractères utilisés dans l’alphabet phonétique international, ce qui ne servirait qu’à ralentir le script
Fausse piste
L’élimination des modificateurs ne pose pas de problèmes : ils sont regroupés dans des « blocs » Unicode qu’il suffit de cibler, essentiellement le bloc « Combining Diacritical Marks » (U+0300–U+036F), et le bloc des suppléments (U+1DC0-U+1DFF). On peut facilement éliminer tous ces caractères en utilisant une fonction « replace ».
Le reste est un peu plus délicat : on peut récupérer sur le site du consortium Unicode un fichier listant tous les caractères, et qui indique les règles de « décomposition » d’un caractère complexe. La ligne
00EB;LATIN SMALL LETTER E WITH DIAERESIS;Ll;0;L;0065 0308;;;;N;LATIN SMALL LETTER E DIAERESIS;;00CB;;00CB
signifie que le caractère U+00EB dénommé « LATIN SMALL LETTER E WITH DIAERESIS » (ë) peut se décomposer en U+0065 (e) + U+0308 (¨), et que son équivalent en majuscule est U+00CB.
Je pensais utiliser ce fichier, mais il n’est malheureusement pas assez précis. Certains caractères que l’on peut légitimement considérer comme composés ne sont pas signalés comme tels. C’est le cas notamment du l barré polonais :
0141;LATIN CAPITAL LETTER L WITH STROKE;Lu;0;L;;;;;N;LATIN CAPITAL LETTER L SLASH;;;0142;
Tout ce que donne le fichier c’est un équivalent en majuscule…
Tripatouillage tabulé
J’ai donc privilégié une autre piste : recopier dans un fichier tabulé tous les caractères qui m’intéressaient, en utilisant les tableaux disponibles par wikipédia (mais les mêmes données sont aussi sur le site d’unicode) dans les pages décrivant les principaux blocs de caractères latins, et exploiter le nom de chaque caractère pour en déduire avec quelques formules son équivalent simple. Par exemple, « LATIN CAPITAL LETTER L WITH STROKE » désigne un L majuscule modifié par une barre. Son équivalent simple est donc « L ».
D’autre part, j’ai fait une sélection dans ce fichier pour ne pas tenir compte de quelques caractères extrêmement rares ou obsolètes, et surtout de lettres « exotiques » qui bien que faisant partie en théorie de l’alphabet « latin » au sens large, n’ont pas d’équivalent strict dans la série [a-z] : « glottal stop », « whynn » et autre « kra » (utilisé en Inuit)…
Les caractères conservés ont été recopié dans une nouvelle feuille de calcul, puis à l’aide d’un tableau croisés dynamique assorti de quelques formules de concaténation et de remplacement, j’ai pu obtenir une série d’expressions de ce genre :
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a
Ensuite, il me suffit de remplir un array Javascript avec toutes ces expressions :
[
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a
…
['Z',/[\u0179\u017B\u017D\u1E90\u1E92\u1E94]/g], // Z
]
et de passer les éléments tableau en argument à une fonction « replace ».
J’ai travaillé dans Excel, mais j’ai recopié le fichier tabulé dans Google Docs (il a fallu refaire les tableaux dynamique, les filtres, etc.). Il est consultable ici.
Un traitement en deux étapes
Je me suis aperçu que ma fonction risquait de trop ralentir le script, même si ça se compte en millisecondes.
Donc, dans la mesure où dans 9 cas sur 10, les mots récupérés dans un catalogue de bibliothèque français ou dans IdRef ne comprennent que des caractères « ordinaires » (entendez par là, codés sur un octet), j’ai repris mon fichier tabulé pour créer deux autres onglets : un qui traite les caractères codés sur un octet (+3 caractères sur deux octets que l’on peut trouver en français :Ÿ Œ œ), et un second qui traite tous les autres caractères.
On peut donc faire un premier tableau javascript traitant les lettres susceptibles d’être rencontrées en français :
['a',/[\u00AA\u00E0\u00E1\u00E2\u00E3\u00E4\u00E5]/g], // a
et un second pour les lettres plus rares :
['a',/[\u0101\u0103\u0105\u01CE\u01FB\u0201\u0203\u1E01\u1E9A\u1EA1\u1EA3\u1EA5\u1EA7\u1EA9\u1EAB\u1EAD\u1EAF\u1EB1\u1EB3\u1EB5\u1EB7]/g], // a
A l’issu de la première phase du traitement, si on ne détecte aucun caractère codé sur deux octets, on peut sortir de la fonction. Dans le cas contraire, la fonction peut approfondir l’examen de la chaîne à traiter.
Finalement…
La fonction traite :
- tous les caractères latins codés sur 1 octet en Unicode (blocs C0 Controls and Basic Latin, also called Basic Latin et C1 Controls and Latin-1 Supplement), dont les lettres islandaises Thorn et Eth, remplacées par « Th » et « D » (choix qui n’a aucune valeur officielle…)
- une sélection de caractères codés sur 2 octets en Unicode :
En plus des caractères modifiés par des diacritiques, elle « résout » les ligatures et digrammes suivants : SS/ss ; ae/Ae ; Oe/oe ; IJ/ij ; DZ/Dz/dz ; NJ/Nj/nj ; LJ/Lj/lj
Elle ne traite pas :
- les caractères de l’alphabet phonétique international, du bloc Latin Extended-C 2C60–2C7F et du bloc Extended-D A720–A7FF.
- les lettres « exotiques » qui bien que faisant partie de l’alphabet « latin » au sens large, n’ont pas d’équivalent strict dans la série [a-z] : « glottal stop », « whynn », « kra », etc., sauf Eth et Thorn
Quelques remarques :
- En Unicode, les umlaut allemands sont considérés comme des trémas -> ä, ü et ö deviennent a, u, o et non ae, ue, oe
- O et o barré sont remplacés par O et o, mais on pourrait les transcrire également par Oe/oe
- les d/D barrés sont transcrits d/D : normal en Vietnamien, mais ils sont usuellement transcrit par Dj dans les langues balkaniques
http://unicode.org/charts/PDF/UA720.pdf
Posté le 20 août 2011 par vingtseptpointsept| Mots-clefs: Greasemonkey, IDREF, javascript | Catégories: autorités, bidouillages, Catalogue | - (Les commentaires sont clos) [Note du 1er septembre 2011 : le script décrit dans ce billet a été légèrement modifié depuis. Je travaille à d'autres changements qui feront l'objet d'un prochain billet]
Cela ne saute sans doute pas aux yeux de nos lecteurs, mais l’un des manques du catalogue (HIP = Horizon information portal) de ma bibliothèque est l’absence d’import des autorités du Sudoc.
Pour parler français, lorsque dans le Sudoc il existe une fiche détaillant les différentes identités d’une personne (par exemple « Stendhal » = « Henri Beyle », etc.) ou les (quasi-)synonymies entre certains concepts (par exemple « philosophie des arts » = « esthétique »), nous ne récupérons toujours que la forme de référence (Stendhal, esthétique).
Du coup, une recherche sur Henri Beyle ou Georges Rémi ne donnera rien, ou si peu, dans notre catalogue.
La solution idéale serait de changer de catalogue, mais comme ce n’est pas le genre de chose qui se fait en claquant des doigts, cela nous laisse le temps d’essayer de bricoler un peu.
Quand l’ABES a annoncé le lancement d’IdRef, j’ai tout de suite pensé qu’on pourrait utiliser cette application pour enrichir notre catalogue avec les autorités du Sudoc. J’ai d’ailleurs trouvé la même idée dans ce billet de Bibliothèques [reloaded]:
Exemple : (hypothèse de départ) mon opac permet d’afficher un message spécifique si l’internaute trouve 0 résultat. S’il y a 0 résultat, l’opac va interroger les autorités Sudoc, et trouver que les mots recherchés correspondent à une forme rejetée d’une notice d’autorités (exemple typique lié à des questions de translittération). Il récupère alors la forme retenue (celle qui est effectivement présente dans mes notices bibliographiques) et le propose comme rebond de recherche à l’internaute (rebond de recherche sur ma base, toujours).
Mais comme cela impliquait d’explorer à fond la syntaxe d’IdRef, et de se plonger la tête la première dans le javascript et/ou le php, je ne me suis pas senti pressé, vu que je n’ai jamais écrit un script fonctionnel de plus de 20 lignes jusqu’à présent.
Je ne sais pas si je dois remercier la météo, mais j’ai fini par m’attaquer au morceau au début de mes vacances… Le résultat est ce fichier javascript (700 lignes, mais beaucoup de blabla…) qui pourra se charger (bouton vert Install) dans Google Chrome sans autre forme de procès, ou bien dans Firefox après avoir au préalable installé l’extension Greasemonkey.
Le fonctionnement de mon script ne correspond pas exactement à la suggestion de Lully : la recherche dans IdRef est faite systématiquement, et pas seulement lorsque notre catalogue ne ramène aucune réponse.
Tout cela est très expérimental, et ne saurait être présenté à des lecteurs en l’état actuel. Mon but était avant tout de voir si cette idée pouvait avoir un début d’application, et quelles en étaient les limites (et accessoirement d’apprendre à programmer en javascript! D’ailleurs, il serait judicieux de rédiger une partie du code en php, mais c’est une autre histoire…)
La recherche simple
Le script ajoute aux pages de recherche simple et avancée de notre catalogue un nouveau panneau intitulé « Essai d’ajout de fonctions avec Greasemonkey« , qui présente plusieurs options.
 nouveau panneau dans l'opac
Lors d’une recherche simple sur « Beyle », en gardant les options par défaut, le nouveau panneau nous indique :
- l’URL utilisée pour faire la requête dans idref : http://www.idref.fr/Sru/Solr?q=all:%22beyle%22&start=&rows=15&wt=json&fl=affcourt_z
- l’index utilisé : « all » (on le retrouve dans l’URL)
- le nombre de réponses trouvées : 5
- le nombre de formes alternatives conservées : 1
- l’url permettant d’avoir le résultat final dans notre catalogue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=%28beyle%20or%20stendhal%29&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims
 recherche de Beyle
Dans cet exemple précis, le script a trouvé 5 formes correspondant à Beyle dans IdRef (dont la dernière serait sans doute à corriger…) : « Beyle, Thad L. (1934-) », « Beyle, Paul », « Beyle, Pauline (1786-18..) », « Stendhal (1783-1842) », « Stendhal, Henri Beyle (1783-1842). Vie de Henry Brulard ».
Un peu de nettoyage
Mais toutes les formes commençant par « Beyle » ne nous sont pas très utiles, puisqu’elles ne font que reprendre notre terme de recherche. De plus, si l’on réinjecte ces expressions dans le catalogue, la présence des parenthèses va gravement perturber la recherche (c’est un défaut de HIP que j’ai découvert à cette occasion… ). Il est donc nécessaire de « nettoyer » les formes obtenues, avant de les comparer avec la forme saisie par l’usager.
Par défaut, le script supprime donc tout ce qu’il trouve après la virgule, ce qui nous donne : « Beyle », « Beyle », « Beyle », « Stendhal, « Stendhal », et ne garde que les formes nouvelles. En l’occurrence, il n’y en a qu’une : « Stendhal ».
Il est possible de modifier ce fonctionnement en cochant le bouton « »supprime les parenthèses uniquement ». Dans ce cas les prénoms sont conservés. Cela génère une équation de recherche plus fine, mais aussi plus lourde. On peut faire l’essai en cliquant à nouveau sur « Chercher ».
 recherche de Beyle en changeant une option
L’URL de recherche dans IdRef est la même, mais l’URL pour HIP est beaucoup plus longue : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.GK&term=(beyle%20or%20%22beyle%2C%20thad%20l.%22%20or%20%22beyle%2C%20paul%22%20or%20%22beyle%2C%20pauline%22%20or%20stendhal%20or%20%22stendhal%2C%20henri%20beyle%20.%20vie%20de%20henry%20brulard%22)&session=131A7763384G4.791700&menu=search&aspect=basic_search&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=basic_search&source=~!scdreims
Cela fonctionne de la même manière avec les expressions entre guillemets, qu’il faudra saisir bien de manière conforme à la structure des vedettes (« Blair, Eric » par exemple (avec la virgule!), et non « Eric Blair » pour obtenir la forme d’autorité, à savoir « Orwell, Georges »).
La recherche avancée
De même, on peut utiliser la recherche avancée, dont les champs seront « interprétés » avant d’être croisés les uns avec les autres (cela m’a demandé plus de travail, car il faut gérer plusieurs index, les opérateurs booléens, etc.)
Voici par exemple ce que donne une recherche (Auteur = beyle ET Sujet = beyle) :
 Recherche Auteur Beyle et Sujet Beyle
L’URL pour HIP renvoit 26 réponses : http://scdweb.univ-reims.fr/ipac20/ipac.jsp?index=.AW&term=(beyle%20or%20stendhal)%20and%20.SW%3D(beyle%20or%20stendhal)&session=131EG779H4849.791973&menu=search&aspect=advanced&npp=15&ipp=20&spp=20&profile=scdldap&ri=&aspect=advanced&limitbox_1=&limitbox_2=&ultype=&uloper=%3D&ullimit=&ultype=&uloper=%3D&ullimit=&sort=&source=~!scdreims
On y trouve notamment la correspondance de Stendhal, puisque ce type d’ouvrage est indexé avec une vedette sujet au nom de l’auteur.
 correspondance de Stendhal
Quels index interroger dans IdRef et avec quelle troncature?
Je n’ai pas évoqué l’option proposé concernant le « mode d’interrogation d’IdRef » : par défaut, on procède à une recherche « tous mots » dans IdRef, au moyen de l’index « all ». Mais cette recherche peut être parfois trop générale, et ramener trop de réponses. Par exemple, si vous cherchez « Michel » dans un catalogue, il y a des chances que ce soit le nom de famille de la personne (Louise Michel par ex.) qui vous intéresse, et pas son prénom! Mais vous pourrez injurier votre index tous mots tant que vous voudrez, jamais il ne vous fera le plaisir de distinguer les noms et les prénoms. Il renverra donc imperturbablement 17 607 réponses comportant le mot « Michel ». Difficilement exploitable…
Comme on ne peut malheureusement pas faire des recherches par noms de famille dans IdRef (comme je l’expliquais dans le billet précédent), j’ai eu recours à un expédient : utiliser les index de type « phrase », qui sont alimentés par le contenu entier et exact des zones indexées, et non par les mots qui les composent. Concrètement (j’espère que je ne dis pas de bêtises), en explorant les index de type mot d’IdRef, on peut accéder à l’autorité « Michel, Louise (1830-1905) » en cherchant « Michel », « Louise, » (1830-1905) », « Michel, Louise », « Michel, Louise (1830-1905) » et même « Louise (1830-1905) »!
Par contre, en explorant les index de type phrase, il faut impérativement saisir la forme complète et exacte de son nom : « Michel, Louise (1830-1905) ». Si l’on omet le prénom, ou même les dates, la réponse sera vide. Donc, si on veut trouver toutes les personnes dont le nom de famille est Michel, ou toutes les Louise Michel (quelque soit leur date de naissance), il faut utiliser une troncature.
(Je suis en train de réaliser qu’une armée de juges a dû rêver de troncaturer Louise Michel. Louise, si tu me lis, promis, ma troncature est pacifique…)
 Louise Michel en 1871
En cliquant sur « plusieurs index ‘phrase’ (avec les diacritiques ; troncature grossière) » on créera une équation de recherche assez longue, qui additionne tous les index de type « phrase » disponibles dans IdRef. J’étais curieux de voir si les résultats seraient différents, et effectivement, ils le sont parfois. Pour « Michel », cette option permet de ne récupérer « que » 1090 réponses.
Je vais illustrer cette option par la recherche (Auteur Beyle et Sujet Beyle) que j’avais déjà commenté plus haut.
 recherche Auteur Beyle et Sujet Beyle en changeant le mode d'interrogation
Voici l’URL d’interrogation de IdRef générée pour compléter l’index Auteur de HIP : http://www.idref.fr/Sru/Solr?q=%28persname_s:beyle*%20or%20corpname_s:beyle*%20or%20geogname_s:beyle*%20or%20famname_s:beyle*%20or%20uniformtitle_s:beyle*%20or%20name_title_s:beyle*%20or%20trademark_s:beyle*%29&start=&rows=15&wt=json&fl=affcourt_z.
L’URL pour l’index Sujet de HIP est un peu plus longue, car j’ai ajouté une interrogation de l’index « nom commun » (autrement dit, Rameau et Fmesh) de IdRef (subjectheading_s), qui aurait été inutile pour enrichir l’index Auteur (puisqu’un nom commun ne peut pas être auteur d’un document, alors qu’un nom propre peut être à la fois auteur et sujet…)
La troncature est cependant grossière, ce qui peut engendrer du bruit : un joker ( * ) est tout simplement ajouté après l’expression saisie par l’usager.
Dans le cas d’une recherche sur « Beyle », on récupère non seulement 3 des formes que l’on avait trouvées en utilisant l’index « all » (« Beyle, Thad L. (1934-) », « Beyle, Pauline (1786-18..) », « Stendhal (1783-1842) ») mais également Van Beylen, Marcel Beyleveld, Deryck Beyler, Louis Beylerian, Onnig (1947-….) Beyler, Jean-Noël (19..-….) Beyleryan, Arthur A.
En cherchant « Beyle* » ou « Michel* », on a donc encore trop de bruit, car a priori ni Jean-Noël Beyler ni Jules Michelet ne nous intéressent.
J’ai donc essayé de faire une troncature plus fine construite ainsi : (mot OU mot+espace+* OU mot+point+* OU mot+virgule+*). Logiquement, cela devrait couvrir tous les types d’autorités.
Pour « Michel », cette option donne encore 708 réponses, ce qui fait encore beaucoup, mais ce n’est pas surprenant car Michel est un nom de famille courant.
Pour « Beyle », voici l’URL d’interrogation de IdRef générée avec cette option : http://www.idref.fr/Sru/Solr?q=%28persname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20corpname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20geogname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20famname_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20uniformtitle_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20name_title_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%20or%20trademark_s:(beyle%20beyle%5C%20*%20beyle.*%20beyle%2C*)%29&start=&rows=15&wt=json&fl=affcourt_z
Cette fois, on ne trouve que 3 réponses : « Stendhal (1783-1842) », « Beyle, Pauline (1786-18..) » et « Beyle, Thad L. (1934-) ».
Wanted : Paul Beyle. Forte récompense.
Tout serait parfait si ce n’était la disparition mystérieuse de « Beyle, Paul » que nous avions trouvé avec la première options (la recherche avec l’index global ‘all’), mais qui n’apparait pas avec l’index persname_s, que ce soit avec la troncature grossière ou plus fine.
La preuve : http://www.idref.fr/Sru/Solr?q=all:%22beyle,%20paul%22 permet de retrouver sa fiche, alors que http://www.idref.fr/Sru/Solr?q=persname_s:beyle,\%20paul* ne donne aucune réponse…
Je pense avoir trouvé un début d’explication en examinant le détail de la réponse à la première de ces requêtes. Voici le code XML généré :
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="q">all:"beyle, paul"</str>
</lst>
</lst>
<result name="response" numFound="1" start="0">
<doc>
<arr name="affcourt_r">
<str>Beyle, Paul</str>
</arr>
<str name="affcourt_z">Beyle, Paul</str>
<arr name="all">
<str>150868537</str>
<str>a</str>
<str>Beyle, Paul</str>
<str>Beyle, Paul</str>
<str>autre</str>
<str>ko</str>
<str>ok</str>
<str>fre</str>
<str>eng</str>
<str>dut</str>
<str>FR</str>
</arr>
<arr name="d101_s"><str>fre</str><str>eng</str><str>dut</str></arr>
<arr name="d102_s"><str>FR</str></arr>
<arr name="d103_s"><str>autre</str></arr>
<date name="dateetat_dt">2011-03-22T07:11:16Z</date>
<date name="dateindex_dt">2011-03-22T07:13:17Z</date>
<str name="heading_z">ok</str>
<str name="id">2297903</str>
<arr name="persname_t"><str>Beyle, Paul</str></arr>
<str name="ppn_z">150868537</str>
<str name="recordtype_z">a</str>
<str name="subdivision_z">ko</str>
</doc>
</result>
</response>
Quelques remarques sur ce code :
- J’imagine que les balises « arr » désignent des tableaux (arrays), comprenant un ou plusieurs composants, et que les balises « str » contiennent des chaînes (string).
- Les attributs « name » désignent des noms d’index : « all » (l’index général), « persname_t », « ppn_z », et plein d’index permettant de faire des limitations (dates, langue, nationalité, type de notice, emploi, etc.)
- Le nom complet figure deux fois dans l’index « all ». J’ignore pourquoi.
- Tous les index spécifiques sont repris dans l’index « all »
- Il n’y a pas d’index « persname_s » (index de type ‘phrase’ pour les personnes physiques)
J’en conclus que l’absence d’index « persname_s » dans cette fiche est une anomalie qui empêche de retrouver « Beyle, Paul » dans cet index.
Par comparaison, voici la fiche de « Beyle, Pauline » en XML (uniquement la partie <doc>…</doc>) :
<doc>
<arr name="affcourt_r">
<str>Beyle, Pauline (1786-18..)</str>
<str>Périer-Lagrange, Pauline (1786-18..)</str>
<str>1786-18..</str>
</arr>
<str name="affcourt_z">Beyle, Pauline (1786-18..)</str>
<arr name="all">
<str>03367454X</str>
<str>a</str>
<str>Beyle, Pauline (1786-18..)</str>
<str>Beyle, Pauline (1786-18..)</str>
<str>Périer-Lagrange, Pauline (1786-18..)</str>
<str>beyle, pauline (1786-18..)</str>
<str>périer-lagrange, pauline (1786-18..)</str>
<str>mort</str>
<str>ko</str>
<str>ok</str>
<str>fre</str>
<str>FR</str>
<str>1786-18..</str>
</arr>
<arr name="d101_s"><str>fre</str></arr>
<arr name="d102_s"><str>FR</str></arr>
<arr name="d103_s"><str>mort</str></arr>
<date name="dateetat_dt">2011-01-13T07:34:07Z</date>
<date name="dateindex_dt">2011-05-25T21:05:47Z</date>
<date name="datemort_dt">1800-01-01T01:01:00Z</date>
<date name="datenaissance_dt">1786-01-01T01:01:00Z</date>
<str name="heading_z">ok</str>
<str name="id">413435</str>
<arr name="persname_s">
<str>beyle, pauline (1786-18..)</str>
<str>périer-lagrange, pauline (1786-18..)</str>
</arr>
<arr name="persname_t">
<str>Beyle, Pauline (1786-18..)</str>
<str>Périer-Lagrange, Pauline (1786-18..)</str>
</arr>
<str name="ppn_z">03367454X</str>
<arr name="rcr_t"><str>1786-18..</str></arr>
<str name="recordtype_z">a</str>
<str name="subdivision_z">ko</str>
</doc>
Dans les dernières lignes on trouve bien une double indexation persname_t (personne, index mot) et en persname_s (personne, index phrase).
Dieu et l’ABES seuls savent pourquoi Paul Beyle y a échappé (absence de dates entre parenthèses ? manque de bol ? mauvais karma ?)
Mais ce n’est pas tout : en dépouillant ces fichiers XML, j’ai eu surprise encore plus mauvaise : Trrremblez mortels, car la faucheuse rôde sur IdRef!
IdRef, mis KO par la mort…
 Les morts dansant la gigue dans les serveurs d'IdRef (Holbein)
Dans l’index tous mots « all », on trouve non seulement les noms et dates des entités décrites, mais aussi le PPN ou des mots clés comme « FR » ou « fre ». Jusque là, rien de gênant. Cela pourrait même être pratique.
Là où les choses se gâtent, c’est quand des informations concernant les règles d’usage de l’autorité ou le statut des personnes vis à vis de l’état civil sont codés au moyen de mots qui ont une signification en français : « mort », « autre », « ko », « ok », « a ».
Faites donc l’expérience de rechercher dans l’interface publique d’IdRef des mots comme « mort » ou « ko » en sélectionnant le dernier index (« Tout ») du menu déroulant, et vous aurez une mauvaise surprise :
 La mort rôde dans IdRef
La recherche « ko » en tous mots donne 2212960 résultats. La recherche « mort », 309329 résultats, et la recherche « autre », 1957180 résultats !
Je pense qu’il serait bon que ces clés d’index soient renommées (ou ne soient plus interrogeables par « all », mais ce serait dommage).
Enfin, je finirai ce billet par quelques remarques sur la syntaxes d’IdRef, qui ne sont pas encore toutes documentées par l’ABES.
La syntaxe d’IdRef : échapper pour que rien ne s’échappe
Toutes mes requêtes commencent ainsi : « http://www.idref.fr/Sru/Solr?q= », puis j’ajoute les paramètres, et je les termine par « &start=&rows=15&wt=json&fl=affcourt_z »
- « fl=affcourt_z » signifie que je ne veux obtenir qu’un seul élément : la forme d’autorité. Pas besoin du PPN, des formes rejetées ou d’autres champs.
- « start=&rows=15″ signifie que ne je veux les 15 premières réponses. On pourrait très bien mettre 30, 300 ou 3000, mais le risque est de récupérer un flot de données trop importantes à exploiter… Cette option est modifiable au moyen d’une la liste déroulante dans le panneau de gauche.
- « wt=json » signifie que je souhaite obtenir les résultats au format JSON. On pourrait les récupérer en XML, mais bon, c’était l’occasion de découvrir JSON…
La construction des paramètres, voila le gros morceau! D’autant plus que les règles sont différentes selon les types d’index…
Voici comment cela se présente pour la troisième option (la plus complexe, index phrase avec troncature « fine ») :
- ((INDEX1) or (INDEX2) or (INDEX3)…. )
- chaque expression (INDEXn) est en fait elle-même composite. Voici la première : (persname_s:(beyle beyle\ * beyle.* beyle,*)
Quelques remarques :
- entre chaque index, il faut utiliser le booléen « or », mais au sein d’un même index, pour avoir le même effet, il faut séparer les termes par un espace. Sinon, le mot « or » sera interprété comme la vedette décrivant le métal précieux…
- dans les index phrase, tout doit être mis en minuscules mais contrairement aux index mot, les diacritiques (accents, cédilles, etc.) doivent être conservés, y compris les majuscules accentuées
- Dans l’url, ces diacritiques doivent être codés en ISO 8859 et non en UFT-8. Par exemple « é » doit être codé %E9 et non %C3%A9. Ce qui a pour conséquence la non indexation de mots comprenant des caractères non représentables en ISO 8859.
- il faut ajouter « \ » devant certains caractères pour empêcher que le script leur attribue une valeur spéciale. En informatique, c’est ce qu’on appelle un « échappement ». Cela s’applique :
- aux parenthèses ouvrantes et fermantes
- à l’espace
Ainsi, pour rechercher le géographe « Reclus, Élisée (1830-1905) » avec cet index, et sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=persname_s:reclus,\%20%C9lis%E9e\%20\%281830-1905\%29
Par contre, pour les index mot, comme l’index « all » :
- il ne faut pas « échapper » les espaces et les parenthèses
- on peut utiliser les guillemets doubles » » pour encadrer les expressions composés de plusieurs mots séparés par un espace
- tout doit être mis en minuscule, mais il faut aussi supprimer les diacritiques
Pour rechercher la même personne avec l’index « all », toujours sans troncature, il faut utiliser cette URL : http://www.idref.fr/Sru/Solr?q=all:%22reclus%2C%20elisee%22
Je reviens sur cette histoire d’encodage des caractères qui n’est pas évidente. Prenons par exemple un nom polonais, comme « Kościuk, Jacek« . Une URL ne peut pas comprendre de caractères spéciaux, c’est à dire non inclus dans le code ASCII original (128 caractères), et ne doit d’ailleurs pas comprendre certains caractères comme l’espace, le point, etc… Pour qu’un navigateur comprenne le « s accentué », il faut donc l’encoder selon le standard UTF-8. Le code hexadécimal correspondant est « %C5%9B ». Il est faut donc deux octets pour le représenter (C5 et 9B).
Par contre, coup de bol, la plupart des caractères propres au français (sauf Ÿ, Œ, œ) peuvent certes être représentés sur deux caractères en UTF-8, mais aussi en un seul caractère selon d’autres standards.
Le Sudoc, et la plupart des sites modernes sont capables de gérer une URL comprenant des caractères en UTF-8. Voici un lien dans le Sudoc vers le livre dont ce monsieur est l’auteur : http://www.sudoc.abes.fr/DB=2.1/CMD?ACT=SRCHA&IKT=1004&SRT=RLV&TRM=Ko%C5%9Bciuk%2C+Jacek
Or, dans IdRef, que ce soit l’interface publique (0 résultats pour le terme » Tout=Kościuk, Jacek ») ou le webservice, impossible de retrouver notre ami polonais! Même en remplaçant le « s accentué » par un « s » normal ou par « ? », et en interrogeant l’index « all »…
Conclusion
J’ai monté une vraie usine à gaz, qui n’est pas très fonctionnelle. Je doute que l’idée de départ soit finalement applicable, car IdRef renvoie souvent trop de réponses pour construire une URL qui ne fasse pas des km dans HIP. En plus je me demande si interroger le serveur de notre catalogue avec des équations si longues ne risque pas de le faire « surcharger » d’une manière ou d’une autre. Mais il faudrait quelqu’un de plus compétent que moi en informatique pour le dire.
Par contre, cela m’a permis d’aiguiser mes compétences en javascript, et de mieux comprendre le fonctionnement d’IdRef, et de relever quelques points délicats (échappement dans les index phrase) ou gênants (non indexation de certaines notices, pollution de l’index all par des certains mots clés).
J’espère que cela pourra être utile à d’autres personnes. Si vous voulez copier des morceaux de mon code pour votre usage, n’hésitez pas.
Posté le 21 juillet 2011 par vingtseptpointsept| Mots-clefs: IDREF, WebServices | Catégories: autorités, bidouillages | Les commentaires sont clos Depuis quelques semaines, je tripote dans tous les sens Idref, l’application de l’ABES permettant de consulter les autorités du Sudoc (et des autres bases de l’ABES : Calames et STAR).
L’application est en ligne depuis octobre 2010, mais l’ABES a depuis quelques mois ajouté plusieurs fonctionnalités. En plus d’une précieuse documentation technique, l’ABES a mis en ligne une page de démonstration illustrant la possibilité d’établir des liens et d’échanger des données entre Idref et des applications externes.
Je voudrais faire une petite démonstration, et surtout évoquer une limitation d’IdRef que j’ai découvert à cette occasion.
Votre appli >IdRef > votre appli
Le fonctionnement du dispositif est expliqué dans ce billet du blog technique de l’ABES, qui renvoie à d’autres liens.
Précisons que la page de démonstration utilise une « base de test », donc les résultats ne sont pas forcément ceux qu’on aurait en interrogeant directement IdRef, mais cela ne change absolument rien au principe (pour interroger la base de production, si j’ai bien compris, il suffirait de remplacer dans le code de la page var remoteSrv="http://193.52.69.127:8080/autorites/remoteAutorites.html" par var remoteSrv="http://www.idref.fr/autorites/remoteAutorites.html")
Petite démonstration en images :
Remplissons les champs « nom » et « prénom » avec ceux de la personne recherchée. Au hasard, un certain Yann Nicolas…
 Page de test d'IDREF : recherche de Nicolas, Yann
Après validation du formulaire, une nouvelle page s’ouvre, dans laquelle IdRef renvoie les trois notices correspondant à notre recherche :
 Les 3 Yann Nicolas dans IDREF
Cliquons sur le Yann qui nous intéresse (le spécialiste des Maoris…) :
 IdRef : notice de Yann Nicolas (1973)
Et maintenant, laissons nous-tenter par cet alléchant bouton « lier la notice » en bas de la page. Son activation va automatiquement envoyer dans notre page « votre appli > IdRef > votre appli » les informations tirées de la notice en cours d’affichage.
 Page de test d'IDREF : après récupération des données
Plutôt cool non?
Mais un détail me chiffonne néanmoins…
Une gestion des noms qui manque de finesse
Videz les formulaires, et refaites la même requête en inversant le nom et le prénom :
 De Yann Nicolas à Nicolas Yann
Surprise! Le formulaire renverra les même trois notices dans IdRef.
Autrement dit, tout se passe comme si nom et prénom étaient interchangeables…
J’ai d’abord cru à une petite erreur dans le code, mais après un bon moment passé à essayer de décortiquer tout cela (merci Firebug!), je pense qu’il s’agit d’une limitation plus fondamentale d’IdRef (et peut-être de Solr, sur lequel l’application est construite).
Voici les différentes étapes de la requête :
- Le formulaire concatène tous les paramètres de la recherche dans une chaîne et les envoie à une page externe. Voici à quoi ressemble cette chaîne : « Index1=Nom%20de%20personne&Index1Value=yann%20nicolas&Index2=&Index2Value=&Index3=Langues&Index3Value=&Filtre1=Type%20de%20notice/Personne&z200_a=nicolas&z200_b=yann&z101_a=&z103_a=20100101&z810_a=une%20autre&AutoClick=true ». On y trouve à la fois le nom (index z200_a), le prénom (index z200_b) et une chaine nom+prénom.
- Cette chaîne est traitée par une page http://www.idref.fr/autorites/remoteAutorites.html qui ne s’affiche pas mais renvoie la requête vers une 3e page.
- La 3e page http://www.idref.fr/autorites/autorites.html est celle où les informations seront affichées, en fonction des réponses du serveur.
- Cette page interroge le serveur en envoyant la requête suivante : « http://www.idref.fr/Sru/Solr?q=persname_t:%20(nicolas%20AND%20yann)%20AND%20recordtype_z:a&sort=score%20desc&version=2.2&start=0&rows=30&indent=on&fl=id,ppn_z,recordtype_z,affcourt_z ». Dans les paramètres, on ne retrouve plus que « (nicolas AND yann) », sans distinction du nom et du prénom.
CQFD.
Dans la documentation technique, rien n’indique la possibilité d’interroger spécifiquement le nom, le prénom, la date de naissance, la date de mort, ou tout autre élément de ce genre. A tout hasard, j’ai essayer de bricoler l’url avec des requêtes du genre « http://www.idref.fr/Sru/Solr?z200_a=nicolas », mais tout ce que j’obtiens ce sont des messages d’erreur.
Est-ce si grave? Sans doute pas, mais c’est un peu agaçant tout de même, car les notices comportent des informations potentiellement intéressantes, qu’il est impossible d’interroger. Alors, certes, dans le Sudoc et dans WinIBW (notre outil de catalogage), il n’est pas non plus possible de faire ce genre de recherches, mais il est dommage qu’un nouvel outil comme IdRef ne le permette pas. Je ne sais pas si c’est une limitation due au fonctionnement même de l’outil, ou si l’ABES a choisi volontairement de restreindre le nombre d’index.
Peut-être quelqu’un de bien informé pourrait-il m’en dire plus?
Posté le 17 juillet 2011 par vingtseptpointsept| Mots-clefs: Google Scholar | Catégories: collections numériques | - (Les commentaires sont clos) Tous les documentalistes et bibliothécaires savent qu’il ne faut utiliser Google scholar qu’avec prudence lorsqu’on recherche des articles scientifiques.
Car, ainsi que l’explique ce wiki réalisé par l’URFIST PACA (mais de nombreux tutoriels donnent les mêmes informations) on peut faire de nombreuses reproches au moteur :
- Pas de listes des éditeurs commerciaux et des serveurs d’archives qu’il indexe
- Pas d’informations sur le type de document traité et la période couverte
- Couverture réelle non précisément connue
- Opacité de l’algorithme de classement des résultats et de celui du calcul des citations
- Des résultats moins complets que l’interface d’interrogation des bases natives
Mais je pensais du moins que Google Scholar se contenait d’interroger des sources scientifiquement fiables : sites d’éditeurs, archives institutionnelles, etc.
Quelle n’a pas été ma surprise en constatant que le moteur avait indexé mon mémoire de DUT déposé uniquement sur ma page personnelle!
Sans vouloir jouer les faux modestes, mon mémoire de DUT n’est qu’un mémoire de DUT… Et rien ne garantit sa qualité, ni même son authenticité. Je pourrais très bien ne jamais avoir soutenu ce mémoire (ce qui n’est pas le cas, heureusement pour moi), ou bien l’avoir largement remanié après sa soutenance (d’ailleurs, si je me souviens bien, j’avais corrigé quelques broutilles avant de le mettre en ligne. Ce n’est donc pas une copie exacte au mot près à l’exemplaire de soutenance, déposée à la bibliothèque de l’IUT de Nancy II).
J’imagine que mon cas est loin d’être isolé. J’ignore comment procède Google, mais je suppose qu’il doit rechercher des documents pdf contenant certains mots clés (« mémoire » « soutenu sous la direction de… », « bibliographie »…), ou contenant des références bibliographiques, sans quoi tous les fichiers pdf de la toile seraient indexés. Un algorithme doit également permettre de retrouver mon nom à partir de la page de titre du mémoire, à moins que Google n’utilise pour cela les informations de mon site personnel.
En tout cas, cela m’aura permis de me faire une idée des technologies de pointe utilisées pour alimenter Google Scholar…
 Au coeur des serveurs de Google, une technologie de pointe...
Posté le 14 juillet 2011 par vingtseptpointsept| Mots-clefs: ABES, BSN | Catégories: information scientifique et technique | - (Les commentaires sont clos) [Nombreuses coquilles corrigées le 16/7.]
Voici quelques notes faisant suite au précédent billet consacré aux Journées ABES. Il s’agit d’une petite synthèse que j’ai d’abord faite pour moi-même, mais qui pourra peut-être servir à ceux qui ont n’ont pas suivi en détail les évolutions institutionnelles de ces dernières années.
La MISTRD
En préambule, je rappellerais que l’organisation du ministère de l’Enseignement Supérieur et de la Recherche a été profondément remaniée en par le décret du 16 mars 2009, notamment pour prendre en compte les conséquences de la LRU et de la RGPP (Révision générale des politiques publiques). Deux arrêtés ont été pris le même jour, pour préciser l’organigramme et pour créer un « pôle de contractualiation et de financement des établisssements de formation et de recherche ». Fin 2009, un article d’A. Colas paru dans le BBF a fait le point sur les conséquences pour les BU.
Les changements importants sont l’association entre la politique documentaire et l’IST et l’affirmation du caractère transversal de cette mission.
Ainsi, dans la définition des missions de la DGES (Direction générale de l’Enseignement Supérieur), avant 2009, on pouvait lire ceci :
Elle élabore la politique de développement et de modernisation de la documentation et des bibliothèques universitaires.
Depuis 2009, ce rôle est formulé différemment (la bibliothèque en tant que lieu n’est plus mentionnée, et la « politique de développement et de modernisation de la documentation » est remplacée par une « politique documentaire » autrement plus chic), il est associé à la politique de l’IST, et surtout doit s’exercer conjointement avec l’autre direction générale (DGRI, Direction générale de la recherche et de l’innovation).
Conjointement avec la direction générale pour la recherche et l’innovation, elle élabore les politiques documentaire et d’information scientifique et technique, ainsi que la politique de l’emploi scientifique, et assure la cohérence du système d’information de l’enseignement supérieur et de la recherche.
En toute logique, on retrouve une phrase symétrique dans l’article définissant le rôle de la DGRI.
En outre, depuis le 20 juillet 2010, la DGESIP « définit la politique de diffusion et d’utilisation des technologies de l’information et de la communication pour l’enseignement supérieur et favorise le développement des ressources et des services pédagogiques numériques. ». Ce point ne concerne pas directement les bibliothèques, mais il y a évidement une opportunité à saisir pour les SCD.
Concrètement, avant 2009, c’est la Sous-Direction des Bibliothèques et de l’Information Scientifique, dépendant de la DGES, était en charge de l’ABES, et indirectement des BU. Une autre structure, plus petite, le bureau de l’IST, dépendait de la DGRI.
Ces deux instances ont fusionné dans une Mission de l’information scientifique et technique et du réseau documentaire (MISTRD), dépendant du Service de la coordination stratégique et des territoires, service commun à la DGRI et à la DGESIP (Direction générale pour l’enseignement supérieur et l’insertion professionnelle), nouveau nom de la DGES.
La disparition du mot « bibliothèques », la rétrogradation dans l’organigramme (la sous-direction devenant une simple mission) et le flou entourant les conséquences pratiques de cette réforme n’ont pas été sans entraîner une réelle appréhension chez certains collègues.
L’avenir institutionnel de l’ABES
Au grand jeu de la RGPP, il y a des gagnants et des perdants. Dans notre domaine, le perdant est incontestablement l’INIST, qui risque d’être démantelé, comme le déplorent les syndicats et l’AG du personnel.
Au contraire, le rôle de l’ABES n’est absolument pas remis en cause, et semble plutôt renforcé.
Sur le modèle des universités, l’ABES sera évaluée par l’AERES (qui cherchera surtout à établir des comparaisons entre l’ABES et ses équivalents étrangers) et un contrat d’objectif quadriennal établi pour 2012-2015 en tenant compte de cette évaluation. La question de l’articulation entre ce contrat et le projet d’établissement que l’ABES est en train d’élaborer reste encore à préciser.
La MISTRD pousse l’ABES à se nouer des partenariats avec les universités de Montpellier (campus commun, association avec des laboratoires locaux…). Les dates du contrat quadriennal ont d’ailleurs été pensées pour faciliter de tels projets.
Enfin, l’ABES doit se rapprocher du CERIMES, avec lequel elle collabore déjà pour les Signets des universités. Les modalités devraient être fixées cet été (fusion totale, fusion partielle, collaboration renforcée ?).
De nouvelles missions pour l’ABES
Dans le cadre de la RGPP, les administrations centrales sont appelées à se recentrer sur les fonctions « stratégiques », les fonctions « opérationnelles » étant confiées à des opérateurs.
La MISTRD n’a pas fait exception à la règle, et en 2010, elle a confié 4 missions nationales à l’ABES :
- Mission thèses :
- L’ABES assure la modernisation du Fichier central des thèses, la formation professionnelle et des usagers, les aspects de la normalisation relatifs aux thèses.
- Elle partage avec le ministère la politique de valorisation et de diffusion, le portail des thèses (l’ABES assure la partie technique, mais les choix ont été faits en collaboration avec le ministère), le conseil aux établissements, la rédaction de documents de référence.
- Enfin, le pilotage reste du ressort du ministère : habilitation et tutelle d’établissements (universités, ANRT, Presses universitaires…), questions juridiques (propriété intellectuelle…).
- Normalisation : Il s’agit de suivre et d’anticiper les changements des normes et formats, de participer aux instances nationales et internationales, et de diffuser les informations au réseau. Si j’ai bien compris, cette mission a été entièrement transférée de la MISTRD à l’ABES, qui a engagé Philippe Le Pape pour la mener à bien.
- Pilotage des rétroconversions : l’ABES fera réaliser une enquête par un prestataire, prélude à une refonte du dispositif de soutien financier aux établissements. Cette mission a été entièrement transférée.
- Réseaux et projets collaboratifs :
- modernisation du PEB
- refonte des relations avec les centres du SUDOC-PS sur la base d’une contractualisation
- projet d’ERMS Couperin.
Il est sans doute trop tôt pour faire un bilan définitif de ces transferts, mais L’ABES estime que qu’ils se sont fait de manière satisfaisante (affectation de crédits et de personnel). Néanmoins cela vient s’ajouter à la longue liste des projets déjà en cours, ce qui explique que l’agence ne puisse plus consacrer autant de temps qu’il y a 4 ou 5 ans à l’assistance au réseau, notamment en matière de catalogage…
A mon sens, il y avait une réelle logique à confier certaines de ces tâches à l’ABES, compte tenu des compétences et de l’expérience accumulées à Montpellier, et des applications déjà gérées par l’agence. Le cas le plus flagrant est sans doute celui du signalement des thèses en cours. Il a toujours été imparfait et incomplet (les thèses de sciences n’étaient pas concernées), et reposait sur le Fichier central des thèses, application obsolète et peu ergonomique, gérée par Paris 10 qui souhaitait s’en débarrasser. L’ABES a profité de ce transfert pour élargir le périmètre du futur portail des thèses, auquel le contenu du FCT sera agrégé. Au final, la qualité du service rendu devrait en être nettement améliorée.
Concernant la mission Normalisation, je me demande s’il ne serait pas possible de clarifier les missions respectives de l’ABES et de la BNF, ou de faire un site commun pour ce sujet. Prenons par exemple un sujet brûlant, comme le RDA. Vous trouverez des informations au sujet de ce nouveau code de catalogage sur le site de l’ABES, sur le blog rda@abes.fr, ouvert récemment, mais aussi sur le site de la BNF (page à jour du 11/08/2010, autrement dit, à réactualiser rapidement…), et je ne compte pas le site du groupe technique sur l’adoption de RDA, qui tient plus du site institutionnel.
La BSN, nouveau cadre de l’action de la MISTRD
Les acteurs de l’IST et de la documentation sont nombreux, et de statut variés (ABES, CNRS, Adonis, Inist, CCSD, Cléo, Inria, CINES, ADERES, BNUS, Persée, BNF, Couperin…).
Le grand projet du ministère depuis plusieurs années est de créer une « Bibliothèque scientifique numérique » qui permettrait d’encadrer et de donner le plus de cohérence et d’efficacité possible à l’action de ces différents intervenants. Contrairement à ce que laisse entendre son nom, la BSN n’est donc pas une bibliothèque, mais un dispositif de financement et de coopération, qui a le statut carrément pompeux de TGIR (Très grande infrastructure de recherche).
Je m’aperçois que je suis passé insensiblement du conditionnel au présent. Je ne corrigerai pas ce flou, qui me semble consubstantiel à ce projet, initié en 2008, budgétisé depuis 2010 (ou 2009?) , et dont l’organisation semble à peine se dessiner en 2011…
J’ai cru comprendre que des précisions sur sa gouvernance et ses missions devraient être apportées cet été. Peut-être cela a-t-il déjà été fait, mais dans ce cas l’information m’aura échappé.
L’expression « BSN » est issue du rapport France Numérique 2012, dit Rapport Besson, d’octobre 2008 (p. 55). Mais dans ce rapport, la BSN était exclusivement conçue comme une offre de formation en ligne :
Action n°97 : Construire une bibliothèque scientifique numérique accessible à tous les usagers de l’enseignement supérieur et de la recherche.
Peu de données statistiques sont disponibles sur la formation et l’orientation à distance. Les données comparatives d’Eurostat, placent la France au 4e rang avec près de 30 % de personnes déclarant s’être formées sur ordinateur. Modalité devenue majeure de la formation tout au long de la vie, la formation à distance délivrée, au moinspartiellement, en ligne est un enjeu fort des années à venir tant pour les organismes spécialisés du domaine quepour les établissements d’enseignement supérieur impliqués depuis longtemps dans ce secteur. Afin d’augmenter la proportion des personnes formées à distance il convient d’adapter et de diversifier l’offre de formation en ligne.
Les contours actuels de la BSN, et son statut de TGIR, ont en réalité été définis dans la « feuille de route » française pour des grandes infrastructures de recherche européennes, rendue publique par V. Pécresse en décembre 2008 (p. 61) :
Nature de la TGI
BSN est une plateforme de coopération pour l’accès à la littérature scientifique numérique.
Description et objectifs scientifiques
BSN est un dispositif de financement et de coopération destiné à accompagner le développement et l’usage de la littérature scientifique numérique. Il regroupe de nombreux instruments répondant à des besoins bien identifiés d’accès direct aux ouvrages scientifiques et aux revues en y associant des outils d’intégration de sources documentaires. Forme renouvelée d’une partie du secteur communément appelé « information scientifique et technique » mais prenant en compte l’évolution des pratiques des chercheurs, elle facilite la mise en relation et la navigation entre les documents édités (revue numérisée ou numérique, de façon rétrospective ou actualisée) ou destinés à circuler dans les communautés scientifiques (archives ouvertes). BSN assure des missions de communication, de diffusion et de préservation de ces documents scientifiques. Il intervient :
• En appui des partenaires pour aider à la numérisation et promouvoir des normes internationales pour une inter-opérationnalité accrue.
• Pour soutenir la mise en relation des projets français avec les projets internationaux.
• Pour assurer l’archivage pérenne de l’ensemble des documents.
La gouvernance et l’organisation de BSN sont actuellement en cours de définition. Leurs contours dépendent étroitement des orientations prises pour le domaine de l’information scientifique et technique et retenues par le rapport Salençon.
Situation dans le monde
BSN accompagne la mise en visibilité de la littérature scientifique française, facilite leur intégration dans les dispositifs européens ou internationaux (initiative européenne sur le libre accès, août 2008) et améliore l’accès à la littérature scientifique internationale.
Communauté scientifique concernée
L’ensemble des disciplines est concerné par le projet. Le degré d’avancement varie nettement d’un champ à un autre, la communauté française des mathématiciens figurant comme les pionniers en la matière. Les SHS se caractérisent par des besoins importants et diversifiés suscitant de nombreuses initiatives en partie coordonnées devant associer plus étroitement l’ensemble des producteurs de recherche (établissement de recherche, écoles, université).
BSN se développera en prenant en compte les projets initiés par les acteurs publics tels le ministère de la culture et de la communication, la Bibliothèque Nationale de France, les éditeurs universitaires et les acteurs privés tels les éditeurs scientifiques et les intégrateurs.
Budget
Coûts de fonctionnement (valeur 2009) : 3 M€
En farfouillant dans les documents budgétaires, j’ai trouvé des traces de la BSN dans les PAP 2010 et 2011 de la mission « Recherche et enseignement supérieur ».
Dans le PAP 2010, on peut lire ceci p. 94 :
Dotation pour la montée en charge de la bibliothèque scientifique numérique -BSN- : 8,6 M€.
Le projet BSN a pour objectif majeur de permettre à l’ensemble des acteurs de l’enseignement supérieur et de la recherche d’accéder, sous forme numérique, à une offre de ressources scientifiques éditées abondante, de qualité et répondant aux standards internationaux. Cette offre doit constituer un indispensable instrument de travail pour tous les chercheurs et les étudiants du territoire. A ce titre, la BSN intervient sur les axes suivants : acquisition de ressources, numérisation du patrimoine scientifique (notamment le programme Persée), archives ouvertes (notamment HAL), circulation et valorisation de la production scientifique, préservation des données numériques à long terme (avec le CINES).
- PERSEE (portail d’accès à de grandes revues scientifiques numérisées en sciences humaines et sociales) : 0,6 M€,
- Groupements d’achat de ressources électroniques (hors ABES) : 0,4 M€,
- Outils collectifs (ABES, CINES pour l’archivage pérenne) : 3,6 M€
- Licences nationales, il s’agit là d’une enveloppe de départ destinée à améliorer les modalités d’accès aux ressources scientifiques numériques : 4 M€
Soit 4+3,6+0,4+0,6 = 8,6 millions d’euros. Plus que les 3 millions annoncés dans la feuille de route, mais j’y reviendrai.
Le projet se présente de manière proche en 2011 (p. 100) :
- montée en charge de la bibliothèque scientifique numérique (BSN) (6,4 M€)
Le projet BSN a pour objectif majeur de permettre à l’ensemble des acteurs de l’enseignement supérieur et de la recherche d’accéder, sous forme numérique, à une offre de ressources scientifiques éditées abondante, de qualité et répondant aux standards internationaux. Cette offre doit constituer un indispensable instrument de travail pour tous les chercheurs et les étudiants du territoire. A ce titre, la BSN intervient sur les axes suivants : acquisition de ressources, numérisation du patrimoine scientifique (notamment le programme Persée), archives ouvertes (notamment HAL), circulation et valorisation de la production scientifique, préservation des données numériques à long terme (avec le CINES). Un comité de pilotage a été mis en place en 2010, dans lequel sont représentées les universités, les organismes de recherche, ainsi que le ministère de la culture et de la communication. Il est épaulé par un comité technique ad hoc.
Sont concernés pour cette action le catalogage, dont l’opérateur national est l’ABES pour 2,6 M€ ; les groupements de commande portés par l’ABES pour 1,6 M€ ; les licences nationales pour 1,7 M€ (crédits destinés à améliorer les modalités d’accès aux ressources scientifiques numériques) ; PERSEE (portail d’accès à de grandes revues scientifiques numérisées en sciences humaines et sociales) pour 0,5 M€.
Soit 2,6+1,6+1,7+0,5 = 6,4 millions d’euros. Je pense que la somme est inférieure en 2011 en raison de la sortie du CINES de ce dispositif. Mais je m’étonne aussi d’avoir vu fondre la ligne « licences nationales » d’une année sur l’autre.
En tout cas, il ne faudrait surtout pas croire que l’Etat a sorti de sa poche en 2010 8,6 millions € pour ce « nouveau » dispositif. En fait, il a regroupé sous la même étiquette « BSN » des financements qui étaient auparavant présentés différemment, et a ajouté quelques millions.
Ainsi, en cherchant dans le PAP 2009 des actions équivalentes, (p. 88), on trouve le financement de l’ABES et du CINES (3,1 M€), qui faisait partie de l’ensemble « Dotations aux établissements et services de coopération », ainsi que les subventions à PERSEE (0,5 M€) et pour les groupements d’achat de ressources électroniques non pris en charge par l’ABES (0,4 M€), qui appartenaient à l’ensemble « Dotations au titre d’actions spécifiques », soit un total de 4 millions.
J’espère qu’il n’y a pas un chiffre qui m’échappe, mais si on compare le PAP 2009 et 2010, on constate donc une augmentation de 4,6 millions d’euros, essentiellement (4 M€) destinée à financer les « licences nationales ». Je ne sais pas trop à quoi cela correspond dans le détail. Si quelqu’un peut m’éclairer…
L’ABES et la BSN
Bref, concrètement, la BSN se compose de huit « segments », autrement dit huit groupes de travail, tous copilotés par deux organismes. L’ABES participe au pilotage des segments 1, 3, 8, avec avec le CNRS et Couperin.
- Acquisition des revues (courant) et des archives : Grégory Colcanap (Couperin), Raymond Bérard (ABES).
- Dispositif d’accès et d’hébergement : Serge Bauin (CNRS), Richard Walter (CNRS-Adonis).
- Dispositifs de signalement : Raymond Bérard (ABES), Serge Bauin (CNRS).
- Archives ouvertes : Daniel Charnay (CNRS-CCSD), Jacques Millet (Inria).
- Numérisation : Gilbert Puech (Persee), Frédéric Blin (BNUS).
- Archivage pérenne : Olivier Rouchon (CINES), Aline Girard (BnF).
- Editions numériques : Marin Dacos (CNRS-Cléo), Jean-Michel Henny (Association des éditeurs de la recherche et de l’enseignement supérieur).
- Fourniture de documents, prêt : Serge Bauin (DIST-CNRS), Raymond Bérard (ABES).
Le segment 8 a repris l’activité du groupe de travail sur la modernisation du PEB qui préexistait, mais en recadrant sa réflexion. Sa 1re réunion s’est tenue le 9 juin 2011. Comme l’explique le site de l’ABES, un des objectifs est désormais de »trouver une convergence entre les opérateurs de fourniture de documents, en tout premier lieu l’ABES et l’INIST-CNRS » en établissant un « guichet unique s’appuyant sur les points forts de SUPEB et de RefDoc ». Une étude est en cours, dont les résultats en seront communiqués lors de la 2ème réunion de la BSN 8 courant octobre 2011.
Conclusion
Conclusion, pas de conclusion. Ou plutôt, pas de certitudes. Il faudra suivre de près toutes ces évolutions dans les mois et années à venir pour voir si la BSN deviendra effectivement un cadre d’action efficace ou un nouveau « machin »
Voici quelques notes prises lors des Journées ABES et retravaillées à grands coups de copier/coller à partir des informations présentes sur le site de l’ABES, et notamment des présentations faites lors des Journées. Je ne prétends pas faire preuve d’une quelconque originalité : il s’agit juste de mettre à disposition de tous des éléments du compte-rendu que j’ai faites en interne à mes collègues. Je précise que comme certains sujets abordés lors des journées dépassent de loin mes compétences, et que je n’ai pas pu assister à tous les ateliers, il est plus que probable que de gros ou de petits contre-sens se glissent dans mes propos. N’hésitez pas à me les signaler si vous le souhaitez…
Je commence par un billet consacré au projet d’établissement de l’ABES. D’autres suivront dans quelques jours.
Du projet 2008-2011 au projet 2012-2015
Pour l’élaboration du prochain projet d’établissement, l’ABES a décidé d’impliquer un grand nombre de partenaires. Le processus est donc relativement long : les premières réflexions ont commencé en octobre 2010, et le projet devrait être validé en novembre 2011.
L’ABES a impliqué dans ce projet son Conseil Scientifique, qui a été créé à cette occasion. D’autre part, elle a pris l’avis des BUs, en organisant le 16 mai une après-midi de débats et d’échanges avec 60 membres du réseau concernant 3 thématiques : ressources électroniques, SIGB mutualisé (atelier dont Lully a rendu compte dans ce billet, patrimoine. Enfin, elle procède actuellement à une enquête sur les attentes du réseau et de quelques partenaires, qui sera complétée par des entretiens en focus groupes. La synthèse sera publiée début septembre.
Le projet d’établissement actuel (le 1er dont l’ABES se soit jamais doté) couvre la période 2008-2011. Il consiste en 96 actions réparties en 6 objectifs :
- Offrir des catalogues de qualité, ergonomiques et évolutifs
- Développer le réseau et l’associer à la définition de la politique et des objectifs de l’ABES
- Faciliter l’accès aux ressources documentaires des universités
- Mettre à la disposition des établissements des outils et services garants d’un fonctionnement optimal
- Améliorer la gestion de l’ABES
- Mieux insérer l’ABES dans son environnement universitaire et de recherche
Les objectifs prévus pour le prochain projet me semblent approfondir des éléments du projet 2008-2011, mais certains points (2,4,5) sont inédits :
- Faire évoluer les catalogues et applications. (prolonge le point 1 du précédent projet, en l’élargissant aux « applications », et en insistant sur leur évolution effective)
- L’ABES « hub » des métadonnées de la recherche française. (« hub »? Je trouve ça très vilain, mais l’ABES n’a pas cherché d’équivalent français… « porte d’entrée ? »)
- Signaler les ressources des universités et établissements : ressources électroniques ; patrimoine. (prolonge le point 3 du précédent projet)
- Développer l’achat de ressources électroniques.
- Proposer aux établissements un SIGB mutualisé.
- Développer les partenariats nationaux et internationaux. (prolonge le point 6 du précédent projet, en insistant sur la dimension internationale)
- Mettre la gouvernance et le pilotage en cohérence avec le développement des missions de l’ABES. (prolonge le point 5 du précédent projet)
Les pistes du « rapport TICER »
Ces pistes sont en partie issues d’une étude que l’ABES fait réaliser par Hans Geleijnse, consultant de TICER (Tilburg Innovation Centre for Electronic Resources, Université de Tilburg). L’étude, commandée en novembre 2010, a été divulguée en mars 2011. Elle est disponible sur le site de l’ABES, uniquement en anglais (Environmental Scan : as an input for the development of a strategic plan of L’Agence Bibliographique de l’Enseignement Superieur (ABES) for the period 2012-2015)
L’enquête porte sur environnement international de l’ABES (actions et visions de l’avenir des homologues de l’ABES) et sur cinq questions spécifiques posées par l’ABES. Il faut relever que la mission du rapporteur était centrée sur l’ABES et ses homologues, sans évaluer systématiquement la place des autres acteurs français de l’IST (Information scientifique et technique), notamment de l’INIST et du CNRS, ce qui l’aurait peut-être conduit à nuancer ses conclusions.
Comment les homologues de l’ABES envisagent-il l’avenir ?
Les principales tendances internationale de l’IST dégagées par le rapport sont : d’avantage de mobilité et de flexibilité, l’importance croissante des applications mobiles, des réseaux sociaux et du « cloud computing » (ou « informatique en nuage », dixit Legifrance), les menaces sur la protection des données personnelles, et les contraintes budgétaires croissantes.
D’après le rapport, les équivalents étrangers de l’ABES ont des missions plus larges (ex : catalogue commun BU/BM, fourniture de documents électroniques, fourniture de SIGB aux établissements…) mais un ressort territorial plus étroit (petits pays, régions). La position de l’ABES est donc atypique.
Toutes ces institutions sont en train de se recentrer vers la gestion et la fourniture de documents électroniques, et anticipent une marginalisation rapide de la documentation imprimée dans les 5 à 10 ans. Dans ce cadre, elles cherchent à réaliser des économies d’échelle, à développer la fourniture de « discovery services » (en bon français, « services de découverte », ou « solutions de découverte ») aux bibliothèques, à favoriser les solutions libres, à profiter des opportunités offertes par l’informatique en nuage, et à faire le meilleur usage des technologies du Web 2.0 et des technologies modernes en général.
Dans un contexte de détérioration attendue des capacités financières des universités et de pression forte de la part des pouvoirs publics pour plus d’efficacité et d’efficience, les homologues de l’ABES estiment qu’ils ne pourront survivre qu’en proposant une réelle « valeur ajoutée » aux bibliothèques, et en leur faisant faire des économies grâce à une centralisation accrue : éviter à tout prix de faire plusieurs fois le même travail (saisie unique ou récupération des métadonnées, etc.), assumer une position de force dans les négociations commerciales avec les fournisseurs de services ou les éditeurs, tenir un rôle central dans les débats nationaux et internationaux, promouvoir de nouvelles idées ou de nouveaux services en capitalisant sur les initiatives des membres de leur réseau.
Pour chaque service, l’enjeu central sera la détermination de l’échelle la plus pertinente en terme de coût et d’efficacité : local, régional, national, international ? Par exemple, certains pays pourraient abandonner la gestion de catalogues nationaux au profit de Worldcat. Le rapport insiste également à de nombreuses reprises sur les changements apportés par le développement de l’informatique en nuage. Pour l’usager, peu importera le lieu de stockage de l’information et des outils.
L’auteur a fait à l’ABES cinq recommandations
On en retrouvera certaines dans les pistes pour le projet d’établissement 2012/2015 évoqué plus haut.
- Devenir le « hub français des métadonnées » (documents imprimés et électroniques) en collaboration avec d’autres instutions françaises et avec des entreprises. Cela pose la question des rapports avec la BNF et avec l’INIST…
- Harmoniser les initiatives françaises pour la gestion des métadonnées (acquisition, moissonnage, qualité) et des autorités, notamment dans le cadre d’IdRef et du VIAF. Là encore, pas sûr que la BNF, qui participe déjà au VIAF, accepte de se faire « harmoniser » sans rien dire…
- Proposer des services et des outils aux bibliothèques pour leurs activités internes et leurs services aux lecteurs (Acquisition, catalogage, prêt, recherche documentaire, PEB, outils de découverte), en s’appuyant notamment sur l’informatique en nuage.
- Éviter de développer des outils « maison », en tout cas pour le PEB et les services de découverte : ce serait une perte de temps et d’énergie. Il vaut mieux faire appel aux solutions sur le marché.
- Proposer davantage de services pour la recherche : développer un CRIS (Current Research Information System) : dispositif national d’information sur la recherche en cours, qui permettrait de mettre en valeur la recherche française (avec des liens possibles vers les archives en ligne.)
Les réponses aux interrogations de l’ABES
- Quel est l’avenir de CBS ?
Le logiciel au cœur du SUDOC, CBS, sera maintenu et mis à jour par OCLC au moins pour 5 ans. CBS pourra être adapté à RDA, car il permet déjà de lier les données entre elles. CBS peut également servir de base à un catalogue « 2.0 » (couvertures, commentaires de lecteurs, tags, étoiles, conseils personnalisés, ajouts de métadonnées par l’usager…), comme l’illustre le projet suisse Swissbib.
De son côté, WinIBW devrait être remplacé par une application web, probablement en 2012.
- Faut-il repenser les relations avec OCLC ?
L’accord 1992-2011 arrive à échéance. Certains points pourraient être renégociés : CBS (l’application au coeur du Sudoc) est moins utile qu’il y a 20 ans, car l’essentiel de la documentation est dématerialisée, et CBS ne gère pas de manière optimale les ressources électroniques. On pourrait donc envisager de renégocier le prix de CBS, ou demander un accès à d’autres services.
La « dépendance » envers les fournisseurs comme OCLC est aujourd’hui une réalité inévitable, qui ne doit pas susciter trop d’inquiétudes. Il faut plutôt se préoccuper de la pertinence, de l’efficacité et de la fiabilité des services offerts. Sur ces points, la position d’OCLC est plutôt rassurante (compétences, taille, nombre de partenaires, statut non lucratif), notamment par rapport à Ex Libris.
Par contre, la nationalité américaine d’OCLC peut poser problème : tous les homologues européens de l’ABES insistent sur la nécessaire maîtrise des données. Les métadonnées issues de la recherche française ont à la fois une dimension stratégique et patrimoniale. Il faut veiller à ce qu’elles ne soient pas stockées exclusivement des USA, et donc soumise à la législation américaine.
- Les ressources électroniques doivent-elles être intégrées au SUDOC, ou dans un nouveau catalogue spécifique, encore à imaginer ?
J’ai été quelque peu surpris par cette question : cela fait des années et des années que le signalement des ressources électroniques est pour l’ABES et pour les membres du réseau la priorité des priorités, l’urgence absolue, etc etc. La question de l’outil adéquat pour ce signalement est évidemment fondamentale, mais j’avoue que j’espérais que les experts de l’ABES avaient déjà des idées claires sur les choix à faire dans ce domaine. J’espère pouvoir y revenir dans un prochain billet, mais honnêtement, je n’ai pas moi même d’idées bien claires sur la question…
Le rapporteur ne répond pas par oui ou non, mais en insistant sur l’attitude des homologues de l’ABES, qui misent pour la plupart sur les « services de découverte ». Ces outils sont le dernier avatar de la recherche fédérée, mais contrairement aux portails développés au début des années 2000, ils utilisent les technologies modernes (traduire : du web sémantique), et cherchent à proposer une expérience de recherche conviviale et familière aux usagers (traduire : sur le modèle de Google). Ils fournissent un point d’entrée unique pour interroger simultanément plusieurs types de ressources globales (catalogues, bases de données, archives ouvertes, sites de fournisseurs d’ebooks ou de journaux en ligne…) et locales (données propres à chaque bibliothèque). Selon le rapport, les deux solutions commerciales les plus abouties sont Primo d’Ex Libris et Worldcat Local d’OCLC, mais Serial Solutions et EBSCO proposent aussi la leur.
Dans ce cadre, si j’ai bien compris, l’auteur estime qu’il serait envisageable de concevoir une base de connaissance signalant les ressources électroniques françaises, qui pourrait être gérée hors du SUDOC, mais consultée par le biais de ces services de découverte, simultanément avec d’autres ressources.
- L’ABES peut-elle jouer un rôle de soutien ou de gestion d’outils pour les bibliothèques (SIGB ou outils appelés à les remplacer) ?
Plusieurs de ses homologues le font. Si un nombre suffisant d’universités manifestent un intérêt réel pour ce projet, et s’il est une source d’économie, l’ABES pourrait fournir ce genre de service, peut-être en en se basant sur des solutions commerciales exploitant les possibilités de l’informatique en nuage.
- Faut-il repenser les relations avec le réseau ?
Une bonne communication entre l’ABES et le réseau est essentielle. De graves problèmes ont affecté le réseau américain OhioLink suite à des divergences entre l’opérateur et les membres du réseau. Pour un certain nombre de questions clés, l’ABES ne pourra agir que si le réseau s’engage clairement et fortement dans la même direction.
Il faudrait renforcer la présence des établissements dans le CA de l’ABES, et formaliser le rôle de conseil des établissements au sein d’un autre conseil, qui se chargerait d’examiner les questions stratégiques. Cela pourrait impliquer un renforcement du rôle de l’AURA.
Posté le 2 juin 2011 par vingtseptpointsept| Catégories: concours | - (Les commentaires sont clos) [Le fichier cité dans cet article étant désormais inutile, il a été supprimé début juillet]
Enfin! Après deux semaines de rumeurs, de bruits de couloirs et de supputations hasardeuses, les postes ouverts aux lauréats du concours de bibliothécaire d’Etat sont enfin publiés sur Poppee. Les 30 candidats admis sur liste principale (en interne et en externe) ont 20 jours pour faire leur marché parmi les 32 postes proposés, dont 7 postes attribués à la mairie de Paris et réservés aux seuls externes. Bizarrement, on ne compte aucun poste à la BNF ni à la BPI.
Malheureusement, Poppee est une application obsolète et peu pratique (impossible de faire un lien direct sur la page des résultats), et surtout les données fournies sont très limitées : nom de l’établissement, nombre de poste, numéro de téléphone.
Pas d’adresse de courriel, pas de nom de responsable, pas de site, et surtout pas de fiches de poste (tiens, j’ai envie d’accorder « poste », mais non, j’imagine que l’Académie ne serait pas d’accord…).
J’ai donc repris hier les données de Poppée dans un tableau Google afin de pouvoir les compléter. Et je suis heureux de constater que de nombreux collègues contactés par Twitter ou par mail s’en sont emparés pour faire des ajouts.
Si cela vous intéresse, vous pouvez consulter ce document, ou le modifier librement en cliquant sur ce lien.
En complément des informations issues de Poppée ou des sites des différentes BU, vous pouvez ajouter un descriptif des postes, ou un lien vers les fiches de poste si elles existent, mais comme ces informations ne sont – sauf exception – pas publiques, merci de ne le faire que pour les établissement qui vous auront donné leur accord.
Si vous voulez me contacter pour savoir quels postes m’intéressent ou pour tout autre raison, mon courriel personnel est indiqué dans mon CV.
Enfin, pour finir, un peu de détente : Pur ti miro. Je sais, ce n’est pas très rock, mais j’adore…
Bon choix à tous
Posté le 27 mai 2011 par vingtseptpointsept| Mots-clefs: ABES | Catégories: bibliothèques universitaires | - (Les commentaires sont clos) Depuis leur clôture le 18 mai, les « journées ABES » ont eu quelques échos sur Twitter, et sûrement devant les machines à café de nos BU respectives. Mais pour l’instant, sauf erreur, seuls deux biblioblogs les ont évoquées, ici et là. Sans prétendre à une quelconque expertise sur les chantiers évoqués par l’ABES, je vous livre en vrac quelques impressions qui rejoignent globalement celles de Lully. Si j’ai le temps, je reviendrai ultérieurement sur le contenu des projets (vous pouvez consulter les présentations des intervenants sur le site de l’ABES), mais j’aimerais insister ici sur le double aspect journées de l’ABES / Journées du réseau, qu’à évoqué Lully.
 Montpellier capitale des BU pour deux jours
En tant que correspondant catalogage, ces 1 (TGV) +2+1 (TGV) jours à Montpellier m’ont été très précieux. Car parmi les 450 personnes réunies au Corum ne figuraient pas que le gratin de la bibliotwittosphère, mais aussi tous ces collègues qui travaillent dans l’ombre pour maintenir nos SIGB, gérer nos ressources électroniques, ou veiller à la cohérence et à la qualité de nos données. Si vous ne faites pas partie de leurs collègues de bureau, et que vous n’êtes pas « sur les listes », vous avez toutes les chances de ne jamais avoir entendu parler d’eux. Et pourtant, sans leur dynamisme et leur professionnalisme, l’ABES aurait bien du mal à concrétiser ses projets.
Ayant encore assez peu d’expérience en BU (4 ans), beaucoup de collègues d’autres universités n’étaient pour moi que des noms, ou dans le meilleur des cas des avatars sur Twitter. Sur ce plan, assister aux JABES a été une expérience professionnellement très enrichissante. Les mauvaises langues diront que l’enrichissement a surtout été pour tous les barmen, serveuses, marchands de glaces italiennes (miam…) que nous avons fait travailler sans relâche pendant quelques jours. Ils n’auront pas tout à fait tort… Mais on ne peut pas réduire les JABES à cela. Rencontrer physiquement au moins une fois nos homologues du réseau (et les collègues de l’ABES, bien sûr!) est indispensable pour pouvoir savoir quelles personnes répondront le plus volontiers à nos questions professionnelles, ou seront enthousiastes pour s’impliquer dans des projets communs.
Ces collègues sont dans une position parfois ambiguë, qui peut devenir être inconfortable : à la fois bras armé de l’ABES, dont ils mettent en oeuvre les consignes, ou subissent les choix, et acteurs autonomes qui peuvent proposer des améliorations aux outils de l’ABES (Sudoc + par exemple), exprimer des désaccords ou des doutes sur certaines options de l’agence, essayer de faire valoir leur vues, ou concevoir ensemble des projets plus ou moins indépendants des choix de l’ABES.
Dans le monde merveilleux des bibliothèques, il n’y a pas que des rapports techniques et des groupes pilotages officiels. La communauté des BU a son existence propre, avec ses dynamiques, ses tensions et ses enjeux. En coulisse, les rapports de force, les affinités personnelles, les alliances plus ou moins implicites pèsent d’un poids non négligeable, bien que très difficilement saisissables par un modeste correspondant catalogage.
Point positif, l’ABES n’est pas du tout fermée au dialogue avec les établissements du réseau. Depuis toujours, ils ont été associés à l’élaboration de certaines procédures ou décisions. Mais il est intéressant d’observer l’évolution des modalités techniques de cette collaboration, et du niveau auquel elle s’exerce (L’AURA, les directions des établissements, les professionnels directement impliqués dans le travail?). Par exemple, sans avoir assez d’expérience pour en juger avec sûreté, il me semble que l’AURA (association des utilisateurs des réseaux de l’ABES) est aujourd’hui plus associé aux choix de l’ABES qu’elle ne l’était il y a quelques années. Pour les questions catalographiques, l’AURA doit ainsi depuis janvier 2011 donner son accord pour que les décisions des groupes de travail communs à l’ABES et au réseau soient validées. Le but est d’éviter que les décisions des groupes de travail ne soient contestées par les membres du réseau qui n’y auraient pas pris part, mais aux yeux de certains collègues, la conséquence semble être une plus grande lourdeur, voir lenteur, pour la validation de certaines propositions.
De manière plus visible, l’ABES a officiellement pris en compte le réseau en l’intégrant à la conception de son nouveau projet d’établissement. C’est dans ce cadre que trois ateliers thématiques ont été organisés par l’ABES avant les journées elles-mêmes, pour que les personnes intéressées donnent leur avis sur ses projets en matière de SIGB partagé, de ressources électroniques, et de valorisation du patrimoine. Les 60 places ont été attribuées en quelques heures, ce qui est un signe de l’implication et de l’intérêt de nos collègues pour ces questions.
On pourrait multiplier les éléments témoignant de cette politique d’ouverture, mais il faut aussi en constater les limites. Dans le déroulement même des journées, les projets des établissements ne sont abordés que dans des ateliers. D’autre part le programme très dense des journées et les quelques menus retards inévitables dans de telles rencontres ont rendu le plus souvent très brefs voire inexistants les échanges entre les orateurs et la salle. C’est subjectif, mais j’avais moins ressenti cette urgence lors des journées de 2009 (lors desquelles je me souviens avoir eu le temps de préparer et de poser quelques questions). Y-a-t-il des solutions ? Sans doute pas sur le fond, car l’agenda de l’ABES est incroyablement chargé, et faire tenir en 2 jours la présentation de tous les chantiers en cours est déjà une gageure. Peut-être certaines interventions redondantes pourraient elles être écourtées pour laisser plus de « respiration » ?
Mais la solution n’est peut-être pas à rechercher dans une refonte des journées. Peut-être la création d’outils de collaboration entre les membres du réseau (wikis? blogs? listes?) pourrait-elle faire émerger en son sein de véritables débats, stratégiques et techniques, qui ne pourraient qu’enrichir notre travail avec l’ABES.
Qu’en pensez-vous?
Posté le 13 mai 2011 par vingtseptpointsept| Mots-clefs: concours | Catégories: concours | - (Les commentaires sont clos) Après une journée à trépigner, je me suis résolu a admettre que – Rogntudju ! – les résultats du concours de Bibliothécaire externe ne tomberont pas ce soir. Etonnant, car les résultats de l’interne ont été donnés à midi (félicitations à tous!).
Alors, en attendant, voici un petit compte rendu de mes épreuves à l’oral.
Culture générale
Au jury : 3 personnes, dont J-C. Utard, le directeur des bibliothèques de la ville de Paris. J’ai oublié le nom des autres.
Le texte était cet article de La Croix du 16/2/2011, consacré à la loi « Prisunic ». Je dois avouer que j’ai respiré… Si j’avais eu un article sur la pratique de la danse contemporaine dans le Bas Berry, je ne sais pas trop ce que j’aurais eu à dire.
J’ai fait un plan en deux parties. En gros :
1. Le modèle du législateur : le livre papier (réduction de TVA, adaptation de la loi Lang au livre électronique, modèle du téléchargement à l’unité…)
2. Pourquoi ça coince (la loi sera soit inefficace soit injuste, de toute façon critiquable par l’Europe…)
En conclusion : Le législateur aurait pu en profiter pour se pencher sur d’autres aspects (relations auteurs/éditeurs), et envisager des modèles économiques plus innovants.
Parmi les questions du jury dont je me souviens encore 4 jours plus tard :
- Quels sont les supports de lecture des livres électroniques? Avez-vous déjà testé ?
- Citez des expériences de prêt d’e-books en BU et BM.
- Vous avez parlé du livre homothétique. Que pensez-vous du livre transmédia (je ne connaissais pas l’expression, du coup j’ai fait dériver sur le livre multimédia et enrichi en général) ?
- Le livre papier va-t-il disparaître?
- Quelle est la part de marché des e-books en France ? et aux USA ?
- Quelles sont les revendications des auteurs face aux éditeurs dans le cadre du passage au numérique ?
- Quels éléments du contrat de droit d’auteur sont inadaptés au numérique et devront être revus?
- Citez des exemples d’auteurs auto-édités sur internet avant de l’être en papier? (JC Utard pensait aux blogs de BD, notamment à Pénélope B.)
Texte sur une situation professionnelle et motivation
Au jury, 3 personne dont j’ai oublié le nom.
Le texte était un article d’une revue de management, consacré au « management interculturel ».
J’ai fait un plan en deux parties, en critiquant pas mal le texte, que je trouvais insipide et un peu caricatural (du genre : les Français sont bordéliques, les Américains bosseurs, etc…) :
1. La réalité des différences de culture : incontestable, mais il faut éviter les stéréotypes, penser aux identités multiples, croisées…
2. Comment gérer ces différences dans le cadre d’une organisation : comme une réalité à « accepter » par le manager (un peu l’idée du texte) ou comme un atout (développer l’innovation en s’appuyant sur la pluralité des regards…)
Parmi les questions du jury dont je me souviens encore :
- Est-ce que les idées portées par ce texte pourraient s’appliquer au travail en bibliothèque?
- Et à notre rapport avec les usagers d’une bibliothèque? (Là j’ai essayé de recaser mon voyage d’étude au Danemark et en Suède
)
- Y-a-t-il une culture d’entreprise en bibliothèque ?
2e partie de l’entretien : « motivation », qui s’est bizarrement et subrepticement transformé en oral de catalogage!
- Parlez-vous un peu de vous.
- Pourquoi voulez-vous devenir bib?
- Puisque vous êtes catalogueur, si demain vous étiez responsable du catalogage, que feriez-vous?
- Comment feriez-vous pour valoriser une offre d’ebooks ? (décidément, c’est une obsession !!)
Pas de question sur mes hobbies, le prénom de ma grand-mère, les autres concours que j’aurais pu passer, mon expérience de l’enseignement (que j’ai évoquée), la différence entre un poste technique et un poste de responsabilité, etc.
A mon avis, j’ai un peu raté cette épreuve, car mes réponses ont été trop « techniques », et pas assez « managériales ». Mais j’avais une meilleure impression en sortant de la salle…
Oral d’anglais
Deux personne au jury : un conservateur et une agrégée d’anglais.
Le texte était cet article du Guardian, consacré au Robin des bois de Ridley Scott, et plus généralement aux libertés que peut ou doit prendre l’artiste par rapport aux réalités historiques.
Ils m’ont fait lire environ 3 paragraphes, avant de me demander de traduire le passage surligné sur ma copie, que je recopie ici (en italique, les points qu’ils m’ont fait reprendre, et en gras ceux sur lesquels j’ai coincé même à la reprise)
If you do not find history interesting, it does not matter – the historical fantasy does not have to mean anything or depict anything true about the past. But if you do think historical fiction should deliver some kind of historical meat, it does not have to be served up sedately.
I was surprised that critics were so hard on the supposed inaccuracy of Ridley Scott’s Robin Hood. It plays around with the legend of the green man of the forest – which never was a true story – and garbles the story of King John and Magna Carta: but so what? Ridley Scott loves the colours and textures of other times and places. In all his history epics he goes out of his way to recreate not so much the narrative details as the look and heft of history: the design of a medieval siege engine, the rituals of a particular moment. In Robin Hood, there is a shot of London that features a loving reconstruction of the old gothic St Paul’s – burnt in the great fire of London – at the heart of what by present-day standards is just a town surrounded by forest. Whatever its faults, it makes you realise that medieval England was a far greener country, with far fewer people, living in a world still dominated by natural cycles and seasons.
Ensuite la discussion a porté sur le texte, puis sur la fiction historique en général, et sur l’histoire comme science.
That’s all folks!
|
|
|
Commentaires récents