Google scholar ratisse (trop) large

Tous les documentalistes et bibliothécaires savent qu’il ne faut utiliser Google scholar qu’avec prudence lorsqu’on recherche des articles scientifiques.

Car, ainsi que l’explique ce wiki réalisé par l’URFIST PACA (mais de nombreux tutoriels donnent les mêmes informations) on peut faire de nombreuses reproches au moteur :

  • Pas de listes des éditeurs commerciaux et des serveurs d’archives qu’il indexe
  • Pas d’informations sur le type de document traité et la période couverte
  • Couverture réelle non précisément connue
  • Opacité de l’algorithme de classement des résultats et de celui du calcul des citations
  • Des résultats moins complets que l’interface d’interrogation des bases natives

Mais je pensais du moins que Google Scholar se contenait d’interroger des sources scientifiquement fiables : sites d’éditeurs, archives institutionnelles, etc.

Quelle n’a pas été ma surprise en constatant que le moteur avait indexé mon mémoire de DUT déposé uniquement sur ma page personnelle!

Sans vouloir jouer les faux modestes, mon mémoire de DUT n’est qu’un mémoire de DUT… Et rien ne garantit sa qualité, ni même son authenticité. Je pourrais très bien ne jamais avoir soutenu ce mémoire (ce qui n’est pas le cas, heureusement pour moi), ou bien l’avoir largement remanié après sa soutenance (d’ailleurs, si je me souviens bien, j’avais corrigé quelques broutilles avant de le mettre en ligne. Ce n’est donc pas une copie exacte au mot près à l’exemplaire de soutenance, déposée à la bibliothèque de l’IUT de Nancy II).

J’imagine que mon cas est loin d’être isolé. J’ignore comment procède Google, mais je suppose qu’il doit rechercher des documents pdf contenant certains mots clés (« mémoire » « soutenu sous la direction de… », « bibliographie »…), ou contenant des références bibliographiques, sans quoi tous les fichiers pdf de la toile seraient indexés. Un algorithme doit également permettre de retrouver mon nom à partir de la page de titre du mémoire, à moins que Google n’utilise pour cela les informations de mon site personnel.

En tout cas, cela m’aura permis de me faire une idée des technologies de pointe utilisées pour alimenter Google Scholar…

Au coeur des serveurs de Google, une technologie de pointe...

Au coeur des serveurs de Google, une technologie de pointe...

4 comments to Google scholar ratisse (trop) large

  • Certes, mais GG Scholar a comme une sérendipité 🙂 C’est rarement pertinent pour moi, mais parfois …

  • C’est vrai, GG Scholar est peu rigoureux dans son choix de sources. Et aussi, vous ne le dîtes pas, dans son moteur même ! Mais il m’arrive d’y faire des découvertes utiles dans le cadre de mon travail.

  • vingtseptpointsept

    Petit auto-commentaire : sur la page de Google Scholar, voici comment le programme est décrit :
    « Google Scholar inclut des articles revus par des comités de lecture, des thèses, des livres, des résumés analytiques et d’autres ouvrages universitaires dans les principaux domaines de recherche. Vous trouverez nombre de travaux émanant d’éditeurs universitaires et de sociétés savantes, ainsi que des articles de recherche disponibles sur le Web. Google Scholar inclut parfois plusieurs versions d’un même article auxquelles vous pouvez accéder, certaines de ces versions pouvant correspondre à des travaux préliminaires. »
    http://scholar.google.fr/intl/fr/scholar/help.html

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

  

  

  

*