Nom de code : Bu-Google (1/5)

closeUne année au moins est passée depuis la publication de ce billet qui peut donc contenir des informations un peu datées.

(Merci de votre indulgence :
je vais parler d’un prototype qui n’est pas encore en production)

Comme vous le savez, les moissonneurs de Google ne voient pas l’intérieur de nos catalogues. On s’est donc dit qu’il fallait les aider. Une image valant mieux qu’un long discours, je vous propose d’aller jeter un oeil à cet endroit, de faire une recherche sur “bibliothèque” par exemple (j’expliquerai pourquoi), puis de revenir ici pour que je vous explique de quoi il retourne, comment ça marche, ce qui ne marche pas encore, ce que l’on veut faire de cela, etc. Allez, j’attends votre retour et, pour les fainéants du clic, je colle ci-dessous une copie de ce que les autres sont en train de voir :

BUA Google

OK, vous avez vu ? Qu’est-ce qui se passe ? Simple :

  • nous exportons nos notices catalogue vers Google ;
  • nous  créons une page customisée d’interrogation et de réponse sur laquelle…
  • … nous ventilons les réponses avec, à gauche, les réponses web standards , à droite, des onglets dont le premier ne renvoie que des réponses de notre catalogue ; et les suivants, des réponses issues de sources choisies par nos soins (ici, le blog de la Bu et le site web de l’Université)

Demain, je commence à vous détailler la manière dont on obtiens ça, les problèmes que ça pose, le pourquoi du comment..

18 thoughts on “Nom de code : Bu-Google (1/5)

  1. J’attends la suite avec impatience !
    Tu penseras bien à expliquer comment tu fais pour que Google affiche les titres des ouvrages comme si c’était les titres des pages web, alors que chaque notice de votre Opac a — comme beaucoup d’autres Opac — le même titre “BU Angers — Affichage détaillé”.

  2. Intéressant. En plus, vous profitez du coup de la correction automatique de Google.

    C’est Darnton qui va être content 😉

    Seulement, faites gaffe à ce que votre catalogue soit impeccable si vous lui donnez plus de visibilité grâce à Google. Nous avons eu un cas intéressant quand nous avons nous aussi googlo-ouvert notre catalogue il y a qq mois.

    Un Monsieur avait soutenu sa thèse sous un pseudonyme (oui, cela m’a surpris mais il semblerait que ce soit légal). Il avait depuis fait une belle carrière à la fois comme professeur et dans une grande organisation syndicale. Mais, pas toujours d’accord avec les orientations de ce syndicat – bien qu’appartenant à son comité directeur – il écrivait parfois des billets dans des journaux (pas tjs gentils) avec le pseudo utilisé pour sa thèse.

    Malheur n°1 : son directeur avait mis un post-it avec son véritable nom sur ladite thèse. Malheur n°2 : le bibliothécaire de l’époque, très pro, a reporté l’ensemble des informations, créant le seul lien entre vrai nom et pseudo. Malheur n°3 : tout a donc été balancé sur Google il y a qq mois et ça sort *très* bien.

    Panique du Monsieur, recherche d’une solution, effacement dans le catalogue… et solution définitive tjs pas trouvée car les bots de Google ne semblent pas repasser très souvent…

  3. @RM : à Jussieu, il y avait eu un problème encore plus amusant. Une chercheuse française ayant soutenu sa thèse à Paris VI et partie ensuite aux Etats-Unis s’est indignée de retrouver sa date de naissance (information relevant de sa vie privée !) dans notre catalogue.
    Puisqu’elle n’avait pas d’homonyme, nous l’avons effacée !

    Je n’aime pas trop ta phrase (pardon !) : “faites gaffe à ce que votre catalogue soit impeccable si vous lui donnez plus de visibilité grâce à Google”
    Elle me rappelle les craintes des enseignants-chercheurs quand on leur parle de thèses en ligne, et qu’ils s’épouvantent ainsi : “Mais vous ne vous rendez pas compte ! Tout le monde va voir que nous accordons le titre de docteur à des thèses exécrables !”
    L’argument est détestable. Dans le cas d’un catalogue pourri, ma foi, c’est aussi un argument pour demander plus de moyens 🙂 !

  4. La démarche de dissémination est toujours un plus et mérite d’être louée, mais…quel intérêt à poser son catalogue dans Google à partir du moment où il est possible d’avoir son catalogue en barre de recherche? Je sais que l’argument marche dans les deux sens, mais je me dis que comme personne ne recherche (enfin j’espère !!!) des bouquins de sa BU directement dans Google, ça ne risque pas de donner de très mauvaises habitudes à des usagers qui en sont déjà pétri? :s

  5. Comment tu comptes le proposer aux étudiants ? indiquer l’url dans ta boîte à outils, ok, “remplacer” le Google traditionnel par le Bu-Google sur tes postes publics ?

  6. Super et impressionnant !
    Tout à fait dans l’esprit de ce que j’évoquais dans mon dernier billet (http://bibliothequepublic.blogspot.com/2009/05/twitti-et-grosternet-zai-cru-voir-une.html) il me semble, mais là c’est une réalisation concrète.
    Entièrement d’accord aussi avec l’esprit de ta réponse à Shaunlemouton. Ce qui compte là, c’est qu’il n’y rien à installer, on ne cherche pas à modifier les habitudes des usagers, on leur indique juste une URL et on leur propose toute l’offre Bibliothèque en regard des résultats de recherche Web qu’ils ont d’habitude.
    J’avais tenté -sans succès – un truc du même genre, mais beaucoup plus rudimentaire il y a deux ans : exporter le contenu du catalogue en texte seul sur une page HTML toute simple avec juste une redirection vers le catalogue, en espérant que Google indexerait la page et renverrait les usagers chez nous. Mais mon truc devait être tellement mal fait que même les robots de Google étaient redirigés !

  7. Et bien, ça a l’air de marcher au poil 🙂 merci de m’avoir prévenu! je vais montrer ça à mes camarades nippons (petits patapons) tiens.

  8. Pour revenir à la remarque de jsicot, longtemps après : il y a désormais 3 résultats à la requête Linux sur le catalogue “BU-Google” (bon, il y en a 202 dans l’opac).
    Au passage, je note un truc pénible : l’URL ne change pas avec les mots recherchés, donc on ne peut pas pointer vers une liste de résultats.

    Dommage !

Leave a Reply

Your email address will not be published. Required fields are marked *