Salade de Carrot

closeUne année au moins est passée depuis la publication de ce billet qui peut donc contenir des informations un peu datées.

Tiens, via LibrarianInBlack, je découvre Carrot2, un outil de clustering opensource qui pourrait servir. Pour l’heure, j’ai remarqué qu’il était en mesure d’interroger, outre les grands moteurs du web, Pubmed…
Et il semblerait qu’il puisse attaquer toute source répondant en XML, donc, avec un peu de chance, un SIGB comme ALEPH.

Je vais essayer d’y jeter un oeil.

PS : Carrot2 tourne sous Apache Tomcat, ça s’installe du coup en un tour de souris. Une fois qu’on a un Tomcat qui tourne (et franchement, c’est pas la mort à installer), on télécharge Carrot2 sous la forme d’un zip qui contient en fait un gros fichier *.war qu’il suffit de déployer avec les outils d’admin de Tomcat.

PS2 : l’ajout et la modification de sources pour la recherche fédérée se fait à partir de fichiers en clair, avec un simple éditeur de texte. Par exemple, pour passer de wikipedia en anglais (option par défaut de Carrot2) à la version française, il suffit de remplacer dans le fichier de conf. qui va bien l’url en.wikpedia.org par fr.wikipedia.org et de redémarrer l’application Carrot2 dans Tomcat. Simple, non ?

PS3 : après quelques fouilles et échanges mailiques avec les porteurs du projet, il s’avère que l’interrogation d’ALEPH serait possible en faisant un peu de développement (quelques heures selon mon interlocuteur) en java. Toujours le même écueil : mes propres limites…

0 thoughts on “Salade de Carrot

  1. Salut Daniel!
    Merci pour le tuyau. Je bosse avec des amis sur le montage d’un portail documentaire avec des briques libres. Le choix du moteur de recherche fédérée pose problème et je me suis résolu à en tester plusieurs (LibraryFind, Pazpar2, Nutch…). Je crois que je vais rajouter Carrot2 sur la liste! Pour le développement en Java, je crois que j’ai une piste…
    On te fera signe si ça avance 😉

  2. Ce qui serait top, c’est d’avoir aussi les Howtos pour taper les BDD type Scopus et Cie… Mais bon, c’est un peu compliqué à trouver 😉

  3. Danny tu geekifies !
    Ne te jette pas sur toutes les nouveautés : trouve-z-en une et fais en qq chose !

    Le monde t’en saura gré (surtout moi, quand tu me livreras un produit fini, clé en main !!! ;^P )

  4. @ PK : tu me connais, je vais tel le papillon… Il est vrai que je dois apprendre à aller au bout des choses. Mais le bout des choses est tellement ennuyeux…

Leave a Reply

Your email address will not be published. Required fields are marked *