Poussières

closeUne année au moins est passée depuis la publication de ce billet qui peut donc contenir des informations un peu datées.

J’apprends par le bibliobsédé que le défunt De Tout sur Rien était archivé par la BnF. J’apprends tantôt par une source dont je ne peux révéler l’identité 😉 que Face Ecran est également archivé par la BnF. Tout cela me semble participer de la logique de sédimentation dont j’ai parlé et ici (oui, les archives c’est aussi du sédiment).

Juste deux questions :

  • Pourquoi est-ce que l’usage du résultat de ces collectes n’est réservé qu’aux chercheurs accrédités ? (je déteste cette idée de chercheurs accrédités : je peux comprendre qu’on limite l’accès à des documents physiques fragiles pour ne pas les fragiliser plus, mais des données numériques ?) ;
  • Quels richesses produiraient ces collectes si on les rendaient accessibles au tout-venant (je m’inclus) et surtout, si on les proposaient à l’usage “commun” au sein d’outils permettant de construire autour d’elles (ces collectes) un réseau social ? Que pourrions-nous construire sur notre propre passé, dont toute une part n’est plus visible sur le Net ?

6 thoughts on “Poussières

  1. je comprends bien ce que tu souhaites, dans le grand esprit du web ouvert, mais quand même un dièse et un bémol:

    – dépôt légal web institué par voie juridique, mais avec c’est spécificité française pour une fois assez originale, donnant à la BNF le droit de l’exercer sans consultation des sites collectés, ceci en opposition donc au dépôt légal papier, qui suppose 2 exemplaires envoyés par l’éditeur, dont 1 stocké dans un bunker je sais plus où en Normandie – processus d’ailleurs soigneusement séparé des “achats” de la BNF, même source :-), de même qu’Heritrix archive selon incréments rapprochés une série de site prescrits par leurs équipes, et procède une fois l’an à collecte généralisée

    les bémols à ta suggestion:

    1, le droit à l’oubli – sur un site comme Tiers Livre, en 5 ans, une bonne quinzaine de billets qu’il m’a semblé préférable, à un moment donné, de retirer (dernier exemple : la nomination par Sarkozy d’un directeur du livre proche Hortaffreux, mais à nomination du successeur Albanel, il semble qu’il ait demandé dans sa négo la remise à dispo du poste, du coup j’ai enlevé le mien, de post) – corollaire : même sur Google, on peut demander manuellement retrait d’un article en cache – idem pour tentatives (chez moi, Tumulte en 2006 ou autres expériences web sous mon nom ou via hétéronyme, parce que j’ai besoin de ces ateliers)inscrites dans le temps

    – 2, dans un site de ressources sous propriété artistique comme publie.net, via l’IP de Heritrix, on le reconnaît et on lui donne accès à tous les niveaux du site, donc y compris les ressources protégées – ce qui veut dire : possibilité pour l’auteur d’un copyright avec date et antériorité en cas de contestation ou pillage, archivage versions et pérennité de la création (d’excellence, chercher sur publie.net à “incipit” ou “en ce soir”), et symétriquement, fondamental pour l’édition numérique, ne changeant rien à possibilité pour nous de “retirer” un texte (exemple, le Darley “Monoprix” qui sort ces jours-ci chez Actes Sud), ou versions remaniées par l’auteur etc

    je suis donc, contrairement à toi, Daniel, très désireux de garder forme actuelle pour Heritrix, accès réservé et sans archivage (même pas de clé USB)

    que la BNF puisse – techniquement possible ? – greffer à cette collecte une version publique, avec moteur de recherche en propre, une sorte de “club du web” ? suis pas sûr non plus, c’est à l’arrivée de Google vers 2000 qu’il aurait fallu la décision politique d’un moteur en site propre

    y a même une photo d’Heritrix chez moi
    http://www.tierslivre.net/krnk/spip.php?article326

    et merci à la source 🙂

  2. @olivier : la pesanteur nous tient au sol, remarque…

    @F : Il me semble qu’il n’y a pas incompatibilité à avoir un accès public à l’archivé et dans le même temps, possibilité pour les concernés de demander le retrait de ceci ou cela (on peut le faire pour Google, why not pour la BnF), le retrait concernant alors seulement une partie publique, ce qui permettrait (puisque la partie miroir BnF ‘privée’ resterait intégrale) quand même de garder traces pour l’éternité, et après.

    On distinguerait une sorte de Back-Office réservé VIP/chercheurs et BnF avec tout dedans ; et un Front-Office avec presque tout (le moins étant la part des anges, le droit à l’oubli public + choses sous droits). Non ?

  3. Je comprends d’autant mieux tes réticences que j’avais tendance à les partager avant de réfléchir plus avant au problème, qui n’est pas si simple qu’il n’y paraît.

    Le commentaire de François est parfait (comme toujours!) et pose très clairement le principal problème, qui est celui du droit à l’oubli : il n’est pas possible de mettre en ligne les archives de sites que leurs auteurs ont supprimé pour diverses raisons, des billets de blogs d’adolescents qui entre temps sont devenus des pères de famille respectable, etc.
    Imagine que dans 10 ans, devenu directeur des collections à la BnF, tu regrettes amèrement d’avoir fait dire un jour à Candide que ce serait bien d’avoir le droit de manger dans les bibliothèques et que tu souhaites voir censurer ces assertions dans les archives !?!

    Les archives qui sont proposées en ligne sont soit des sélections très limitées, comme au Congrès, soit des mémoires censurées lorsque les producteurs de sites le demandent, comme Internet Archive. Et une mémoire à trous n’est pas une solution satisfaisante.

    Reste la solution que tu proposes d’une double archive (la part des anges…) : nous y avons pensé, et elle sera peut-être envisageable un jour, mais, alors que tout ce travail d’archivage est encore très expérimental et complexe, elle demanderait un travail considérable, en des temps où le recrutement de fonctionnaires n’est pas trop à l’ordre du jour … Peut-être que lorsqu’ Heritrix aura grandi et que les crawlers seront vraiment smart cela pourra être automatisé, mais il va falloir encore un peu de patience …

    Je précise aussi qu’il est plus facile que jadis d’être accrédité pour le niveau recherche : le besoin d’effectuer une recherche universitaire ou personnelle sur les Archives de l’Internet est un motif tout à fait suffisant.

    … enfin merci de remercier la source 😉 que je t’autorise à citer (on n’est pas au procès Courant Limpide !)

  4. @cgenin (alias la source 😉 ) ok, merci pour ces précisions – donc, ça viendra.. quand je serai Directeur des collections… option collections de jeux de mots foireux (si ça arrive un jour – peu de risques – je fusionne la BnF avec Royal de Luxe pour faire plaisir à Nico_AsLi 😉 )

Leave a Reply

Your email address will not be published. Required fields are marked *