Perma.cc, archiver une page web

« Si l’on remonte à 1998, 72 % des liens sont morts. Globalement, plus de la moitié des articles du New York Times qui contiennent des liens profonds ont au moins un lien mort. »

C’est ce que dit l’article qui m’a fait découvrir Perma.cc

C’est un secret pour personne : les sites meurent, les URLs changent, les articles sont supprimés etc…

Sur le web beaucoup de choses sont temporaires.

Kenneth Goldsmith recommandait d’ailleurs, dans son excellent bouquin, de sauvegarder nos choses précieuses sur des disques dur

« Beaucoup de gens pensent que le web – et ses richesses – sera toujours là pour les attendre. Ce ne sera pas le cas. N’ajoutez pas de favoris. Téléchargez. Les disques durs sont bon marché. Remplissez-les avec tout ce que vous pensez avoir besoin de consulter, regarder, lire, écouter ou citer à l’avenir »

La méthode la plus courante d’archiver une page web aujourd’hui, c’est d’utiliser Internet Archive.

Ça fonctionne bien, et c’est une vraie mine d’or.

Mais qu’est-ce qui adviendrait si Internet Archive venait à mourir ?

On ne peut pas compter uniquement sur 1 entité pour archiver le web.

Il faut plusieurs copies à des endroits différents, par des entités différentes.

Plus c’est décentralisé, mieux c’est !

Et aujourd’hui, on a un nouveau venu de qualité dans le monde de l’archivage du web :

Perma.cc

Perma.cc est orienté pour les universitaires, les journalistes, les personnes dans le droit… mais si tu n’es rien de tout ça, tu peux aussi tester l’outil et continuer avec un compte payant.

Les institutions académiques et les tribunaux peuvent « s’affilier » à Perma.cc gratuitement, et distribuer des comptes gratuitement à leurs membres.

C’est pour ces personnes que l’outil est destiné, par exemple pour archiver un lien cité

« L’un des rites de passage les plus abrutissants pour les nouveaux étudiants en droit consiste à  » sous-citer « , c’est-à-dire à vérifier les citations dans les travaux en cours pour s’assurer qu’elles sont conformes à la forme exigeante et byzantine requise par les normes de citation juridique et, plus directement, pour s’assurer que la source elle-même existe et dit ce que l’auteur qui la cite dit. (Dans un nombre assez alarmant de cas, ce n’est pas le cas, ce qui est une bonne raison d’envisager l’exercice de sous-citation). »

« Plus de 50 % des liens cités dans les avis de la Cour suprême ne pointent plus vers la page visée. Environ 70 % des liens cités dans les revues juridiques universitaires et 20 % de l’ensemble des articles scientifiques, technologiques et médicaux souffrent de liens morts »

Pour archiver une page web, rien de compliqué !

Il suffit juste de créer un compte et de copier/coller ton lien et cliquer sur « Create Perma Link » et c’est tout bon 😉

Tu auras ensuite accès à un lien de la page archivé, que tu peux partager comme tu veux.

Tu peux aussi passer leur extension pour navigateur pour aller plus vite 🙂

La page archivée est destinée à l’être pour toujours, il n’y a pas « d’expiration ».

Et tu peux télécharger une archive WARC de ta capture.

Le site est franchement bien foutu, c’est clair, ça fait plaisir.

Bon évidemment, quand il s’agit d’un outil pour archiver le web, la question de la longévité de l’outil se pose naturellement.

Perma.cc est développé et maintenu par le « Harvard Library Innovation Lab » et administré par un gros consortium de bibliothèques.

C’est pas une startup qui va crever dans 2 ans quoi 😉

Ils sont transparents sur leur fonctionnement, donc tu peux trouver pas mal d’infos sur le site.

De plus, les pages archivés sont répliqués sur des serveurs tiers. Par exemple, il est prévu que chaque archive créée soit envoyés automatiquement à Internet Archive.

Même si le site vise de tourner pour les décennies à venir, ils ont un plan d’urgence si jamais le site venait à mourir, pour conserver les pages archivées.

Et Perma.cc est open source. (MIT et GPL)

Cool, non ?

Je ne poste rien sur Twitter, Facebook...

La seule manière d'êtres au courant des nouveaux articles est :

  • De t'abonner par mail :

Voir les derniers mails envoyés

(1x par semaine max, je ne spam pas, je ne sais pas si tu ouvres les mails, pas de tracking)

Pssst : tu peux aussi t'abonner au flux RSS : https://serveur410.com/feed/

J'ai besoin de ton soutien !

Soutenir serveur410 :

Laisser un commentaire