Comment faire : récuperer du contenu internet qui n’est plus disponible

Vous est-il déjà arrivé de cliqué sur un lien dont la cible n’était plus disponible? Comme vous le savez sans-doute, internet n’oublie rien (ou presque) et on peut toujours utiliser la machine à voyager dans le temps d’internet : archive.org, un site effectue des sauvegardes d’internet et les met à disposition de chacun gratuitement. Tout internet n’est pas sauvegardé mais pour info, le volume des données disponibles sur archive.org est de 2 petabytes (2048 Teraoctets) et sa croissance est de 20 teraoctets par mois.

Je suis tombé sur ce site qui explique comment se faire une sonde réseaux passive. l’article comporte un schéma de câblage issu de snort.org. Alors, voulant obtenir plus de détails, j’ai cliqué sur ce lien et la : erreur 404… Misère, snort.org a retiré ce contenu… Je me suis donc rendu sur archive.org. La il suffit de taper une URL pour afficher les pages web des temps passés.

La question qui se pose ensuite : sur quelle période le contenu que je recherche était disponible? Pour cela, on peut chercher des indices:

Le post que je lisait date de février 2008. Plus bas, on trouve qu’un commentaires, daté de Juin 2009, mentionne que le lien est mort. Il faut donc chercher entre ces 2 dates ! Je clique sur une date de juin 2008 ; je tombe sur la page d’accueil de Snort.org de 2008. Il suffit ensuite de copier/coller le liens d’origine à la fine de l’URL d’archive.org et nous avons quelque chose comme ceci:

http://web.archive.org/web/20080619050027/http://www.snort.org/docs/tap/

Une URL dans une URL! Yo dawg?

Par chance, ça a marché! j’ai pu retrouver l’article d’origine et ainsi obtenir plus d’infos =]

 

PS: Si vous lisez ce billet et que nous sommes en 2024, il est possible que les liens qui s’affiche sur votre page ne soit plus accessibles! allez-donc faire un tour sur archives.org! (si ça existe toujours…)

 

Leave a Reply