WayBack Machine, base de datos de páginas web

Wayback, base de datos de páginas webPor el nombre de WayBack se conoce un proyecto, que forma parte de Archive.org,  que almacena copias de la mayoría de páginas web de la red. Lo curioso de este proyecto es que no sólo almacena una copia de la web actual, si no que dispone de un historial de esas páginas de las que ha ido haciendo copias a lo largo del tiempo. De esta forma, si buscamos por una página web y el sistema ha hecho alguna vez una copia, nos mostrará la fecha en que se ha tomado con un enlace a esa réplica que es 100% funcional. El sistema lo que hace es copiar el código, por lo que si las imágenes ya no se encuentran en el servidor, no se visualizarán, pero sí podremos ver la estructura de la web (aunque yo he hecho una prueba y no me ha cargado las CSS).

Aparentemente sólo aparecerían páginas guvernamentales, de educación y cultura, etc, pero he hecho una prueba y  varias de mis páginas aparecen, incluso he podido ver el diseño de la primera página que hice, ¡allá por el 2003!.

Según datos de la Wikipedia, actualmente la base de datos está consumiendo cerca de 2 Petabytes (2000 Terabytes) para almacenar los contenidos de las páginas web.

Más información | http://www.archive.org/web/web.php

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

What is 10 + 15 ?
Please leave these two fields as-is: