domingo, 30 de octubre de 2016

El Archivo de Internet cumple veinte años: una obra titánica



Desde hace dos décadas, la Fundación Internet Archive (1), en colaboración con otras instituciones como bancos y bibliotecas nacionales, cuida con cariño la memoria de Internet para que puedan disfrutarla las siguientes generaciones.

En el subsuelo de la Biblioteca Nacional François Mitterrand (BNF) -escribe Morgane Tual en el diario francés Le Monde- “reposa la historia del Web francés”, a algunos grados menos que en el exterior y en “masivos armarios negros sembrados de diodos verdes parpadeantes”. En esas máquinas están archivados veintiséis mil millones de ficheros que la BNF cuida desde hace veinte años.

Igual que los libros o los periódicos, todo lo que pasa en la Red permanece archivado en la Fundación Internet Archive, una iniciativa surgida en 1996 en la mente del estadounidense Brewster Kahle, un producto típico de la última hornada de la «american way of life» que se convirtió en multimillonario tras fundar, y vender después, dos empresas de tecnología punta en los años ’90. Fue entonces cuando Brewster Kahle decició consagrar su tiempo y su recién adquirida fortuna a un proyecto totalmente innovador: archivar el Web: “De media, un sitio Web cambia o desaparece cada ochenta días -ha dicho a Le Monde- Y con él desaparecen nuestra cultura, nuestra historia, el rastro de nuestras vida. El Web necesitaba una memoria”. Para recoger esa memoria, y poder archivarla luego, lo primero que hizo Kahle fue crear un “crawler”, un programa capaz de navegar automáticamente por los sitios y almacenar copias de las páginas Web visitadas.


En la cabeza de Kahle estaba la creación de otra Biblioteca de Alejandría, “la de la era digital. Una biblioteca digital universal”. En aquel momento, el estadounidense afortunado no era el único que pensaba en la necesidad de ese archivo: las bibliotecas de Suecia y Australia, cada una por su lado, estaban empeñados en archivar el Web de sus respectivos países. En 1999, la BNF y el INA francés (Instituto Nacional del Audiovisual) siguieron sus pasos.

Pero, al margen de estas iniciativas públicas, la Fundación Internet Archive ha continuado creciendo, y desde 2001 dispone del programa Wayback Machine (2), una herramienta con la que cualquier internauta puede recorrer la totalidad de sus archivos. En la actualidad tiene almacenados unos 460.000 millones de archivos en esos “armarios negros parpadeantes” de su sede del Presidio de San Francisco (California). Lo que pasa es que, al mismo tiempo, Internet no cesa de cambiar e incorporar programas, lo que ya ha empezado a complicar la tarea de los archiveros: la irrupción de las redes sociales es uno de los principales escollos, por ejemplo resulta imposible archivar todos los tweets existentes.


(1) El Internet Archive (IA) es un organismo sin ánimo de lucro dedicado al archivo del Web y situado en el Presidio de San Francisco. El proyecto sirve también de biblioteca digital. Sus archivos electrónicos albergan clichés instantáneos (copias de páginas tomadas en diferentes momentos) de Internet, de programas, películas, libros y grabaciones de audio. Para garantizar la seguridad de los datos almacenados, en la Biblioteca de Alejandría, en Egipto, se ha creado “espejo funcional”. El IA pone su material gratuitamente a disposición de investigadores e historiadores. Los programas con los que funciona, tanto para la indexación como para la digitalización de libros, son libres (Heritrix y Scribe).

Además de los archivos del Web, Internet Archive conserva importantes colecciones de medios de comunicación digitales, organizados en colecciones (imágenes animadas, sonidos, textos, etc.) cada una de las cuales comprende una subcolección Open Sourve, donde se pueden archivar aportaciones del público en general. Las colecciones incluyen:
·         456.000 millones de versiones archivadas (snapshots) del World Wide Web y de Usenet, en 37 lenguas.
·         1 900.000 películas.
·         2.400.000 grabaciones de audio.
·         149.000 conciertos.
·         7.800.000 libros.
·         96.000 programas.
·         951.000 vídeos.

(2) La Wayback Machie (“la máquina de volver atrás”) es la parte que contiene los clichés en el Internet Archive. Se actualiza a partir del contenido de Alexa Internet y es un servicio que permite a los usuarios ver las distintas versiones de páginas Web archivadas a través del tiempo. Es como “el Indice en tres dimensiones”. El nombre de este programa está inspirado en los episodios del The Rocky and Bullwinkle Show, dos series de dibujos animados emitidas por las cadenas ABC y NBC entre 1959 y 1964, en las que Peabody, un perro con aire de profesor y su ayudante. Sherman (un humano animal de compañía), utilizaban una máquina de remontar el tiempo llamada “Wabac Machine”, para describir acontecimientos históricos célebres.

Igual que los libros o los periódicos, I

No hay comentarios:

Publicar un comentario