La otra vida de las web | Biblioteca de Galicia

 

¿Qué ocurre cuando un blog, un periódico digital o incluso un museo cierra? ¿Desaparece la posibilidad de acceso a sus páginas web y, consecuentemente, a todo su contenido de vida?

Esto sucedía en Galicia hasta 2015, año en el que se publica el Real Decreto 635/2015 para regular el depósito legal de las publicaciones en línea. En él se establece que la responsabilidad de preservar el patrimonio documental en línea lo compartirán la Biblioteca Nacional de España y los centros de conservación que determinen las comunidades autónomas en el ámbito de sus competencias. En nuestra comunidad esta función recae sobre la Biblioteca de Galicia, ubicada en la Cidade da Cultura.

En cumplimiento del establecido en este real decreto, desde 2015 la Biblioteca de Galicia ya está colaborando con la BNE en la recolección de las web gallegas. De este modo, ya se pueden consultar en sus instalaciones tanto las de domino .es como todas las de . gal, y también aquellas fuera de estos dominios que se consideren de interés social, cultura y político para Galicia.

A partir de la existencia de este Archivo Web, cualquier usuario o usuaria tiene la posibilidad de consultar en la Biblioteca de Galicia tanto web desaparecidas —como la del recién cerrado Museo de Arte Contemporánea de A Coruña— o ver cuánto, mucho o nada cambió la página online de un periódico o de una institución; todo un recorrido, no solo histórico sino de criterios de diseño por épocas o tendencias.


¿Cómo se archivan?

Para llevar adelante el archivado web, la Biblioteca Nacional de España optó por un modelo de colaboración con las comunidades autónomas. La BNE decidió poner la disposición de los centros conservadores de las autonomías las herramientas informáticas necesarias para trabajar conjuntamente con ellas en la selección de las URL del archivado web.

En Galicia el centro de conservación de las publicaciones en línea es la Biblioteca de Galicia. La recolección de páginas web se lleva a cabo con robots rastreadores que van recorriendo las URL seleccionadas previamente y guardando todo lo que han enlazado con la frecuencia, profundidad y tamaño que se determine. El resultado de estas recolecciones web son los archivos web, donde se guarda y se puede consultar el cosechado.

En nuestro país es el Archivo de la Web Española, gestionado por la BNE (http://www.dle.es/openwayback/wayback/). La herramienta que usa la Biblioteca Nacional de España para archivar la web se llama EN Las ( NetArchiveSuite). Fue diseñada por la Biblioteca de Dinamarca, y actualmente la utilizan también para este propósito otras bibliotecas nacionales como la de Francia y la de Austria.

Para rastrear utiliza el robot Heritrix, creado por Internet Archive, que fue la primera organización que rastreó y archivó la web desde 1996. Para visualizar el archivado se utiliza OpenWayback, una aplicación que ofrece al usuario/a a posibilidad de consultar un sitio web capturado en una fecha determinada.

Todos los dominios .gal

En el campo de los sitios web es importante destacar que Galicia cuenta con un dominio propio en internet para la lengua y la cultura gallegas; el . gal. Contar con este dominio facilita mucho las tareas a hora de establecer la gestión del depósito legal de las publicaciones en línea.

La obligatoriedad de estar registrado para poder publicar un sitio web asociado a . gal facilita que todos los nombres de este dominio estén identificados y permite que el depósito legal sea un instrumento fiable para garantizar la conservación futura de todos esos sitios web inscritos bajo el dominio . gal.

Bajo estas premisas, desde el año 2017 la Biblioteca Nacional de España lleva a cabo, bajo encargo de la Biblioteca de Galicia, las recolecciones masivas del dominio . gal. En el 2019, la recolección se realizó sobre un listado de 5.140 dominios suministrados por la Asociación PuntoGal; frente a los 4.788 del 2018 y los 4.261 del 2017, lo que supone un increcemento del 39%.

 

 

Santiago de Compostela, 28 de Febrero de 2020