A outra vida das web| Biblioteca de Galicia

 

Que ocorre cando un blog, un xornal dixital ou incluso un museo pecha? Desaparece a posibilidade de acceso ás súas páxinas web e, consecuentemente, a todo o seu contido de vida? 

Isto acontecía en Galicia ata 2015, ano no que se publica o Real Decreto 635/2015 para regular o depósito legal das publicacións en liña. Nel establécese que a responsabilidade de preservar o patrimonio documental en liña compartirano a Biblioteca Nacional de España e os centros de conservación que determinen as comunidades autónomas no ámbito das súas competencias. Na nosa comunidade esta función recae sobre a Biblioteca de Galicia, situada na Cidade da Cultura. 

En cumprimento do establecido neste real decreto, desde 2015 a Biblioteca de Galicia xa está a colaborar coa BNE na recolección das web galegas. Deste xeito, xa se poden consultar nas súas instalacións tanto as de domino .es como todas as de .gal, e tamén aquelas fóra destes dominios que se consideren de interese social, cultura e político para Galicia.

A partir da existencia deste Arquivo Web, calquera usuario ou usuaria ten a posibilidade de consultar na Biblioteca de Galicia tanto web desaparecidas como a do recén pechado Museo de Arte Contemporánea da Coruña ou ver canto, moito ou nada mudou a páxina en liña dun xornal ou dunha institución; todo un percorrido, non só histórico senón de criterios de deseño por épocas ou tendencias.

COMO SE ARQUIVAN?

Para levar adiante o arquivado web, a Biblioteca Nacional de España optou por un modelo de colaboración coas comunidades autónomas. A BNE decidiu poñer a disposición dos centros conservadoresdas autonomías as ferramentas informáticas necesarias para traballar conxuntamente con elas na selección das URL do arquivado web. En Galicia o centro de conservación das publicacións en liña é a Biblioteca de Galicia.

A recolección de páxinas web  lévase a cabo con robots rastreadores que van percorrendo as URL seleccionadas previamente e gardando todo o que teñen enlazado coa frecuencia, profundidade e tamaño que se determine. O resultado destas recoleccións web son os arquivos web, onde se garda e pódese consultar o colleitado.

No noso país é o Arquivo da Web Española, xestionado pola BNE  (http://www.dle.es/openwayback/wayback/). A ferramenta que usa a Biblioteca Nacional de España para arquivar a web chámase NAS (NetArchiveSuite). Foi deseñada pola Biblioteca de Dinamarca, e actualmente utilízana tamén para este propósito outras bibliotecas nacionais como a de Francia e a de Austria.

Para rastrexar utiliza o robot Heritrix, creado por Internet Arquive, que foi a primeira organización que rastrexou e arquivou a web desde 1996. Para visualizar o arquivado utilízase OpenWayback, unha aplicación que lle ofrece ao usuario/a a posibilidade de consultar un sitio web capturado nunha data determinada.

TODOS OS DOMINIOS .GAL

No eido dos sitios web é importante destacar que Galicia conta cun dominio propio na Internet para a lingua e a cultura galegas; o .gal. Contar con este dominio axuda moito as tarefas a hora de establecer a xestión do depósito legal das publicacións en liña.

A obrigatoriedade de estar rexistrado para poder publicar un sitio web asociado a .gal facilita que todos os nomes deste dominio estean identificados e permite que o depósito legal sexa un instrumento fiable para garantir a conservación futura de todos eses sitios web rexistrados baixo o dominio .gal.

Baixo estas premisas, desde o ano 2017 a Biblioteca Nacional de España leva a cabo, por encargo da Biblioteca de Galicia, as recoleccións masivas do dominio .gal. No 2019, a recolección realizouse sobre unha listaxe de 5.140 dominios subministrados pola Asociación PuntoGal; fronte aos 4.788 do 2018 e os 4.261 do 2017, o que supón un increcemento do 39%.

 

 

Santiago de Compostela, 28 de Febreiro de 2020