MADRID, 08 (SERVIMEDIA)
La Biblioteca Nacional de España (BNE) ha guardado más de 1.970.000 dominios durante 25 días, rozando los 68 TB de información, lo que permite a la institución conservar el 87% de los dominios .es en internet.
El número de dominios .es ha aumentado en 180.000 desde 2016 y la infraestructura tecnológica usada ha mejorado su eficacia reduciendo considerablemente el tiempo necesario para la descarga de la información, de los 92 días en aquel año a los 25 días en 2021.
Para guardar los contenidos se trabaja con un software de recolección automático, NetarchiveSuite, que utiliza 71 arañas que rastrean la web y guardan los contenidos pinchando y descargando la información de los enlaces que encuentra.
El contenido se almacena en un formato específico, conocido como WARC (Web Archive), que permite la consulta de los sitios web tal y como se haría navegando por Internet. A las recolecciones se les establece un límite de tamaño de descarga por cada sitio web para evitar la sobrecarga y saturación del sistema de recolección.
La BNE establece un límite de 150 Megabytes por cada dominio, por lo que una vez llegado a este límite la recolección para, continuando con el siguiente dominio. Este año y con esta configuración, se ha logrado guardar de manera completa el 87% del total de los dominios.
|