Categorías
ccTLD

La BNE guarda por sexto año consecutivo todas las web con dominio .es

Compartir!

La BNE(Biblioteca Nacional de España) ha lanzado la recolección que realiza anualmente de todos los sitios web con dominio .es para preservar el patrimonio documental español en internet. 

En 2020, había más de 1.930.000 webs .es, que se han recolectado en un total de aproximadamente 50 terabytes de información. Aunque el número de dominios se ha incrementado con respecto al año anterior, la cantidad de información publicada es algo menor.

Lo que se publica en Internet se conserva desde el año 2009, algo especialmente importante teniendo en cuenta que la información de internet puede ser efímera.

La BNE quiere conservar el patrimonio para que este no se pierda. Por ello, hace recolecciones masivas de sitios web con el dominio español para conocer el panorama global de la web del país.

Cómo se recopila la información de los dominios .es

Para guardar los contenidos, la Biblioteca recurre a software de recolección automático que usa 71 arañas que rastrean la web y guardan los contenidos descargando la información de los enlaces que encuentra. El contenido se guarda en un formato que permite que puedan consultarse la web como si se visitara en internet.

Las recolecciones tienen un límite de tamaño de descarga por web de 150 Megabytes. Por eso, este año se han guardado el 87 % de las web de manera completa.

Han logrado guardar más de 1.970.000 dominios durante 25 días, lo que supone 68 TB de información. Han experimentado una gran mejora al pasar de los 92 días de tiempo de descarga de la información en el 2016 a los 25 días este año.

Ver: archivo de la web española