Historia

PADICAT nació en 2005 siguiendo la tendencia de otras bibliotecas nacionales en la creación de archivos web.

Hay numerosos archivos web en funcionamiento. Los más conocidos son también los que hicieron los primeros pasos el año 1996: el sueco Kulturarw3; el australiano Pandora, y un conocido repositorio de alcance internacional, el Internet Archive. Quince años más tarde, podemos contar con hasta cincuenta proyectos en diferentes fases de implementación, aunque solo un tercio de esta cifra son acciones consolidadas.

El análisis de estas experiencias muestra dos modelos básicos de políticas de colección con una tendencia generalizada hacia un modelo híbrido. El primero es el modelo integral exhaustivo (mayoritario, y característico de los países escandinavos en los inicios), que persiguen la integración automática de la web a partir de determinados criterios infraestructurales (según el dominio de las páginas web, según la ubicación del servidor, etc). El segundo modelo es el selectivo (asimilado por Australia, el Reino Unido o Japón, entre otras comunidades), dirigido a compilar la web basándose en una política selectiva (un repertorio de recursos digitales correspondientes a las diferentes áreas de conocimiento para un espacio geográfico concreto). Estos dos modelos clásicos han dado paso -en lo que es a partir de la experiencia inicial danesa, una tendencia generalizada en todo el mundo- a modelos híbridos, que complementan la captura periódica de un dominio geográfico entero, con acciones selectivas, y amplían esta cobertura a diferentes eventos de interés social (elecciones, competiciones deportivas, premios culturales) o sucesos informativos que generan actividad intensa en las redes (atentados, catástrofes  naturales, pandemias, episodios de la crisis económica, debates sociales).

Lamentablemente, el número de depósitos que permiten acceder libremente a sus colecciones es muy limitado, bien para evitar conflictos con la vulneración de los derechos de la propiedad intelectual de los recursos capturados sin autorización, o bien porque las interfaces de recuperación de la información depositada no han sido lo bastante desarrolladas.

En la mayor parte de los casos han sido impulsores de estos proyectos los organismos nacionales de bibliotecas y archivos, además de diferentes entidades públicas y privadas de alcance nacional o internacional. Representantes de estos organismos se agrupan en el International Internet Preservation Consortium (IIPC) con la misión de compilar y preservar la información y el conocimiento de Internet, dándole accesibilidad, para futuras generaciones de todo el mundo, y promover el intercambio global y las relaciones internacionales.

En España, la Biblioteca de Catalunya impulsó el proyecto PADICAT (Patrimonio Digital de Cataluña) el año 2005. El 2007, el Gobierno vasco y Eusko Jaurlaritzaren Informatika Elkartea (EJIE, Sociedad Informática del Gobierno Vasco) crearon Ondarenet, el archivo electrónico del patrimonio digital vasco. Desde 2009, la Biblioteca Nacional de España (BNE) [LINK] encarga capturas periódicas del dominio .es en el Internet Archive.

A pesar de la imperfección de los sistemas informáticos que sirven a las políticas nacionales de preservación del patrimonio digital en la red, el archivo de Internet es actualmente una realidad en todo el mundo tecnológicamente desarrollado.

En junio de 2005 la Biblioteca de Catalunya inició la fase preliminar, de planificación, en la cual se realizó el análisis de los proyectos y recursos existentes, los agentes implicados en la producción de páginas web en Cataluña y los aspectos legales que condicionan las prácticas que se quieren llevar a cabo.

En base a unos parámetros definidos por la BC, el 21 de julio de 2006 se empezaron a recopilar de manera automatizada las webs susceptibles de formar parte del patrimonio digital de Cataluña, siendo las primeras las de los ayuntamientos de Berga y de Palafrugell, y las de los colegios profesionales de Aparejadores y Arquitectos Técnicos de Tarragona, y de diplomados en Trabajo Social y Asistentes Sociales de Cataluña. El 11 de Septiembre de 2006, coincidiendo con la celebración de la Diada Nacional de Catalunya, el portal web de PADICAT se abrió al público, con una treintena de webs almacenadas.

El período 2006-08 representa la fase de producción, del plan piloto del proyecto, la fase de explotación de PADICAT: la captura sistemática de las páginas web de Cataluña.

El período 2009-2011 ha permitido a la BC contar con un escenario óptimo en el cual este sistema, que es pionero en España y de referencia en Europa, funciona en pleno rendimiento. Paralelamente, se han cerrado acuerdos de cooperación con 450 instituciones de todo tipo, y se ha garantizado el acceso en abierto, en línea, a toda la colección.

El 11 de septiembre de 2011 se ha inaugurado una nueva versión del portal web de acceso a los contenidos depositados en PADICAT: 200.000 capturas de 45.000 páginas web, que significan unos 300 millones de archivos y 10 Terabytes de volumen.

 

Más información sobre la evolución de PADICAT:
 

Ciro Llueca, Daniel Cócera, Natalia Torres, Gerard Suades, Gerard de la Vega (2011). “El PADICAT: l’experiència catalana en l’arxiu d’Internet”. Ligall, 31. http://eprints.rclis.org/bitstream/10760/16246/1/llueca_lligall_31_2010_padicat.pdf

Cócera, Daniel; Llueca, Ciro (2008). "PADICAT: realitat i reptes de 3 anys d'arxiu web de Catalunya". 11es Jornades Catalanes d'Informació i Documentació. Barcelona: COBDC. http://eprints.rclis.org/archive/00013562/01/llueca_padicat_jornades_2008.pdf

Llueca, Ciro (2006). "El projecte PADICAT (Patrimoni Digital de Catalunya) de la Biblioteca de Catalunya". 10es Jornades Catalanes d'Informació i Documentació. Barcelona: COBDC. http://eprints.rclis.org/archive/00006434/01/llueca_padicat.pdf

Biblioteca de Catalunya (2005). Memòria del plantejament del projecte PADICAT (Patrimoni Digital de Catalunya). Barcelona: Biblioteca de Catalunya. http://www.recercat.net/handle/2072/1757