Webs capturados

Desde el 21 de Julio de 2006 el sistema ha evolucionado para capturar sistemáticamente y de manera eficaz un número creciente de sitios web. También ha evolucionado el espacio necesario para almacenar y dar acceso a estos datos.

En la exposición de datos estadísticos, nos referimos a “web”, o “sitio web”, como un recurso publicado en Internet que está identificado por una URL independiente. Y nos referimos a “archivo”, como cada uno de los archivos informáticos que contiene un sitio web. Se incluyen otros datos técnicos que pueden ser de interés del público de PADICAT.

Contenidos del repositorio:

 

ConceptoTotal
Número de webs63.145
Número de capturas277.819
Número de ficheros372.932.876
Espacio de ARC (TB)13,5
Espacio de índices (TB)1
Espacio total (TB)14,5

 

Procedencia de las capturas

Los recursos depositados en el repositorio proceden: de la captura del dominio .cat; de recursos compilados para crear colecciones monográficas; de páginas web recomendadas por el público de PADICAT; y de recursos digitales de las instituciones que han firmado convenio de cooperación con la Biblioteca de Catalunya.

 

ConceptoNúmero de websNúmero de capturas
Convenios5984.138
Recomendados11.50769.655
Monográficos7.18495.228
.cat43.856108.798
Total63.145277.819

 

Distribución del tipo de archivo informático que contiene el repositorio PADICAT.

 

TipoFicheros
text/html282.840.29075,84%
image/jpeg42.854.85711,49%
image/gif9.520.2302,55%
image/png7.836.0332,10%
application/pdf5.661.4801,52%
application/atom+xml4.020.4131,08%
text/xml2.704.6120,73%
application/rss+xml2.464.6960,66%
text/css2.226.5450,60%
text/plain1.786.4540,48%
application/javascript1.666.1660,45%
text/dns1.441.1110,39%
application/x-shockwave-flash1.339.6100,36%
application/xml972.5650,26%
application/x-javascript869.6380,23%
no-type525.0920,14%
application/octet-stream400.7670,11%
application/msword322.7650,09%
application/http319.7000,09%
image/pjpeg268.9210,07%
Otros2.891.0220,78%
Total372.932.876 

Evolución de los monográficos: las colecciones temáticas de PADICAT

Se han realizado ocho monográficos: museos de Cataluña, música folk-rock en Cataluña, campaña electoral de las elecciones al Parlamento Europeo (2009), al Parlamento de Cataluña (2006 y 2010), al Congreso y Senado español (2008), y elecciones municipales (2007 y 2011).

 

ConceptoNúmero de webs nuevasNúmero de capturasNúmero de ficherosEspacio (GB)
Elecciones al Parlament 2006817754.953.215175
Elecciones Municipales 20075311.74713.641.991457
Folkrock56561.148.31222
Elecciones generales 20081298963.117.638135,11
Elecciones europeas 20091706135.404.291233,05
Museos de Cataluña1.5231.5502.146.133147,49
Elecciones al Parlament 201096731.21017.202.999707,65
Elecciones Municipales 20113.34647.42921.766.8321.127
Elecciones generales 20113049391.764.159276
Elecciones al Parlament 20127710.01316.890.655328
Total7.18495.22888.036.2253608,3

 

Más información sobre las colecciones monográficas de PADICAT en las campañas electorales:

Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764