Webs capturados
Desde el 21 de Julio de 2006 el sistema ha evolucionado para capturar sistemáticamente y de manera eficaz un número creciente de sitios web. También ha evolucionado el espacio necesario para almacenar y dar acceso a estos datos.
En la exposición de datos estadísticos, nos referimos a “web”, o “sitio web”, como un recurso publicado en Internet que está identificado por una URL independiente. Y nos referimos a “archivo”, como cada uno de los archivos informáticos que contiene un sitio web. Se incluyen otros datos técnicos que pueden ser de interés del público de PADICAT.
Contenidos del repositorio:
| Concepto | Total |
|---|---|
| Número de webs | 58.787 |
| Número de capturas | 262.937 |
| Número de ficheros | 372.932.876 |
| Espacio de ARC (TB) | 12,27 |
| Espacio de índices (TB) | 1 |
| Espacio total (TB) | 13,27 |
Procedencia de las capturas
Los recursos depositados en el repositorio proceden: de la captura del dominio .cat; de recursos compilados para crear colecciones monográficas; de páginas web recomendadas por el público de PADICAT; y de recursos digitales de las instituciones que han firmado convenio de cooperación con la Biblioteca de Catalunya.
| Concepto | Número de webs | Número de capturas |
|---|---|---|
| Convenios | 598 | 4.138 |
| Recomendados | 10.980 | 64.827 |
| Monográficos | 7.184 | 95.228 |
| .cat | 40.025 | 98.744 |
| Total | 58.787 | 262.937 |
Distribución del tipo de archivo informático que contiene el repositorio PADICAT.
| Tipo | Ficheros | |
|---|---|---|
| text/html | 282.840.290 | 75,84% |
| image/jpeg | 42.854.857 | 11,49% |
| image/gif | 9.520.230 | 2,55% |
| image/png | 7.836.033 | 2,10% |
| application/pdf | 5.661.480 | 1,52% |
| application/atom+xml | 4.020.413 | 1,08% |
| text/xml | 2.704.612 | 0,73% |
| application/rss+xml | 2.464.696 | 0,66% |
| text/css | 2.226.545 | 0,60% |
| text/plain | 1.786.454 | 0,48% |
| application/javascript | 1.666.166 | 0,45% |
| text/dns | 1.441.111 | 0,39% |
| application/x-shockwave-flash | 1.339.610 | 0,36% |
| application/xml | 972.565 | 0,26% |
| application/x-javascript | 869.638 | 0,23% |
| no-type | 525.092 | 0,14% |
| application/octet-stream | 400.767 | 0,11% |
| application/msword | 322.765 | 0,09% |
| application/http | 319.700 | 0,09% |
| image/pjpeg | 268.921 | 0,07% |
| Otros | 2.891.022 | 0,78% |
| Total | 372.932.876 | |
Evolución de los monográficos: las colecciones temáticas de PADICAT
Se han realizado ocho monográficos: museos de Cataluña, música folk-rock en Cataluña, campaña electoral de las elecciones al Parlamento Europeo (2009), al Parlamento de Cataluña (2006 y 2010), al Congreso y Senado español (2008), y elecciones municipales (2007 y 2011).
| Concepto | Número de webs nuevas | Número de capturas | Número de ficheros | Espacio (GB) |
|---|---|---|---|---|
| Elecciones al Parlament 2006 | 81 | 775 | 4.953.215 | 175 |
| Elecciones Municipales 2007 | 531 | 1.747 | 13.641.991 | 457 |
| Folkrock | 56 | 56 | 1.148.312 | 22 |
| Elecciones generales 2008 | 129 | 896 | 3.117.638 | 135,11 |
| Elecciones europeas 2009 | 170 | 613 | 5.404.291 | 233,05 |
| Museos de Cataluña | 1.523 | 1.550 | 2.146.133 | 147,49 |
| Elecciones al Parlament 2010 | 967 | 31.210 | 17.202.999 | 707,65 |
| Elecciones Municipales 2011 | 3.346 | 47.429 | 21.766.832 | 1.127 |
| Elecciones generales 2011 | 304 | 939 | 1.764.159 | 276 |
| Elecciones al Parlament 2012 | 77 | 10.013 | 16.890.655 | 328 |
| Total | 7.184 | 95.228 | 88.036.225 | 3608,3 |
Más información sobre las colecciones monográficas de PADICAT en las campañas electorales:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764