Webs capturats
Des del 21 de juliol de 2006 el sistema ha evolucionat per capturar sistemàticament i de manera eficaç un nombre creixent de pàgines web. També ha evolucionat l’espai necessari per emmagatzemar i donar accés a aquestes dades.
En l’exposició de dades estadístiques, ens referim a “web”, o “lloc web”, com un recurs publicat a Internet que està identificat per una URL independent. Ens referim a “captura”, com cadascuna de les captures realitzades en el temps d’un lloc web. I ens referim a “fitxer”, com cadascun dels fitxers o arxius informàtics que conté un lloc web. S’inclouen altres dades tècniques que poden ser de l’interès del públic de PADICAT.
Continguts del repositori
| Concepte | Total |
|---|---|
| Nombre de webs | 57.993 |
| Nombre de captures | 229.396 |
| Nombre de fitxers | 340.279.750 |
| Espai d'ARC (TB) | 12 |
| Espai d'índexs (TB) | 1 |
| Espai total (TB) | 13 |
Procedència de les captures
Els recursos dipositats al repositori procedeixen: de la captura del domini .CAT; de recursos compilats per crear col·leccions monogràfiques; de pàgines web recomanades pel públic de PADICAT; i de recursos digitals de les institucions que han signat conveni de cooperació amb la Biblioteca de Catalunya.
| Concepte | Nombre de webs | Nombre de captures |
|---|---|---|
| Convenis | 463 | 2.606 |
| Recomanats | 704 | 3.257 |
| Monogràfics | 3.249 | 36.682 |
| .cat | 35.171 | 75.494 |
| Total | 39.587 | 118.039 |
Distribució del tipus de fitxer informàtic que conté el repositori PADICAT
| Tipus | Fitxers | |
|---|---|---|
| text/html | 263.148.453 | 77,33% |
| image/jpeg | 37.756.722 | 11,09% |
| image/gif | 8.456.930 | 2,49% |
| image/png | 5.963.586 | 1,75% |
| application/pdf | 5.375.942 | 1,58% |
| application/atom+xml | 3.548.712 | 1,04% |
| text/xml | 2.302.467 | 0,68% |
| application/rss+xml | 2.241.257 | 0,66% |
| text/css | 1.792.974 | 0,53% |
| application/javascript | 1.388.795 | 0,41% |
| text/plain | 1.387.596 | 0,41% |
| text/dns | 976.210 | 0,29% |
| application/x-shockwave-flash | 903.466 | 0,27% |
| application/x-javascript | 683.954 | 0,20% |
| no-type | 522.794 | 0,15% |
| application/xml | 517.012 | 0,15% |
| application/octet-stream | 377.471 | 0,11% |
| application/msword | 307.148 | 0,09% |
| image/pjpeg | 255.547 | 0,07% |
| image/jpg | 208.674 | 0,06% |
| Altres | 2.164.040 | 0,64% |
| Total | 340.279.750 | |
Evolució dels monogràfics: les col·leccions temàtiques de PADICAT
S’ha realitzat vuit monogràfics: museus de Catalunya, música folk-rock a Catalunya, campanya electoral de les eleccions al Parlament Europeu (2009), al Parlament de Catalunya (2006 i 2010), al Congrés i Senat espanyol (2008), i eleccions municipals (2007 i 2011).
| Concepte | Nombre de webs | Nombre de captures | Nombre de fitxers | Espai (GB) |
|---|---|---|---|---|
| Eleccions al Parlament 2006 | 88 | 775 | 4.953.215 | 175 |
| Eleccions Municipals 2007 | 615 | 1.747 | 13.641.991 | 457 |
| Folkrock | 50 | 50 | 1.148.312 | 22 |
| Eleccions Generals 2008 | 147 | 896 | 3.117.638 | 135,11 |
| Eleccions europees 2009 | 170 | 613 | 5.404.291 | 233,05 |
| Museus de Catalunya | 1.364 | 1.391 | 2.146.133 | 147,49 |
| Eleccions al Parlament 2010 | 806 | 31.210 | 17.202.999 | 707,65 |
| Eleccions Municipals 2011 | 1.518 | 47.429 | 17.202.999 | 1.127 |
| Total | 4.758 | 84.111 | 64.817.578 | 3004,3 |
Més informació sobre les col·leccions monogràfiques de PADICAT en les campanyes electorals:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764