Webs capturats

Des del 21 de juliol de 2006 el sistema ha evolucionat per capturar sistemàticament i de manera eficaç un nombre creixent de pàgines web. També ha evolucionat l’espai necessari per emmagatzemar i donar accés a aquestes dades.

En l’exposició de dades estadístiques, ens referim a “web”, o “lloc web”, com un recurs publicat a Internet que està identificat per una URL independent. Ens referim a “captura”, com cadascuna de les captures realitzades en el temps d’un lloc web. I ens referim a “fitxer”, com cadascun dels fitxers o arxius informàtics que conté un lloc web. S’inclouen altres dades tècniques que poden ser de l’interès del públic de PADICAT.

 

Continguts del repositori

ConcepteTotal
Nombre de webs63.145
Nombre de captures277.819
Nombre de fitxers372.932.876
Espai d'ARC (TB)13,5
Espai d'índexs (TB)1
Espai total (TB)14,5

 

Procedència de les captures

Els recursos dipositats al repositori procedeixen: de la captura del domini .CAT; de recursos compilats per crear col·leccions monogràfiques; de pàgines web recomanades pel públic de PADICAT; i de recursos digitals de les institucions que han signat conveni de cooperació amb la Biblioteca de Catalunya.

ConcepteNombre de websNombre de captures
Convenis5984.138
Recomanats11.50769.655
Monogràfics7.18495.228
.cat43.856108.798
Total63.145277.819

 

Distribució del tipus de fitxer informàtic que conté el repositori PADICAT

TipusFitxers
text/html282.840.29075,84%
image/jpeg42.854.85711,49%
image/gif9.520.2302,55%
image/png7.836.0332,10%
application/pdf5.661.4801,52%
application/atom+xml4.020.4131,08%
text/xml2.704.6120,73%
application/rss+xml2.464.6960,66%
text/css2.226.5450,60%
text/plain1.786.4540,48%
application/javascript1.666.1660,45%
text/dns1.441.1110,39%
application/x-shockwave-flash1.339.6100,36%
application/xml972.5650,26%
application/x-javascript869.6380,23%
no-type525.0920,14%
application/octet-stream400.6760,11%
application/msword322.7650,09%
application/http319.7000,09%
image/pjpeg268.9210,07%
Altres2.891.0220,78%
Total372.932.876 

 

Evolució dels monogràfics: les col·leccions temàtiques de PADICAT

S’ha realitzat vuit monogràfics: museus de Catalunya, música folk-rock a Catalunya, campanya electoral de les eleccions al Parlament Europeu (2009), al Parlament de Catalunya (2006 i 2010), al Congrés i Senat espanyol (2008), i eleccions municipals (2007 i 2011).

 

ConcepteNombre de webs novesNombre de capturesNombre de fitxersEspai (GB)
Eleccions al Parlament 2006817754.953.215175
Eleccions Municipals 20075311.74713.641.991457
Folkrock56561.148.31222
Eleccions Generals 20081298963.117.638135,11
Eleccions europees 20091706135.404.291233,05
Museus de Catalunya1.5231.5502.146.133147,49
Eleccions al Parlament 201096731.21017.202.999707,65
Eleccions Municipals 20113.34647.42921.766.8321.127
Eleccions Generals 20113049391.764.159276
Eleccions al Parlament 20127710.01316.890.655328
Total7.18495.22888.036.2253608,3

 

Més informació sobre les col·leccions monogràfiques de PADICAT en les campanyes electorals:

Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764