Webs capturats

Des del 21 de juliol de 2006 el sistema ha evolucionat per capturar sistemàticament i de manera eficaç un nombre creixent de pàgines web. També ha evolucionat l’espai necessari per emmagatzemar i donar accés a aquestes dades.

En l’exposició de dades estadístiques, ens referim a “web”, o “lloc web”, com un recurs publicat a Internet que està identificat per una URL independent. Ens referim a “captura”, com cadascuna de les captures realitzades en el temps d’un lloc web. I ens referim a “fitxer”, com cadascun dels fitxers o arxius informàtics que conté un lloc web. S’inclouen altres dades tècniques que poden ser de l’interès del públic de PADICAT.

 

Continguts del repositori

ConcepteTotal
Nombre de webs57.993
Nombre de captures229.396
Nombre de fitxers340.279.750
Espai d'ARC (TB)12
Espai d'índexs (TB)1
Espai total (TB)13

 

Procedència de les captures

Els recursos dipositats al repositori procedeixen: de la captura del domini .CAT; de recursos compilats per crear col·leccions monogràfiques; de pàgines web recomanades pel públic de PADICAT; i de recursos digitals de les institucions que han signat conveni de cooperació amb la Biblioteca de Catalunya.

ConcepteNombre de websNombre de captures
Convenis4632.606
Recomanats7043.257
Monogràfics3.24936.682
.cat35.17175.494
Total39.587118.039

 

Distribució del tipus de fitxer informàtic que conté el repositori PADICAT

TipusFitxers
text/html263.148.45377,33%
image/jpeg37.756.72211,09%
image/gif8.456.9302,49%
image/png5.963.5861,75%
application/pdf5.375.9421,58%
application/atom+xml3.548.7121,04%
text/xml2.302.4670,68%
application/rss+xml2.241.2570,66%
text/css1.792.9740,53%
application/javascript1.388.7950,41%
text/plain1.387.5960,41%
text/dns976.2100,29%
application/x-shockwave-flash903.4660,27%
application/x-javascript683.9540,20%
no-type522.7940,15%
application/xml517.0120,15%
application/octet-stream377.4710,11%
application/msword307.1480,09%
image/pjpeg255.5470,07%
image/jpg208.6740,06%
Altres2.164.0400,64%
Total340.279.750 

 

Evolució dels monogràfics: les col·leccions temàtiques de PADICAT

S’ha realitzat vuit monogràfics: museus de Catalunya, música folk-rock a Catalunya, campanya electoral de les eleccions al Parlament Europeu (2009), al Parlament de Catalunya (2006 i 2010), al Congrés i Senat espanyol (2008), i eleccions municipals (2007 i 2011).

 

ConcepteNombre de websNombre de capturesNombre de fitxersEspai (GB)
Eleccions al Parlament 2006887754.953.215175
Eleccions Municipals 20076151.74713.641.991457
Folkrock50501.148.31222
Eleccions Generals 20081478963.117.638135,11
Eleccions europees 20091706135.404.291233,05
Museus de Catalunya1.3641.3912.146.133147,49
Eleccions al Parlament 201080631.21017.202.999707,65
Eleccions Municipals 20111.51847.42917.202.9991.127
Total4.75884.11164.817.5783004,3

 

Més informació sobre les col·leccions monogràfiques de PADICAT en les campanyes electorals:

Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764