Archivácia WWW (archivácia internetu, archivácia webu) je proces získavania a dlhodobého uchovávania častí obsahu WWW a údajov, ktoré boli zverejnené na internete a zabezpečenie ich sprístupňovania pre budúcich bádateľov, historikov a verejnosť.[1] Archivovanie sa obvykle vykonáva automaticky pomocou robotov.[2]. Najväčšou inštitúciou, ktorá sa archiváciou WWW zaoberá je Internet Archive, na Slovensku Univerzitná knižnica v Bratislave.[3]

Zber WWW upraviť

Zbierajú sa obvykle všetky súčasti obsahu WWW, vrátane HTML, štýlov CSS, JavaScriptu, digitálnych obrázkov a multimediálnych súborov. Ukladajú sa tiež metadáta súvisiace s týmito objektami, ako sú informácie o tom, kedy bol objekt získaný, akého je typu, akou technológiou bol zozbieraný, aký je veľký atď.[4] Metadáta sú dôležité na určenie autenticity a pôvodnosti údajov.[5]

Najčastejšie sa WWW zbiera pomocou robotov, ktoré vidia stránky podobne ako používateľ. Používané roboty sú napríklad:

Referencie upraviť

Pozri aj upraviť

Externé odkazy upraviť