Archivácia WWW

Archivácia WWW (archivácia internetu, archivácia webu) je proces získavania a dlhodobého uchovávania častí obsahu WWW a údajov, ktoré boli zverejnené na internete a zabezpečenie ich sprístupňovania pre budúcich bádateľov, historikov a verejnosť.^[1] Archivovanie sa obvykle vykonáva automaticky pomocou robotov.^[2]. Najväčšou inštitúciou, ktorá sa archiváciou WWW zaoberá je Internet Archive, na Slovensku Univerzitná knižnica v Bratislave.^[3]

Zber WWW

Zbierajú sa obvykle všetky súčasti obsahu WWW, vrátane HTML, štýlov CSS, JavaScriptu, digitálnych obrázkov a multimediálnych súborov. Ukladajú sa tiež metadáta súvisiace s týmito objektami, ako sú informácie o tom, kedy bol objekt získaný, akého je typu, akou technológiou bol zozbieraný, aký je veľký atď.^[4] Metadáta sú dôležité na určenie autenticity a pôvodnosti údajov.^[5]

Najčastejšie sa WWW zbiera pomocou robotov, ktoré vidia stránky podobne ako používateľ. Používané roboty sú napríklad:

Referencie

Pozri aj

Externé odkazy

[1] Jinfang Niu, University of South Florida - An Overview of Web Archiving

[2] Julien Masanès, Bibliothèque Nationale de France - Towards continuous web archiving

[3] Androvič, A., Bizík, A., Katrincová, B., Lacková, I, Matúšková, J. - Digitálne pramene – národný projekt zberu a archivácie v roku 1. Knihovna Plus (online). Národní knihovna ČR. 2017, č. 1. ISSN 1801-5948.

[4] Developing Web Archiving Metadata Best Practices to Meet User Needs

[5] Best Practices for Web Archiving Metadata: Watch This Space!

[1]

[2]

[3]

[4]

[5]