Törvény jön a webarchiválásról? Több százezer weboldalt mentett már le egy csapat a nemzeti könyvtárban! Webhistográfia mint önálló segédtudomány? Lesz magyar webarchívum, kutatható lesz digitális kultúránk! Te is bekapcsolódhatsz az értékmentő munkába!
2018. november 15-én második alkalommal tartottunk workshop-szerű szakmai napot 404 Not Found – Ki őrzi meg az internetet? címmel, ami a webes és egyéb internetes tartalmak archiválásával kapcsolatos közgyűjteményi feladatokkal foglalkozott.
A rendezvényen áttekintést adtunk az OKR program keretében zajló webarchiválási pilot projekt tapasztalatairól, eredményeiről és jövőbeni terveinkről.
Drótos László, az OSZK webarchiválási projektjének témafelelőse beszámolt arról, hogy szelektív módszerrel eddig mintegy hatezer magyar webhelyet mentettek le, ezek között vannak a múzeumok, könyvtárak, galériák, egyetemek és kutatóintézetek oldalai is.
A munka többféle irányban folyik: létre kell hozni a webarchívum informatikai hátterét, és meg kell tanulni az archiváláshoz használható szoftverek működését. Ki kell dolgozni a válogatási elveket, majd a lementett anyag feldolgozásának, ellenőrzésének és szolgáltatásának módját, továbbá jogilag is szabályozni kell az egész folyamatot.
A projekt keretében a webarchiválás másik módszereként megpróbálják félévente egyszer a egész webtéren szelektálás nélkül is lementeni a magyar webcímeket. 1995 óta hétszázharmincnégyezer nevet jegyeztek be a .hu országdomén alá, ezek közül szeptemberben kétszázkilencvenegyezerről töltöttek le weboldalakat az "aratógépnek" nevezett szoftverrel. Ez az anyag tömörítve jelenleg 5 terabájtnyi helyet foglal el. Egy domainen lehet, hogy egy webhely van, lehet, hogy egy sem, mert pl. csak levelezésre használják. Az is előfordul, hogy több tíz, vagy több tízezer webhely van rajta aldomain címekkel.
A nemzeti könyvtár weboldala egy cím a hétszázharmincnégyezerből. De a Magyar Elektronikus Könyvtár, vagy a digitális corvinákat bemutató oldalunk már aldomain címek, amelyek nincsenek országosan nyilvántartva. Viszont mi mentjük ezeket az oldalakat is.
"A magyar webarchívum célja a magyar webtartalom, ennek is nyilvános, illetve korlátozottan nyilvános részének összegyűjtése. Ezen belül is kiemelten a kulturális, tudományos, oktatási, közéleti jellegű dokumentumok és egyéb információs tartalmak képezik gyűjtőkörünk fő részét" - jelentette ki Drótos László. Forrás: MTI.
Moldován István, az OSZK E-könyvtári Szolgáltatások Osztályának vezetője a webarchívum üzemszerű működésének terveiről beszélt. Az ehhez szükséges hardvert várhatóan 2019 nyarán helyezik üzembe, a szoftvereket pedig összekötik a szintén fejlesztés alatt levő Országos Könyvtári Platformmal.
Dr. Halász Annamária, az OSZK jogásza a webarchiválás jogi keretének biztosításával kapcsolatos eddigi munkálatokat foglalta össze és elmondta azt is, hogy egy – előkészítés alatt álló – önálló törvény fogja szabályozni nálunk ezt a tevékenységet, ami világviszonylatban ritkaságnak számít.
Kokas Károly, a Szegedi Tudományegyetem Klebelsberg Kuno Könyvtárának főigazgató-helyettese előadást tartott arról, hogy a webhistoriográfia, vagyis az archivált webtartalmak kutatása ugyanolyan önálló segédtudománnyá fog válni, mint amilyen az oklevéltan vagy a címertan.
Végezetül Parti Ádám, az Országgyűlési Könyvtár csoportvezetője az állami és kormányzati online tartalmak megőrzésének külföldi gyakorlatát mutatta be, és külön kiemelte, hogy az ausztrál PANDORA archívumban a weboldalak mellett, a kormánytagok nyilvános Twitter üzeneteit, és a helyi önkormányzatok üléseiről interneten sugárzott videókat is gyűjtik.
A rendezvény egy kerekasztallal zárult, melyen a könyvtárosok mellett múzeumi és levéltári szakemberek beszélgettek egymással és a közönséggel a digitálisan születő tartalmak megőrzésének fontosságáról és lehetőségeiről.
Az előadások prezentációja hamarosan elérhető lesz a projekt oldalán.
Az OSZK-ban az internetes források hosszú távú megőrzését célzó kísérlet informatikai hátterét a Kormányzati Informatikai Fejlesztési Ügynökség biztosítja.
Az értékmentő munkába már most bárki bekapcsolódhat úgy, hogy ezen az űrlapon keresztül javasol kevésbé ismert, de megőrzésre érdemes fontos magyar webhelyeket. Köszönjük a segítséget!
Drótos László