Kétszázkilencvenegyezer magyar weboldalra küldte rá az aratógépet a nemzeti könyvtár

2018. november 16. 11:37 - nemzetikonyvtar

Törvény jön a webarchiválásról? Több százezer weboldalt mentett már le egy csapat a nemzeti könyvtárban! Webhistográfia mint önálló segédtudomány? Lesz magyar webarchívum, kutatható lesz digitális kultúránk! Te is bekapcsolódhatsz az értékmentő munkába!

2018. november 15-én második alkalommal tartottunk workshop-szerű szakmai napot 404 Not Found – Ki őrzi meg az internetet? címmel, ami a webes és egyéb internetes tartalmak archiválásával kapcsolatos közgyűjteményi feladatokkal foglalkozott.

A rendezvényen áttekintést adtunk az OKR program keretében zajló webarchiválási pilot projekt tapasztalatairól, eredményeiről és jövőbeni terveinkről.

img_3854.jpg

Drótos László, az OSZK webarchiválási projektjének témafelelőse beszámolt arról, hogy szelektív módszerrel eddig mintegy hatezer magyar webhelyet mentettek le, ezek között vannak a múzeumok, könyvtárak, galériák, egyetemek és kutatóintézetek oldalai is.

A munka többféle irányban folyik: létre kell hozni a webarchívum informatikai hátterét, és meg kell tanulni az archiváláshoz használható szoftverek működését. Ki kell dolgozni a válogatási elveket, majd a lementett anyag feldolgozásának, ellenőrzésének és szolgáltatásának módját, továbbá jogilag is szabályozni kell az egész folyamatot.

A projekt keretében a  webarchiválás másik módszereként megpróbálják félévente egyszer a egész webtéren szelektálás nélkül is lementeni a magyar webcímeket. 1995 óta hétszázharmincnégyezer nevet jegyeztek be a .hu országdomén alá, ezek közül szeptemberben kétszázkilencvenegyezerről töltöttek le weboldalakat az "aratógépnek" nevezett szoftverrel. Ez az anyag tömörítve jelenleg 5 terabájtnyi helyet foglal el. Egy domainen lehet, hogy egy webhely van, lehet, hogy egy sem, mert pl. csak levelezésre használják. Az is előfordul, hogy több tíz, vagy több tízezer webhely van rajta aldomain címekkel. 

A nemzeti könyvtár weboldala egy cím a hétszázharmincnégyezerből. De a Magyar Elektronikus Könyvtár,  vagy a digitális corvinákat bemutató oldalunk már aldomain címek, amelyek nincsenek országosan nyilvántartva. Viszont mi mentjük ezeket az oldalakat is.

"A magyar webarchívum célja a magyar webtartalom, ennek is nyilvános, illetve korlátozottan nyilvános részének összegyűjtése. Ezen belül is kiemelten a kulturális, tudományos, oktatási, közéleti jellegű dokumentumok és egyéb információs tartalmak képezik gyűjtőkörünk fő részét" - jelentette ki Drótos László. Forrás: MTI.

404_banner_2018.jpg

Moldován István, az OSZK E-könyvtári Szolgáltatások Osztályának vezetője a webarchívum üzemszerű működésének terveiről beszélt. Az ehhez szükséges hardvert várhatóan 2019 nyarán helyezik üzembe, a szoftvereket pedig összekötik a szintén fejlesztés alatt levő Országos Könyvtári Platformmal.

Dr. Halász Annamária, az OSZK jogásza a webarchiválás jogi keretének biztosításával kapcsolatos eddigi munkálatokat foglalta össze és elmondta azt is, hogy egy – előkészítés alatt álló – önálló törvény fogja szabályozni nálunk ezt a tevékenységet, ami világviszonylatban ritkaságnak számít.

Kokas Károly, a Szegedi Tudományegyetem Klebelsberg Kuno Könyvtárának főigazgató-helyettese előadást tartott arról, hogy a webhistoriográfia, vagyis az archivált webtartalmak kutatása ugyanolyan önálló segédtudománnyá fog válni, mint amilyen az oklevéltan vagy a címertan.

Végezetül Parti Ádám, az Országgyűlési Könyvtár csoportvezetője az állami és kormányzati online tartalmak megőrzésének külföldi gyakorlatát mutatta be, és külön kiemelte, hogy az ausztrál PANDORA archívumban a weboldalak mellett, a kormánytagok nyilvános Twitter üzeneteit, és a helyi önkormányzatok üléseiről interneten sugárzott videókat is gyűjtik.

A rendezvény egy kerekasztallal zárult, melyen a könyvtárosok mellett múzeumi és levéltári szakemberek beszélgettek egymással és a közönséggel a digitálisan születő tartalmak megőrzésének fontosságáról és lehetőségeiről.

Az előadások prezentációja hamarosan elérhető lesz a projekt oldalán.

Az OSZK-ban az internetes források hosszú távú megőrzését célzó kísérlet informatikai hátterét a Kormányzati Informatikai Fejlesztési Ügynökség biztosítja. 

img_3851.jpg

Az értékmentő munkába már most bárki bekapcsolódhat úgy, hogy ezen az űrlapon keresztül javasol kevésbé ismert, de megőrzésre érdemes fontos magyar webhelyeket. Köszönjük a segítséget!

Drótos László

komment

A bejegyzés trackback címe:

https://nemzetikonyvtar.blog.hu/api/trackback/id/tr8514375701

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.