A nyílt archívumi információs rendszer (OAIS) szabványának honosítása

2022. április 11. 06:00 - nemzetikonyvtar

kezdokep_opti.jpg

Az MSZ ISO 14721:2022-es szabvány. Fotó: Biró Bettina, Könyvtártudományi Szakkönyvtár

A tartalom- és kulturális ipar egyik legfontosabb kortárs kihívása a hosszú távú megőrzés. Az elmúlt évek vonatkozásában gyakorlatilag nem beszélhetünk a kulturális szférában a kulturális javak megőrzése területén olyan konferenciáról vagy szakmai eseményről, amely során ne került volna elő a címben szereplő szabvány.

De mi is az a hosszú távú megőrzés és miért fontos?

mzper_x_opti.jpg

MZ/X, az Üzenet a jövőből – A Mézga család különös kalandjai című rajzfilmsorozat szereplője – Wikipedia

Feltételezem, a kedves blogolvasók többségének nem kell bemutatni Öcsit, vagyis MZ/X-et, az egykori híres rajzfilmsorozatból, a Mézga család messzi jövőbeni leszármazottját. Eljátszhatunk a gondolattal, hogy  vajon mi teszi majd lehetővé Öcsi számára, hogy hozzáférjen bármilyen, a mi korunkból – sőt a minket megelőzőkből – származó információhoz, dokumentumhoz. Erre a megoldás a hosszú távú megőrzés!
A hosszú távú megőrzés – mily meglepő! – az archiválandó információ, kultúrkincs – vagy bármi egyéb, amit meg kívánunk őrizni az utókor számára – meg nem határozott időtartamú időtávra történő megőrzését és szolgáltatását jelenti. Ez a feladatkör nem új keletű, pontosan ez a mindenkori könyvtár, levéltár, irattár, múzeum és egyéb emlékezetmegőrző intézmény egyik elsődleges feladata.

book-pxbay_opti.jpg

Régi könyvek – A kép forrása: Pixabay, blende12 fotója

Egészen a közelmúltig a hosszú távú megőrzés adathordozója a papír volt és marad is még nagyon sokáig. Az ókori könyvtárak óta eltelt több mint ezer esztendő, illetve a mai könyvtárak, levéltárak évszázadokkal ezelőtt alapított képviselői és jogelődjei okán tudjuk jól, hogy a papír – a megfelelő tárolási körülmények biztosításával – hosszú életű adathordozónak bizonyulnak.

adathordozok_opti.jpg

Adathordozók. A kép forrása: Canva –  Könyvtártudományi Szakkönyvtár, Biró Bettina (szerk.)

Mi a helyzet azonban az azóta feltalált adathordozókkal? Jelentős részük 20. századi találmány, gondoljunk csak az orsós magnószalagra, a mikrofilmre, az audio- és videokazettákra, hajlékonylemezekre, a CD-re, DVD-re, majd Blue Ray optikai lemezekre, sőt manapság a szerverparkokra és egyéb háttértárakra. Ezen adathordozók közül nem egynek megértük néhány évtized alatt a bevezetését, felfutását, elterjedését, majd elavulását és partvonalra kerülését. A fizikai adathordozók azonban csak a mérleg egyik fele, jelentős kihívás még a hosszú távú megőrzés terén az azokat működtető rendszerek meglétének esetleges hiánya. Hiába tárol egy archívum például floppylemezeken évtizedek óta gondosan valamilyen információt, gondban van, ha nincs már olyan számítógépe, amely rendelkezne hajlékonylemez-meghajtóval, sőt már az optikai meghajtó is egyre ritkább. Minél régebbi típusú adathordozón van az információ, annál nehezebb működő (karbantartható) lejátszó- vagy olvasóeszközt találni hozzá. És akkor még nem is beszéltünk a fájlformátumok és az operációs rendszerekkel történő szoftverkompatibilitás kérdésköréről, nem is említve az úgynevezett born digital, tehát az eleve digitális környezetben létrejövő dokumentumok megőrzésének, sőt a webarchiválásnak a kérdéseit.
Az imént felsorolt formátumok és dokumentumtípusok képezik a papírformátum melletti új dimenziót a hosszú távú megőrzés feladatában. Ezek megőrzésével ugyanúgy foglalkozniuk kell az emlékezet megőrzésével foglalkozó szervezeteknek, mint a papírformátumú dokumentumokéval. Az ilyen, többnyire elektronikus dokumentumok megőrzése nem merül ki a fájlok háttértárra pakolásában. Az információt bitenként kell megőrizni, illetve valamilyen formában fent kell tartani azt az eredeti működési környezetet, amelyben anno az az információ olvasható, értelmezhető volt. Hogy ez többek között emulációval, a régi gépek üzembetartásával, vagy folyamatos formátumról formátumra tartó migrációval vihető végbe, az már a gyakorlati megvalósítás kérdéskörébe esik, és nagyban függ az adott archívum preferenciáitól. Érdekes szempont még a megőrizendő dokumentum értelmezési kontextusának megőrzése: adva lehet egy már ma is történelmi jelentőségű dokumentum, amit megőrizhetünk akár digitális formában, akár valamilyen igen tartós fizikai adathordozóra rögzített formában is. Igen ám, viszont a műszaki jellegű megőrzés/tárolás mellett érdemes feltüntetni olyan információkat, mint például: milyen nyelvű az adott dokumentum (ki tudja, hátha holt nyelv lesz az a bizonyos nyelv egy vagy több évszázad múlva), mi célból készült, kik készítették, milyen technológiával. Tegyük fel, egy írógéppel írt kézirat digitális példányáról van szó. Mi az az írógép, teszik fel talán majdani kollégáink a kérdést… ki tudja, sok-sok kutatóórát megspórolna, ha nem kellene a majdani történettudománynak azzal is foglalkoznia, hogy megfejtse a „rejtélyes írógép” titkát…

spaceshuttle_opti.jpgŰrrepülőgép. NASA.gov képarchívum. April 29, 1990, Shuttle Discovery Lands Following Deployment Mission

Többek között ezek tekinthetők a hosszú távú megőrzés kihívásainak. A ma általánosan e cél megoldására szolgáló koncepció azonban nem a kulturális szférában fogant meg, hanem az űrkutatásban.
Amint a hetvenes években véget ért a hidegháborús űrverseny, a hangsúly fokozatosan átterelődött az egész bolygó tudományos fejlődését szolgáló űrkutatásra, és, bizony, igény mutatkozott arra, hogy az űrmissziók során begyűjtött fizikai és elektronikus adatokat valamilyen szabványos formában őrizzék meg a tudomány és az utókor számára. Szükség volt egy időtálló fogalmi modell létrehozására, amely az aktuális technológia korlátozta implementációktól függetlenül ad útmutatást a hosszú távú megőrzés elméletéhez. A NASA vezetésével egy 1997-es fehér könyvben dolgozták ki a nyílt archívumi információs rendszer referenciamodelljének első változatát, majd az űrkutatás nemzetközi szabványosítási kérdéseivel foglalkozó Űradatrendszerek Tanácsadói Bizottsága (CCSDS) égisze alatt jelent meg az első OAIS-standard 2002-ben. Ekkorra ez a konceptuális modell már messze túlnőtt az űrkutatás területén, és már az ezredforduló környékén számos nemzeti könyvtár (köztük például az ausztrál nemzeti könyvtár) foglalkozott a modellel, úgy is, mint a hosszú távú megőrzés problémájának potenciális megoldásával. Ezen igényekre reflektálva a Nemzetközi Szabványügyi Szervezet (ISO) ISO 14721 hivatkozási szám alatt változtatás nélkül, nemzetközi szabványként bevezette a CCSDS standardját. Amikor 2012-ben felülvizsgálták a modellt, az ISO is követte, így jutottunk el a jelenleg is hatályos ISO 14721:2012 szabványig, amelynek magyar változata idén márciusban jelent meg.

oais_magyar_opti.jpg

Ilácsa Szabina és Bódog András (KöSZI) ábrája az MSZ ISO 14721:2022 szabvány alapján

Az OAIS-ban az információkat több fájlból álló, úgynevezett információs csomagokban tárolják. Ezekben a megőrzendő tartalmat a reprezentációs információ egészíti ki, biztosítva mindazon plusz információkat, amelyeket a hosszú távú megőrzés követelményeinél már említettem. Például, ha egy CD-ROM tartalmát archiválják, nemcsak azt mellékelik reprezentációs információként, hogy tulajdonképpen mi is az a CD-ROM, hanem a szabványos műszaki specifikációt is megnevezik, jelen esetben az azt leíró szabványt. Hasonló reprezentációs információ a megőrzendő tartalom nyelve is, amely mellé adott esetben akár szótárat is csatolhatnak. Az OAIS három különböző típusú információs csomagban őrzi meg az információt: az átadási információs csomagot (SIP) a létrehozó adja át az archívumnak, amely azt leíró információkkal gazdagítja, majd egy vagy több megőrzési információs csomag (AIP) formájában kerül hosszú távú tárolásra. Az AIP-okból lehet előállítani a felhasználói igény szerint szolgáltatott disszeminációs információs csomagokat (DIP). Nagyon röviden ez volna az OAIS archívum konceptuális modelljének vázlata és térjünk is át a szabvány honosítására…

koszi_logo_opti.jpgAz OSZK Könyvtári Intézet részeként működő Könyvtári Szabványosítási Iroda logója

Mivel az Országos Széchényi Könyvtár egyik missziója a hosszú távú megőrzés, és a Könyvtári Szabványosítási Iroda feladata az OSZK és a hazai könyvtárszakma szabványügyi támogatása, ezért az Országos Könyvtári Szabványosítási Bizottság feladatául tűzte ki e fontos szabvány magyar nyelvre történő átültetését. Az OAIS már évek óta széles körben használt szabvány – elsőként a Magyar Nemzeti Levéltár valósította meg a teljes körű implementációját hazánkban, amikor e modellre alapozta az elektronikus levéltár hátterét. Sok mindenki használja tehát szabványként, azonban nem rendelkezik a terület egységes magyar szakszókinccsel – jobb híján a kollégák saját igényeikhez szabva-igazítva magyarították –, ezért a honosítással lehetőség kínálkozik egy szakterülettől és szakmától független egységes terminológia megalapozására. Sokszor halljuk a „SIP-csomag”, „DIP-csomag” kifejezéseket a különböző szakmai rendezvényeken, így a szabványtárgyalás folyamán úgy véltük, hogy ezt a szóhasználatot tükrözve célszerű lenne ezeket a betűszavakat magyaros kiejtéssel honosítani. Így lett a modell neve is az ISBN és az ISSN példáját követve OAIS (ejtsd: fonetikusan oais). Reményeink szerint a magyar nyelvű szabvány egyfajta hivatkozási alapként is szolgál majd bárki számára, aki saját hosszú távú megőrzési projektbe kezdene, vagy érdeklődne a téma iránt.

oais_szabvany_opti.jpg

Az MSZ ISO 14721:2022-es szabvány. Fotó: Biró Bettina, Könyvtártudományi Szakkönyvtár

Az idén március 1-én megjelent MSZ ISO 14721:2022 szabványt a Magyar Szabványügyi Testület MB 508 Információ és dokumentáció nemzeti szabványosító bizottsága honosította. A szabványtárgyaláson az OSZK, a Digitális Bölcsészeti Központ, illetve a Magyar Nemzeti Levéltár szakemberei vettek részt. A magyar nyelvű kiadás elkészítéséhez az OSZK járult hozzá. Mivel az angol nyelvű eredetit változtatás nélkül vette át az ISO, azt forgatva bizony kitűnik az űrkutatási célú felhasználás. Talán éppen ezért, nem épp a legkönnyebb a szabvány szövege, ráadásul a szabványtárgyalás során – ahol gyakorlatilag szóról szóra végigvitattuk a nyersfordítást az eredeti tükrében – számos kisebb ellentmondást is felfedeztünk. Többek között az alkalmazott terminológia sem volt teljesen egységes a CCSDS eredeti kiadásában. Ezért tehát a magyar nyelvű szabvány nemzeti előszavában ezen ellentmondások felsorolása mellett az MSZT értelmezési segédlettel szolgál a szabványalkalmazás megkönnyítésére. A szövegtestben a referenciamodell „építőkockáit” eltérő formázással jelöltük, így a szakkifejezések mindig félkövérek, a funkcionális entitások pedig csupa NAGYBETŰSEK. További segédlet az OAIS által meghatározott szakkifejezések magyar betűrendes mutatója, ugyanis a szabványhonosításnál a fordításnak meg kell egyeznie az eredetivel, így meg kellett tartani az angol betűrendet a definícióknál. A szabvány – az összes többi MSZ-szabványhoz hasonlóan – elérhető az MSZT szabványboltjában, illetve a mintapéldány kölcsönözhető is az OSZK-n belül működő Könyvtártudományi Szakkönyvtár gyűjteményéből.

Felhasznált források:

Bódog András (Könyvtári Intézet, Könyvtári Szabványosítási Iroda)

komment

A bejegyzés trackback címe:

https://nemzetikonyvtar.blog.hu/api/trackback/id/tr8817800999

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

süti beállítások módosítása