Első nap – április 12.
2023. április 12. és 14. között a veszprémi Pannon Egyetem adott otthont a 32. Networkshop konferenciának. A HUNGARNET Egyesület, a Neumann Technológiai Platform és az Eötvös Loránd Kutatási Hálózat szervezésében megvalósult rendezvény ismét a tudomány, az informatikai ipar és a kultúra közötti párbeszédnek adott teret.
A konferencia kiemelt témája az oktatást, tudományos és közgyűjteményi szférát érintő digitális transzformáció kérdésköre volt. A rendezvény megnyitóján dr. Tick József, a HUNGARNET Egyesület elnöke emlékeztetett arra, hogy a konferencia – ahogyan a neve is tükrözi – először a hálózatról szólt, mára széles palettát ölel fel, számos területről érkeztek előadók. Három nap alatt 116 előadás hangzott el és több mint 300 résztvevő követte a rendezvénysorozatot az online és offline térben. Könyvtárunk munkatársai közül többen beszámoltak az elmúlt év fejleményeiről az előadások valamint a poszter-szekció keretében.
A Digitális Bölcsészeti Központ munkatársai (Makkai T. Csilla, Tamásné Kovács Adrienn, Kalcsó Gyula, Szűcs Kata Ágnes, Varga Emese, Mihály Eszter)
A hivatalos megnyitó és a köszöntő beszédek után plenáris előadásokat hallgatunk. A nyitó plenáris előadást dr. Abonyi János, a Pannon Egyetem általános és tudományos rektorhelyettese tartotta. Előadásában kifejtette, hogy hogyan készülhet az adatokból hálózat, a hálózatból pedig tudás. Szó volt a relációs adatbázis, illetve gráfadatbázis közötti különbségről, a Dbpedia-adatbázis és az RDF-adatstrukturák felhasználhatóságáról, valamint arról is, hogy hogyan lehet előrejelzéseket, javaslatokat tenni a gráfok értelmezése alapján.
Dr. Lovas Róbert, az ELKH Cloud projektigazgatója, beszámolt a 2016-ban indult projektről, melynek elsődleges célja, hogy a magyar tudományos közeget támogassa a kutatáshoz szükséges e-infrastruktúrával. 2020-ban kezdett bővülni, megduplázódott a befogadott projektek száma. Elsősorban az ELKH kutatói, kutatócsoportjai, valamint hazai egyetemek és ipari cégek fejlesztői használják a tárterületet és infrastruktúrát. Az ELKH Cloud egyszerre tárhelyet és számítási kapacitást is biztosít, de a legújabb szolgáltatás, a nemzetközileg is ritkaságnak számító kvantumszámítási erőforrások elérése az ELKH Cloud felhasználói számára.
Ritter Dávid Hol tartunk ma? című előadása a jelenkor kihívásairól szólt. Azzal indított, hogy kissé szkeptikus hangulatú lesz az előadása, bár 15. alkalommal ad elő a Networkshopon, a szektorban végbemenő változások gyorsasága és mélysége aggodalommal tölti el, hiszen felmerül a kérdés, hogy az érintettek mennyire lesznek képesek tartani a lépést a változásokkal? Szakmai véleménye, hogy a legfontosabb teendő az oktatás digitalizálása, erre alakítanak ki stratégiákat az ELTE Digitális Oktatási Kompetencia Központban. Véleménye szerint a kutatás helyzete ad legkevésbé okot az aggodalomra, viszont az adatvagyon felhasználása/hasznosíthatósága tekintetében le van maradva Magyarország. Az már látható, hogy a közgyűjtemények felhő- és mesterségesintelligencia-használata, nyomja a teljes szektort a digitális transzformáció irányába.
Ezt követte a Hungarnet-díj átadása, melyet az Egyesület adományoz Magyarországon tevékenykedő szakembereknek, akik kiemelkedő teljesítményt nyújtottak a hálózati műszaki fejlesztés, tartalomszolgáltatás, vagy a két terület menedzsmentje területén. 2023-ban Hungarnet-díjban részesült könyvtárunk volt munkatársa, Bánki Zsolt, valamint Hungarnet-különdíjat kapott Ungváry Rudolf, a nemzeti könyvtár Széchényi-emlékéremmel kitüntetett nyugalmazott munkatársa.
A konferencia kiemelkedő beszélgetése volt, a Mesterséges intelligencia a közgyűjteményekben című kerekasztal-beszélgetés, melynek koordinátora Bánki Zsolt, a Magyar Nemzeti Levéltár Digitális Szolgáltatásfejlesztési Osztályának vezetője volt. A vitaindító előadást Szatucsek Zoltán, a Magyar Nemzeti Levéltár Információs és Innovációs igazgatóságának vezetője tartotta, aki arról beszélt, hogy milyen kihívások elé állítja a mesterséges intelligencia a közgyűjteményeket. Ezt követően Kómár Éva, a Magyar Nemzeti Múzeum Országos Muzeológiai Módszertani és Információs Központ főosztályvezetője, Répászky Lipót, az MTVA Archívum osztályvezetője, Holl András, az MTA KIK főigazgató-helyettese, valamint Molnár Sándor, az SZTE Klebelsberg Könyvtárának osztályvezetője osztotta meg a résztvevőkkel a képviselt intézmény gyakorlatait, megoldásait, a mesterséges intelligencia felhasználási területeit. Ezek nyomán élénk beszélgetés alakult ki a résztvevők kérdéseivel és javaslataival kiegészülve.
A kerekasztal-beszélgetés résztvevői
Második nap – április 13.
A csütörtöki nap előadásai könyvtárunk képviseletében kezdődtek. Kardos András az új MEK fejlesztéseihez kapcsolódóan az új szűrők, a különböző médiatípusok és a térképes megjelenítés lehetséges funkcióiról beszélt. A LibMate könyvtári rendszer elindulásáról és bevezetéséről az OSZK Digitális Bölcsészeti Központjának igazgatója, Tamásné Kovács Adrienn és a KSH Könyvtár főigazgatója, Kálmán Rita tartottak beszámolót. A felhő alapú szoftver egy olyan integrált könyvtári rendszert tesz lehetővé, amelyet több könyvtár, illetve könyvtári struktúra használhat. Elsőként a KSH Könyvtárban adaptálták az új rendszert, így az átállás folyamatáról és az olvasók kezdeti tapasztalatairól is kaptunk beszámolót.
Ezt követően Rózsa Dávid főigazgató tartott előadást az elmúlt év fejlesztéseiről, eredményeiről a digitalizálás és hosszú távú megőrzés, illetve tartalomszolgáltatás kapcsán, kiemelve a COPIA tartalombővítését, illetve a Bibliotheca Corvina Virtualis honlap gyarapodását. Emellett szó esett olyan kiemelkedő könyvtári szolgáltatások fejlesztéseiről és elindulásáról, mint a Magyar Nemzeti Névtér, a LibMate, a Kultstat és a MOKKA-R.
A főigazgató úr által említett projektekről a nap további felében bővebben is hallhattunk. Tamásné Kovács Adrienn és a Nemzeti Örökség Intézetének munkatársai a Nemzeti Névtér felületét, funkcióit mutatták be. Mészáros Tamás és Kukár Barnabás Manó az elmúlt év digitalizálási eredményeiről és terveiről számoltak be. Az OSZK-ban kialakított digitalizálási stratégia nemcsak intézményen belül működő rendszer, hanem más intézményeknek is szakszerű ajánlásként szolgál. Így például a Pannon Egyetemmel kötött együttműködési megállapodásban a könyvtár az egyetem muzeális különgyűjteményének digitalizációs, hosszú távú megőrzési és tartalomszolgáltatási munkafolyamataihoz járul hozzá.
Tamásné Kovács Adrienn bemutatja a Nemzeti Névtér felületét
Az elmúlt években egyre nagyobb teret kapnak a konferencián a digitális bölcsészeti témájú előadások. A délutáni szekcióban Szekrényes István tartott előadást a DH-LAB új, automatikus kézírás-felismertető modelljéről. Ismert, hogy könyvtárunk Digitális Bölcsészeti Központjában tavaly jelent meg az első magyar kézírás-felismerő modell a Transkribus nevű szoftver komponenseként. A Nemzeti Laboratórium nyílt forráskódú keretrendszerek beépítésével (többek között a Microsoft által fejlesztett TrOCR eszközt, illetve a P2Pala és Kraken szövegszegmentáló szoftverek forráskódját felhasználva) dolgozik saját modell építésén.
Mihály Eszter, az OSZK DBK osztályvezető helyettese és Micsik András, a SZTAKI munkatársa a TEI alapú digitális szövegkiadások szerkesztői környezetét, az ún. framework-öt mutatták be, amely jelenleg is fejlesztés alatt áll. Ez egy olyan letisztult felhasználói felület, amely lehetővé teszi a kutatók számára a digitális szövegkiadások szerkesztését. A framework eszköztárába többek között olyan automatizált MI-alapú műveletek is be vannak építve, mint az automatikus névelem-felismerés, külső névterekkel való összekötés, stb. A digitális szövegkiadások adatai pedig interaktív vizualizációkon is megjeleníthetők. Ehhez kapcsolódik a DBK munkatársának, Szűcs Kata Ágnesnek az előadása, aki két adatvizualizációt: a magyar hírportálok orosz–ukrán háborús tartalmainak vizualizációját és Kiss József költő kapcsolati hálóját, illetve az ilyen típusú tartalomkészítés munkafolyamatát mutatta be.
Szűcs Kata Ágnes előadása
A konferencia külföldi példák és hazai projektek által széles körű betekintést nyújtott a különböző gyűjteményfeldolgozási stratégiákba, melyben egyre dominánsabban jelennek meg automatizálási folyamatok MI-alapú eszközökkel. Holl András az MTA KIK nyelvfeldolgozó projektjét mutatta be, melynek célja, hogy egy repozitóriumi gyűjteményt mint szövegkorpuszt nyelvtechnológiai és MI-alapú eszközökkel vizsgáljon. A jelenleg előkészítő fázisban lévő projekt célja a korpusz adatainak gazdagítása, javítása, szövegbányászat, Named entity extraction, MTMT-gazdagítás, nyelvmodellépítés. Könyvtárunk munkatársa, Bódog András egy külföldi jó gyakorlat bemutatásával szemléltette az Annif gépi tárgyszavazó rendszer magyarországi adaptációjának lehetőségeit. A finn fejlesztésű Annif gépi tárgyszavazó eszköz közgyűjtemények tartalmi feltárását teszi lehetővé. A rendszer alapja egy szabványos webantológia, melyből az algoritmusok tárgyszavakat ajánlanak, s ezeket a feldolgozó könyvtáros hagyja jóvá. Hubay Miklós Péter a BIBFRAME-szótár új fejlesztéseiről számolt be, melyet főként bibliográfiai forrásleírások készítésére és szolgáltatására használnak. Szintén felmerült a BIBFRAME implementációjának kérdése a PIM-ben, melynek elsődleges feltétele az entitásalapú katalogizálás lenne, illetve egy olyan könyvtári együttműködési kultúra kialakulása, amely egy nagyobb közös katalógust hoz létre.
A levéltári gyűjteményfeldolgozásról és adatgazdagításról Hegedűs István, a Nemzeti Levéltár Digitális Tartalomfejlesztési Osztályának vezetője és Bánki Zsolt, a Magyar Nemzeti Levéltár Digitális Szolgáltatásfejlesztési Osztályának vezetője számolt be. Hegedűs István külföldi jó gyakorlatokon keresztül mutatta be a levéltári gyűjtemények feldolgozásának lehetőségeit. A gyűjteményfeldolgozás célja a történeti forrásokban, összeírásokban, népszámlálásokban, anyakönyvekben található adatok entitásokkal való összekapcsolása. Hegedűs István kiemelte, hogy a külföldi módszertanok jó példákkal szolgálhatnak a saját korpuszok feldolgozásában, viszont hátrányt jelenthet, hogy nincsenek standard módszerek, így nehéz implementálni jó gyakorlatokat. Bánki Zsolt a földrajzi entitások azonosításáról és az adatgazdagítás munkafolyamatairól számolt be.
Az idei évi konferencia újítása volt a poszterszekció bevezetése, ahol kisebb projektek, esettanulmányok bemutatására került sor. Ebben a szekcióban is képviselve volt könyvtárunk a LibMate könyvtári rendszer bemutatásával, ahol Kálmán Rita és Tamásné Kovács Adrienn válaszoltak az érdeklődők kérdéseire. A többórás szekciók lehetővé tették egy-egy projekt részletesebb megismerését, és hosszabb párbeszédek kialakulását.
Harmadik nap – április 13.
A konferencia záró napjának egyik központi témája a digitalizált tartalmak és a digitálisan született (born digital) anyagok archiválása és hosszú távú megőrzése volt. Rényi Mátyás Attila könyvtárunk digitális megőrzési gyakorlatának kialakításáról, és eddigi eredményeiről számolt be. A PREMIS-modell alapelvei szerint haladva, és hazai ajánlásokkal kiegészítve, egy olyan rendszer kialakítása van folyamatban, amely egységes sémában kezeli a megőrzési metaadatokat.
A born digital anyagok archiválása egy egészen másfajta archiválási folyamat kialakítását igényli. Ennek kapcsán különböző intézményekben folyó projektek kerültek előtérbe. Az DBK Webarchiválási Osztálya egy nagyméretű levelezőlista, a Katalist e-mailjeinek archiválását kezdte el. A DBK Webarchiválási csoportjának vezetője, Kalcsó Gyula előadásában kiemelte az e-mailek strukturális összetettségét, amely megnehezíti az adatkinyerést, a különböző archiválási módokat, illetve a kinyert adatok felhasználásra, kutatásra alkalmassá tételének lehetőségeit. Az e-mail archiváláshoz kapcsolódóan a kutatói hagyaték feldolgozása is előtérbe került a Nemzeti Laborban zajló kísérleti projekt kapcsán, melyről Szemigán Dorottya Henrietta és Alföldi István számoltak be. A Kántor Lajos-hagyaték feldolgozásának célja a hosszú távú e-mail megőrzés gyakorlatának kialakítása és a metaadatok kinyerése volt.
A webarchiválás kapcsán Németh Márton a CEU OSA Archívumának projektjét mutatta be, kiemelve azokat a szempontokat, melyek egy weblevéltár archiválásánál fontosak. Két fő szempont került előtérbe: a kutatói igényeknek megfelelő webes tartalmak archiválása és az optimális szolgáltatás kialakítása. Emellett Németh Márton egy másik előadásában a WARCNET-projekt második évéről is beszámolt, melynek célja a webarchívumok kutatási célú felhasználásának segítése, a kutatók összekötése, közös projektek tervezése, a webarchiválás nemzeti közgyűjteményi gyakorlatainak összehasonlító tanulmányozása. Németh Márton a 2021–2022-es év főbb rendezvényiről és publikációs tevékenységekről beszélt, itt többek között említésre került a könyvtárunk Digitális Bölcsészeti Központja által elmentett orosz–ukrán sajtóhírgyűjtemény adatainak interaktív vizualizációs megjelenítése is.
A második szekcióban a digitális bölcsészeti projektek entitásainak adatbázisokkal való összekötése került fókuszba. Dobás Kata, Sidó Zsuzsa és Szabó-Reznek Eszter a DHLab-ban zajló többintézményes együttműködés keretében a Kolozsvári Állami Magyar Színház jelmezterveinek digitalizációját végzik. A projekt egyik fő célja, hogy a digitális másolatok és a leíró adatok több rendszeren keresztül elérhetővé váljanak és kereshetők legyenek. A digitalizált anyagok a Magyar Nemzeti Digitális Archívumon már elérhetők és tervben van az adatok Europeanaba való integrálása is. Egyfajta szemantikus hálózatba való rendezéssel a projekt azt is megcélozza, hogy a leíró adatokhoz kapcsolódó szövegkönyvet, színházi előadásokat, fotókat is hozzákapcsolja. Emellett Dobás Kata egy másik előadásában az ITIdata fejlesztéséről is beszámolt, amely jelenleg több irodalomtudományi projekt entitásait foglalja magába, ilyen például a BTK ITI-ben zajló sajtóadatbázis, melynek metaadatait szintén az ITIdataban rögzítették.
A háromnapos, tartalmas konferencia záró plenárisán Bánki Zsolt, a Magyar Nemzeti Levéltár Digitális Szolgáltatásfejlesztési Osztályának vezetője és Dr. Vonderviszt Lajos, a Pannon Egyetem munkatársa foglalták össze észrevételeiket. Bánki Zsolt kiemelte, hogy érzékelhetően egy paradigmaváltás közelében járunk: az új technológiák és a mesterséges intelligencia alkalmazása több különböző szakmai területen, már megvalósult alkalmazásokkal reprezentálódott a konferencián. Megfigyelhető ugyanakkor az is, hogy a korábbi könyvtáros dominancia évről évre sokszínűbbé válik és a közgyűjteményi intézmények most már egyre szélesebb körben reprezentálják magukat. Szakmailag az elmúlt években a digitális bölcsészet új területként jelent meg, amely mára már integrálódott tudományterület lett.
Dr. Vonderviszt Lajos, a Pannon Egyetem Tudás- és Technológiatranszfer Központjának vezetője elsősorban a konferencia műszaki témájú előadásait értékelte. Szerinte idén a nagyobb fejlesztői projektek voltak előtérben, illetve a biztonsági kérdések, az energiahatékonyság problémája is előtérbe került. Jelentős szerepet kapott a mesterséges intelligencia integrálása is, ami nagy változásokat hozott szakmai és nem szakmai téren is.
2023. április 12. és 14. között a veszprémi Pannon Egyetem adott otthont a 32. Networkshop konferenciának.
Összességében elmondható, hogy a konferencia idén is színvonalas és sokszínű előadásokat sorakoztatott fel. Mi elsősorban a digitális bölcsészetet érintő témákból próbáltunk minél nagyobb merítést venni, de a párhuzamos szekciókban zajló előadások miatt még így is sok előadás kimaradt. Mindenképp elmondható, hogy a konferencia szakmailag inspiráló élmény volt, jó lehetőség új ismeretségek kötésére, erősítésére és új projektek körvonalazódására. Sok előadás kapcsán elhangzott az intézményközi együttműködések kiépítésére, erősítésére való igény, amely elengedhetetlen lenne bizonyos könyvtári rendszerek, egységes névterek és különböző innovációs eszközök fejlesztéséhez, kialakításához. A kommunikáció elindítására a konferencia jó kiindulópont lehet.
Makkai T. Csilla, Varga Emese
(Digitális Bölcsészeti Központ, Digitális Filológiai és Webarchiválási Osztály)