A 2024. szeptember 9–11 között a Spliti Egyetem Bölcsészet- és Társadalomtudomány Karán megrendezett konferencia mottója az örökség és innováció volt. A bemutatott projektek, előadások és beszélgetések központi témái az új technológiák alkalmazása, az etikai kihívások, a kutatástámogatás, valamint a lehetséges jövőbeli kutatási irányok voltak.
A DARIAH-EU idén ünnepli fennállásának 10. évfordulóját, így egy évtizedes távlatból tekint vissza a digitális bölcsészet diszciplínájának jelentős változásaira, amelyet a technológiai fejlődés, a társadalmi és kulturális változások, valamint a kutatási infrastruktúrák fejlődése befolyásol.
A Spliti Egyetem Bölcsészet- és Társadalomtudomány Kara
A konferencia nulladik napján két workshop került megszervezésre. Az első workshopot a Dariah Theatralia munkacsoportjának társelnökei, Anamarija Žugić Borić és Cécile Chantraine Braillon tartotta. A csoport az előadóművészeti gyűjtemények digitális feldolgozásával és kutatásával foglalkozik. A workshopon az előadóművészeti anyagok metaadatainak leírására készülő sémát mutatták be, amelyhez a Dublin Core szabványát veszik alapul, valamint egy tezaurusz összeállításán is dolgoznak. Az eddig összeállított séma 55 tulajdonságot tartalmaz. A workshopon együtt gondolkodva, konkrét példákon keresztül néztük meg, mennyire alkalmazható a séma egyes anyagok pontos és részletes leírására.
Közös munka a workshopon. A kép forrása: A DARIAH-HR Facebook-oldala
A második workshopot Benedikt Perak, filológus, korpusznyelvész és adattudós, a Rijekai Egyetem adjunktusa tartotta a nagy nyelvi modellekről (LLM). A workshop a nagy nyelvi modellek hasznosíthatóságára fókuszált a digitális bölcsészet területén belül, rámutatva a gépi tanulás folyamatára és a neurális hálók működésére. Olyan gyakorlati példákkal foglalkoztunk, hogy hogyan tudunk a megfelelő prompt szöveggel egy folyószövegből strukturált adatbázist generálni, névelem-felismerést végezni, lexikai kapcsolatokat feltárni. A gyakorlatoknál a ChatGPT-4o, a Claude 3.5 és a LLaMA 3.1 nyílt hozzáférésű chatbotokat használtuk, így alkalmunk volt összehasonlítani ezek hatékonyságát is. Ezek mellett a Future Tools gyűjtő platformot is megismertük, ahol az MI-alapú eszközök széles tárháza sorakozik fel. Perak megmutatta a legmodernebb API-alkalmazásokat is, amelyek megkönnyítik e nyelvi modellek integrálását a különböző digitális bölcsészettudományi projektekbe.
Benedikt Perak, a Rijekai Egyetem adjunktusának előadása a nagy nyelvi modellekről (LLM) a Digitális bölcsészet és Örökség (Digital Humanities and Heritage) című nemzetközi konferencián
Az első napon Sally Chambers, a Dariah-EU igazgatója nyitóbeszédében a szervezet tíz éves működését és eredményeit foglalta össze. A Dariah célja a kutatások digitális módszerekkel való támogatása, a tudás összekapcsolása és megosztása, valamint a közgyűjteményi együttműködés lehetővé tétele. Ehhez kapcsolódóan olyan megvalósult vagy folyamatban lévő projekteket emelt ki, melyek elősegítik ennek a küldetésnek a megvalósulását. Néhány példa: Common European Data Space [Európai adattér] célja a biztonságos, egységes és szabályozott digitális környezet megteremtése az adatok megosztására és felhasználására; Collaborative Cloud for Europe's cultural heritage [Együttműködési Felhő] az európai kulturális örökség digitális megőrzését és hozzáférhetőségét szolgáló kezdeményezés, amelynek célja, hogy egy közös digitális platformot hozzon létre az örökségvédelem, kutatás és oktatás számára; Social Sciences & Humanities Open Marketplace [a Társadalomtudományok és Humán Tudományok Nyílt Piactere] különböző eszközök, adatok, források és szolgáltatások gyűjtőhelye a társadalomtudományok és a humán tudományok területén dolgozók számára. További projektekről a Dariah oldalán olvashatunk.
A Digitális bölcsészet és Örökség (Digital Humanities and Heritage) című nemzetközi konferencia megnyitója
A konferencián részt vettek Ausztria, Belgium, Finnország, Olaszország és Horvátország Dariah-képviselői, akik bemutatták, hogyan működik a DARIAH országos szinten. Olyan intézményközi együttműködések eredményezte jó gyakorlatok és platformok kerültek bemutatásra, mint az Ekultura, ami a horvát közgyűjteményi anyagokat teszi közzé; a CLARIAH-AT, ami az osztrák egyetemek és kutatóintézmények együttműködését teszi lehetővé a digitális bölcsészeti kutatásokhoz. Finnországban az évente megrendezett digitális bölcsészeti hackathon a finnországi és külföldi egyetemek bölcsészettudományok, társadalomtudományok és számítástechnika hallgatóit és kutatóit hozza össze, hogy másfél héten keresztül különböző csoportokban aktívan együttműködjenek. Belgiumban többek között az ESFRI európai fórumban való részvétel segíti elő a kutatási infrastruktúrák fejlesztését és koordinálását.
Minden nemzeti együttműködés országonként különböző kihívásokkal néz szembe, azonban a jelenlévők egyetértettek abban, hogy a hosszú távú anyagi támogatás lényeges ahhoz, hogy hosszú távú vízióink legyenek a fejlesztésekkel kapcsolatban, mivel egy projekt lezárása után is fenn kell tartani a rendszereket, és a folyamatosan változó digitális infrastruktúrában biztosítani kell a fejlesztéseket. Abban is egyetértés volt, hogy az együttműködés nagyon fontos, nemcsak országon belül, hanem nemzetközi szinten is, ezáltal sokkal hatékonyabban lehet eredményeket elérni, és egységesebb infrastruktúrákat kialakítani. Nem utolsósorban a felhasználói, kutatói igényeket is folyamatosan szem előtt kell tartani.
Második nap Neven Jovanović, a Zágrábi Egyetem Bölcsészet- és Társadalomtudományi Karának latin nyelv professzora tartott izgalmas előadást, amelyben néhány évtized távlatából tekintett vissza a filológiai kutatások változásaira, amit a digitális átalakulás eredményezett. Kiemelte, hogy a digitális technológiák használatával megváltozott a filológiáról való felfogása. A szövegek TEI XML-formátumban való feldolgozása tulajdonképpen a tudás számítógépes formába való transzformációját jelenti, ahol az adatközpontúság, a statisztikai megközelítés és a távoli olvasás érvényesül. Jovanović felhívta a figyelmet a nagy nyelvi modellek használatára, ahol a használt rendszerek és eszközök működésének megértése és a kritikai gondolkodás lényeges.
Az előadások során izgalmas projektekkel is megismertetésére is sor került. Ana Mihaljević és Josip Mihaljević a DigiSTIN projektet és az ehhez kapcsolódóan fejlesztett stin.hr weboldalt mutatták be, amelynek segítségével a horvát glagolita írás és az egyházi szláv nyelv tanulásához lehet oktatási anyagokat készíteni. Az oldalon elérhetőek a forrásanyagok, amelyet a Transkribus kézírásfelismerő szoftverrel állítottak elő, emellett a tanulóanyag mellé készítettek glagolita puzzle-t, kígyójátékot, kvízeket és memóriajátékokat.
Alessia Spadi előadásában megismerhettük az olaszországi Dariah-IT tevékenységeit, amelynek egyik érdekes fejlesztése a MetaFAD platform, egy szabadon elérhető szoftver, amely lehetővé teszi közgyűjteményi intézmények különböző archívumainak és gyűjteményeinek leírását egyetlen integrált környezetben. Az előadásban a keretrendszer kidolgozásáról és a munkafolyamatokról is részletes bemutatót hallhattunk. Fontos, hogy a fejlesztés tesztelése során az egyetemistákkal és kutatókkal folyamatosan tartották a kapcsolatot, hogy felmérjék az igényeket a funkciókkal és megjelenítéssel kapcsolatban.
Szintén izgalmas projektet mutatott be Nataša Jermen, a zágrábi Miroslav Krleža Lexikográfiai Intézet kutatási és intézményközi együttműködésért felelős igazgatóhelyettese, amely az intézet nyomtatott enciklopédia-gyűjteményének digitális közzétételéről szólt. A Horvát Enciklopédia weboldala jelenleg több mint 71 000 szócikket tartalmaz. A digitális technológia fejlődése alapvetően meghatározza az enciklopédiák kiadását is, az online, szabad hozzáférésű, könnyen kereshető kiadások felé. A fejlesztés lényeges része a rendszer rugalmassága, ami lehetővé teszi az utólagos javításokat (az előadásból az is kiderült, hogy kiadás előtt több ezer szakember dolgozott a szövegkorrektúrán) és a kapcsolódó, külső források (pl. könyvtári, múzeumi anyagok) szócikkekkel való összekötését.
A konferencián sor került egy poszter-szekcióra is. Az elkészült munkák a Dariah-HR oldalán érhetők el.
Varga Emese, a Digitális Bölcsészeti Központ munkatársa a Digitális bölcsészet és Örökség (Digital Humanities and Heritage) című nemzetközi konferencián poszterével. A kép forrása: A DARIAH-HR Facebook-oldala
Poszteremmel a közgyűjteményi anyagok adatainak és metaadatainak felhasználási lehetőségeit, az adatvizualizációk készítésének munkafolyamatát és hasznosíthatóságát mutattam be. A plakát három vizualizációs módszert állít fókuszba: a levelezési adatokon alapuló térképes vizualizációt és kapcsolati hálózatot, illetve a szövegkorpuszok stilometriai elemzésén alapuló konszenzushálót. A bemutató több érdeklődőt is inspirált, akikkel arról beszélgettünk, hogyan hasznosíthatóak az alkalmazott eszközök és metódusok olyan közgyűjteményi anyagok feldolgozására, mint például a személyi hagyaték és a színháztörténeti gyűjtemények.
Varga Emese (Digitális Bölcsészeti Központ)