Transkribus User Conference 2022

2022. december 09. 06:00 - nemzetikonyvtar

Konferenciabeszámoló

2022. szeptember 29–30-án Innsbruckban rendezték meg 2020 óta második alkalommal a Transkribus felhasználói konferenciát (Transkribus User Conference ).
A Transkribus történelmi dokumentumok digitalizálására, a digitalizált kéziratok szövegének mesterséges intelligencián alapuló felismerésére, a szövegek manuális átírására, annotálására és keresésére alkalmas nyelvtől független platform.

A Transkribus User Conference megnyitója

Az eseményt a Transkribus-platform használói és fejlesztői számára szervezték és kettős céllal ültünk össze. Az első nap hangsúlyos részét képezte, hogy a platform szerkesztői és fejlesztői beszámoltak azokról az újdonságokról, amelyek eddig és a közeljövőben érintik majd a már megszokott Transkribusos környezetet. Másrészt pedig teret adott annak, hogy maguk a felhasználók, egyének, kutatócsoportok, ösztöndíjasok, és tagintézmények képviselői beszámoljanak arról, hogy hol tartanak a kutatási és egyéb Transkribust érintő projektjeikben. A két nap feszes programját az eddigieken túl poszterszekciók és workshopok is tarkították. A konferencia előadásai visszanézhetőek, mivel folyamatosan kerülnek feltöltésre a READ COOP SCE Youtube-csatornájára.
A Transkribust is működtető READ COOP nevű szervezet pályázati lehetőséget nyújt egyéni kutatók, tanítást vállaló intézmények, vagy kisebb csoportok számára. A sikeres pályázók projektenként változó mennyiségű ingyenes krediteket kapnak, melyet kéziratok felismertetésére tudnak fordítani. A szoftver többi funkciója pedig ingyenesen hozzáférhető bárki számára. Az idei TUC-konferencián külön szekciót biztosítottak az ösztöndíjasok számára, hogy beszámolhassanak eredményeikről, visszajelzést kapnak munkájukról, egyben lehetőséget a problémák megvitatására és a tapasztalatok megosztására. Sokan készültek teljes munkafolyamatot bemutató projektbeszámolóval, amelyekből megtudhattuk, hogy mások hogyan, és a szoftver mely funkcióit használják sikerrel.

Szűcs Kata az automatikus kézírás-felismertetés eredményeit ismerteti a poszterszekcióban

Az érdeklődők a poszterszekciók alatt specifikus problémákat boncolgató projektekkel ismerkedhettek meg, többek között azzal, hogy milyen tapasztalatokat szereztünk a magyar kézírás-felismerő modell építésével kapcsolatban.
A poszter digitális változata elérhető az alábbi oldalon is.

Szűcs Kata Ágnes és a kézírás-felismerő modellről szóló poszter

A Digitális Bölcsészeti Központban létrehoztuk az első publikus magyar kézírás-felismerő modellt. Projektünk alapjául Kiss József magyar költő és lapszerkesztő, a magyar irodalomtörténet méltatlanul elhanyagolt szereplőjének levelezése szolgált. A képzési adatok szakmai és személyes leveleit tartalmazzák, amelyeket folyamatosan közzéteszünk online. A poszter egy olyan esettanulmányt mutat be, amely a modellépítés Transkribus által kínált két alapvető stratégiáját vizsgálta és tesztelte: az első az alapmodell használata, a második pedig az anyag Ground Truthként való hozzáadása.
A poszter melletti kötetlenebb beszélgetések pozitív visszhangja és érdeklődő hangneme feltétlen megerősített minket abban, hogy ezek fontos és releváns kérdések, melyek eredményei a Transkribus-közösség érdeklődésére tartanak számot.
Az ilyen összejövetelek nagyban elősegítik a munkánkat. Egymástól és fejlesztőktől is tanulhatunk. A fejlesztők pedig első kézből értesülhetnek arról, mi az, ami nem vagy nehezen működik, mik a felhasználók elvárásai és tapasztalatai.

Nehéz leírni azt a barátságos hangulatot, amely a konferencián uralkodott. Ehhez bizonyára hozzájárult a szervezők és résztvevők szakmai lelkesedése, a megbízott cateringes cég profi és 100%-ban környezetbarát ebéd- és kávészünetei és az Inn folyó partján fekvő kisváros, Innsbruck lélegzetelállító szépsége is.

Günter Mühlberger beszél a Transkribus jövőjéről

A konferencia megnyitó beszédét az Innsbrucki Egyetem rektora után az egyébként germanista végzettségű Günter Mühlberger tartotta, akit közvetlen munkatársai csak a Transkribus Atyjaként emlegetnek, hiszen ő fogja össze a szervezetet.
Elmondta, hogy a jövőben a HTR technológia fejlesztése és újítása mellett a layout analysis kerül a középpontba. Segítségével megtanítható a számítógép arra, hogy felismerje a vízszintes és függőleges vonalakat és egyéb szerkezeti elemeket egy kéziraton vagy nyomtatott forráson.
Egy másik fontos és fejleszteni kívánt terület a keresés és a kereshetőség. Egyre több digitalizált kézirat van mindenhol, azonban ezek kereshetővé tétele nélkül nagyon nehéz sikeresen eligazodni a dokumentumok között. Ezt a problémát hivatott feloldani a read and search funkció, amely a jövőben a felhasználók által szabadon beállítható lesz. Mühlberger szerint a szimpla teljes szövegű keresés a 90-es évek nagy álma volt. A keresés kiszélesítésével, azaz a projektek közötti keresztszűrés megvalósításával azonban a Transkribus lehetne a kéziratos források google-je.
Harmadik célként a közösségépítést tűzték ki. Az egész kezdeményezésre jellemző az együttműködésen alapuló megközelítés, ezt szeretnék erősíteni a felhasználók körében és támogatni a különféle új funkciókkal. Emellett pedig a TUC-hoz hasonló programok szervezésével erősítenék a közösségi szálakat.
Prof. Dr. Patrick Glauner a deggendorfi Technológiai Intézet Mesterséges Intelligencia professzora, de akadémiai szerepével párhuzamosan egy AI-tanácsadó cég alapítója és vezérigazgatója is. Szakértőként több ország parlamentjének és politikusainak adott tanácsokat. (További információ a honlapján található róla.)
Előadásában – ahogy az Attention is all you need című tanulmányában is – hangsúlyozta a transzformátorok fontosságát a természetes nyelv feldolgozásban. A Transzformátor lényegében egy olyan neurális hálózati modell, amely egyszerre képes a rövid szövegközi összefüggések (például bekezdések vagy mondatok) és a nagyobb, általános összefüggések értelmezésére. A hasonló szavakat egy virtuális „dobozba” téve képes a dobozok tartalmát összehasonlítani egymással. Tehát például egy mondat esetében nem egyesével dolgozza fel a szavakat, hanem párhuzamosan, mellyel időt és energiát is spórol.
Ugyanakkor fontos tanulsága volt a beszédének, hogy az egyre divatosabbá és okosabbá váló mesterséges intelligencia nem jelent megoldást minden problémára. A folyamat eleje az emberi intelligenciával kezdődik és csak ezután lehet bevonni az MI-t. Ez nemcsak átláthatóvá teszi a folyamatot, hanem a költségeket is csökkenti és felgyorsítja a procedúrát. Egy alapos átgondolás után még az is kiderülhet, hogy az adott helyzetben nem a mesterséges intelligencia használata a legjobb megoldás.
Mindenki figyelmébe ajánlotta az MI használatának legfrissebb EU-s szabályozását, melynek megalkotásában szakértőként ő maga is részt vett.

A Transkribus felhasználói konferencia panelbeszélgetésének résztvevői: Dominique Deslandres, Patrick Glauner, Günter Mühlberger, Annemieke Romein

Ezzel összhangban a panelbeszélgetés fő kérdése az volt, hogy vajon a mesterséges intelligencia-e a kulcs a történelmünk feltárásához.

A résztvevők:
Patrick Glauner (Key-note előadó)
Annemieke Romein (Huygens Institute, Amsterdam)
Günter Mühlberger (READ COOP chair)
Dominique Deslandres (Université Montréal)

Különösen érdekes kérdés a mesterséges intelligencia használatának és hasznosságának megértése és értékelése olyan, kevésbé egzakt tudományterületen, mint a bölcsészet vagy épp a digitális bölcsészet. Abban azonban mindenki egyetértett, hogy a mesterséges intelligencia kulcsfontosságú lehet az exponenciálisan növekvő adatmennyiség kutatásában, segítségünkre lehet a részben sérült képek, szövegek helyreállításában. A sok jó tulajdonsága mellett azonban nem szabad elfelejteni, hogy ez nem egy tökéletes eszköz, nem varázspálca, amellyel megszűnnek a feladataink. Egyrészt az algoritmus is ugyanúgy hibázhat, akár az emberek.
Az MI képes magyarázatot adni arra, hogy miért jutott egy bizonyos következtetésre, még ha az hibás is, így az emberek tanulhatnak belőle.
Az egyik nagy vitát kiváltó kérdés az volt, hogy lehet-e a mesterséges intelligencia jobb történész, mint az ember? Günther Mühlberger frappáns válasza az volt, hogy a kereshetőség problémájára megoldást jelenthet a mesterséges intelligencia, de a probléma megértéshez az emberi tényező elengedhetetlen.
A beszélgetés tanulsága összességében az volt, hogy úgy kell tekinteni a mesterségesintelligenciára mint egy hasznos eszközre, amelynek ugyan vannak hibái és feltétlen meg kell tanulni jól használni, de ezek után óriási segítséget nyújthat a bölcsészettudományok művelői számára, legyen szó tanításról, kutatásról vagy épp szolgáltatásról. Ha tudunk tőle kérdezni, az MI adhat új ötleteket, de az emberi intelligenciára van bízva, hogy eldöntse, ezek valóban relevánsak-e.

MI-t hoz a jövő? – A Transkribus új generációja

A mesterséges intelligenciával foglalkozó kísérletek már az 1950-es évek óta léteznek, de csak a 2010-es évek technológiai fejlődésének megugrása tette lehetővé azt, hogy alkalmazásuk megvalósulhasson, sőt mi több, széles körben elérhetővé válhasson.
A Transkribus ötlete 2016 óta létezik és végül az Európai Unió 2020-as Horizon programja által finanszírozott kutatási projektből nőtte ki magát. 2019. július 1-jétől Read COOP néven és vállalati alapokon folytatja megkezdett munkáját.
A Transkribus-szoftver számokban: 31 fős csapatban dolgoznak, több mint 125, szavazattal rendelkező egyén vagy intézmény tagja a kezdeményezésnek, 94.000 felhasználója van a szoftvernek, kb. 20 millió oldal és 40 millió kép került feldolgozásra a szoftver segítségével.
Az üzleti modellre való átállás nagyjából mostanra fejeződött be, és a csapat egy sor új elképzeléssel és tervvel állt elő a konferencia első felében.
A platform jelenleg két felületen működik: egy online (Transkribus Lite) és egy letölthető asztali alkalmazás (Transkribus Desktop) formájában. A szoftver viszonylag könnyen és intuitívan használható, azonban a visszajelzések és a felhasználói értékelések, illetve statisztikák alapján úgy tűnik, hogy egyre többen és egyre gyakrabban választják az online felületet a munkához vagy a tanításhoz, így a cég szépen lassan átáll majd a Lite használatára és kizárólagos fejlesztésére, hiszen a két felület párhuzamos fenntartása senkinek sem kifizetődő. A jó hír pedig, hogy az átállás lassan, és a két verzió legjobb tulajdonságait egybegyúrva, folyamatos fejlesztések mellett megy majd végbe.
További új szolgáltatásokkal is készülnek. A Transkribus on Premise olyan korlátozott hozzáférésű dokumentumok feldolgozására lesz alkalmas, amelyek nem hagyhatják el az adott intézmény területét. A metagrapho<API>: nagy mennyiségű kézirat feldolgozásához fejlesztett rendszer, pl. levéltárak számára. Segítségével könnyen kinyerhetővé válnak a szöveges és az elrendezéssel kapcsolatos információk, méghozzá úgy, hogy az API-n keresztül hozzáférést biztosít a saját HTR-modellhez a Transkribuson kívül.
A Key note előadásban is megfogalmazott új technológiát, a transzformátorokat beépítik a kézírás-felismerő algoritmusok motorházteteje alá, így tartva lépést az új informatikai fejlődéssel. A trHTR az év végén vagy jövő év elején kerülhet bevezetésre.
Összességében az látszik, hogy egy nagy robosztus program helyett rugalmas mikroszolgáltatások rendszerét kívánják kialakítani, amelyben minden felhasználó találhat számára érdekeset vagy hasznosat.

A Transkribus felhasználói konferencia résztvevői

Közösségi tudományos kutatás (Crowdsourcing, citizen science)

A konferencia fontos és hangsúlyos részét képviselték a Crowdsourcing-projektek, illetve az ezekkel foglalkozó intézmények munkájának bemutatása. Nem utolsó sorban az innsbrucki csapat két projektje is előkerült: KaTi és Franzi.
Az aranyos nevek mögött komoly közösségi tudományos projektek lapulnak.
A KaTi – Kataster Tirol digital a „Ferenc-kataszter” történelmi telekkönyvét, térképeit és kísérő dokumentumait dolgozza fel Tirol tartományára vonatkozóan. És ahogy a honlapon is írják, ez csak a kezdet. A Franzi egy olyan platform, ahol az összes résztvevő önkéntes hihetetlen erőfeszítése és elkötelezett munkája napvilágot lát. Ezen a platformon bárki könnyedén hozzáférhet és kereshet a Ferenci Kataszter adatai között.
De hallhattunk crowdsourcinggal foglalkozó előadásokat a Hanza-városok történelmi dokumentumainak feldolgozása kapcsán, illetve a Dán Nemzeti Levéltár képviselte azt az országos hálózatot, amely az egyes városi és megyei levéltárakat összefogva kezdett bele az ország történelmének feldolgozásába önkéntesek segítségével.
Ezzel párhuzamosan egy másik szekcióban az egyetemek kísérleteiről és tapasztalatairól hallhattunk a Transkribus használatát illetően. Sokan vonnak be hallgatókat a tanítókorpuszokhoz szükséges Ground Truth előállításába. Általános tapasztalat, hogy az átírások igazi kihívást jelentettek a fiatalabb nemzedék számára. Bár a történelem szakos egyetemistáknak könnyen megy a szoftverhasználat, nehézséget jelent akár egy 20. századi kézirat kisilabizálása is. Egy másik problémaként az idő rövidsége merült fel: bármennyire is felgyorsítja a folyamatot a kézírás-felismertetés, egy félév során csak nagyon kevés anyagot lehet feldolgozni, ezért sokkal jobb modellnek tűnik a kutatócsoportokban, nagyobb egyetemi projektekben való gondolkodás.
Sok előadó számolt be arról, hogy rendszeresen tart Transkribus-workshopot, ezáltal: ők is jobban átlátják a szoftver működését, válaszolnak az esetlegesen felmerülő kérdésekre, illetve át is adják tudásukat a fiatalabb nemzedéknek. Nehéz megjósolni mennyire marad közhasználatú eszköz a Transkribus a fiatalok körében, de aki komolyan gondolja a bölcsészettudományi pályafutását, annak lassan megkerülhetetlenné válik a digitális filológiai eszközök megismerése és használatuk elsajátítása. A READ COOP dialogizáló hozzáállása pedig mindenképpen megkönnyíti a közös munkát ezen a téren is.
A 2022-es TUC konferenciáról nem kizárólag impressziókkal, élményekkel tértünk haza, hanem a gyakorlatban hasznosítható tapasztalatokkal. Csak reménykedni tudunk abban, hogy a jövőben megvalósuló projektjeinkben jó társaink maradnak a kézírás-felismerő modellek, hiszen nemcsak inspirációt kaptunk ehhez a konferencián, hanem releváns tudást és kapcsolatokat is.

Csoportkép a konferencia résztvevőiről