Transkribus workshop

2023. december 16. 06:00 - nemzetikonyvtar

2023. november 2224. között munkatársaink, Makkai T. Csilla, Mihály Eszter, Szűcs Kata Ágnes és Varga Emese Transkribus workshopot tartottak könyvtárunkban. A Transkribus egy történelmi dokumentumok, kéziratos források szövegfelismertetésére és -átírására szolgáló mesterségesintelligencia-alapú platform. A háromnapos műhelymunka során a platform alapvető funkcióit és felhasználási lehetőségeit sajátíthatták el a résztvevők.

A közgyűjteményi intézmények dolgozóit és az egyetemi hallgatókat megcélozva úgy alakítottuk ki a háromnapos programot, hogy akár egy, akár a teljes részvétel esetén, jól használható tudást szerezzenek a hallgatók. Akik mindhárom napon részt tudtak venni a képzésen, egyre bővebb és mélyebb gyakorlati és elméleti tudást sajátíthattak el.
Minden nap tananyaga egy-egy főbb tematika köré épült, ezáltal mindig más oldalról közelítettük meg a Transkribus használatát, illetve az ehhez kapcsolódó munkafolyamatokat. A délelőttök az elméleti tudás, az alapismeretek elsajátítására fókuszáltak, délután pedig a gyakorlaté volt a főszerep. A nap végét mindig egy egyórás „napközivel” zártuk, amelynek során a workshop tematikáján túlmutató kérdéseket, problémákat vitattunk meg.
A teljes program itt érhető el.

1_kep_opti_33.jpgKöszöntő

Az első napon (november 22.) a digitális szöveg előállítása volt a fókuszban, olyan témák kerültek előtérbe, mint a digitális filológia fogalma, a digitális szövegkiadás előnyei és a különböző típusú szövegkiadások jellemzői. Megmutattuk, hol helyezkedik el a Transkribus a digitális szövegkiadás munkafolyamatában, ismertettük a szoftver alapvető funkcióit, a platform felépítését, illetve kiemeltük az asztali és a webes felületek közötti különbségeket.

2_kep_transkribus_opti.jpgMakkai T. Csilla előadása a digitális szöveg előállításáról. Fotó: Visky Ákos

A délutáni két szekcióban elkezdtük az első gyakorlatokat, a résztvevők létrehozták saját gyűjteményüket, amelyen kipróbálták a platform alapfunkcióit, illetve megismerkedtek az automatikus szegmentálás és kézírás-felismertetés gyakorlatával. Ennek kapcsán a saját kézírás-felismertető modell létrehozása is szóba került, de ezen a napon még csak elméleti szinten foglalkoztunk a témával. Arra törekedtünk, hogy a nap végére a résztvevők akár önállóan is bele tudjanak kezdeni saját kéziratos anyaguk feldolgozásába.

3_kep_transkribus_opti.jpgAz első szegmentálási gyakorlatok. Fotó: Visky Ákos

A második nap (november 23.) fókuszában a Transkribus és a kézírás-felismertetés állt. Bár mindegyik nap előkerült a téma, ezen a napon alaposabb betekintést adtunk a Transkribusról mint szervezetről és a tagsági rendszerről. Szintén bemutattuk a Transkribus helyét a munkánkban, azaz a Digital Humanities Platform (dHUpla) workflowjában. Az alkalmat megragadva kitértünk a dHUpla felületére is, ahol a digitális szövegkiadásokat publikáljuk. Kontextusba állítva a munkánkat, más magyar nyelvű és külföldi digitális szövegkiadásokat is megmutattunk a jelenlévőknek.
A délelőtt második felében a résztvevők megismerkedhettek a Transkribus platform felépítésével. Ebben a gyakorlati szemléletű bemutatóban ismertettük a webes interfész felületét, felhívva a figyelmet az asztali és a webes alkalmazások közötti különbségekre. Kiemeltünk néhányat a jelenleg elérhető, fejlesztés alatt álló béta funkciók közül, s figyelembe véve, hogy a jelenlévők többsége közgyűjteményi dolgozó volt, kitértünk arra is, milyen metaadatolási lehetőségekkel rendelkezik jelenleg a webes alkalmazás.
A két délutáni szakasz arra készítette fel a jelenlévőket, hogy a későbbiek során akár önállóan is belekezdhessenek egy kézírás-felismertető modell építésének folyamatába.

4_kep_transkribus_opti.jpgMűhelymunka. Fotó: Visky Ákos

Azokkal, akik már második napja voltak jelen, tovább mélyítettük az automatikus szegmentálási és szövegfelismertetési gyakorlatot, valamint azt, hogy hogyan lehet akár manuálisan, akár a részletes beállítások segítségével javítani a kapott eredményeken. A modellépítés gyakorlatát egy elméleti bevezetővel alapoztuk meg, amelyben kitértünk a gépi tanulás által kínált mesterséges neurális hálózatok működésére, illetve arra, hogyan vonatkoztatható mindez a kézírás-felismertetésre. Ezután a résztvevők egy általunk előkészített, azaz szegmentált és átírt mintakorpuszon – amely az OSZK Fond VIII. jelzetű gyűjteményen, Petőfi Sándor levelezésén alapult – elkészítették az első kézírás-felismertető modelljüket a Transkribus webes interfészének segítségével.

5_kep_transkribus_opti.jpgSzűcs Kata Ágnes a modellépítés elméletébe vezeti be a résztvevőket. Fotó: Visky Ákos

A harmadik napon (november 24.) arra fókuszáltunk, hogy a modellépítésen túl hogyan hasznosítható egy Transkribusban előállított kéziratos korpusz. A délelőtt folyamán a felhasználási módokra tértünk ki, ennek fényében újra elhelyezve a Transkribust az általunk kialakított munkafolyamatokban. Ezúttal azonban nagyobb hangsúlyt fektettünk a digitális szövegkiadások típusaira, és az ezekhez szorosan kapcsolódó TEI XML-szerkesztésre is. Egy modern felhasználói igényeket maximálisan kielégítő digitális szövegkiadás kapcsán feltétlenül beszélnünk kellett a kép és szöveg párhuzamos megjelenítésének fontosságáról, valamint arról, hogy ez hogyan valósítható meg a Transkribus segítségével. Példának a már említett digitális bölcsészeti platformunkat és a Transkribus saját fejlesztésű, szövegkiadásokra alkalmas Transkribus Sites elnevezésű, béta verzióban működő oldalt hoztuk.

6_kep_transkribus_opti.jpgA kézirat-feldolgozás fázisai. Fotó: Visky Ákos

A délelőtt második felében ismét a Transkribus alkalmazás alapvető funkcióira koncentráltunk. A webes és az asztali alkalmazások közötti különbségek részletezése során ezúttal az exportálási lehetőségeket ismertettük részletesebben.
Az ebédszünetben a jelentkezőknek lehetősége nyílt a Digitalizáló Osztály munkájának megismerésére, Kukár Barnabás Manó vezetésével.
A délutáni szekció során ismét a gyakorlat került előtérbe. Erre az alkalomra azt tűztük ki célul, hogy a jelenlévőkkel együttesen hozzunk létre egy közös kézírás-felismerő modellt, amely a teljes workshopot is keretbe foglalta. Erre az önálló feladatra leginkább azok voltak felkészülve, akik már harmadik napja jelen voltak, de több-kevesebb segítséggel azok is teljesíteni tudták a feladatot, akik először ismerkedtek a felülettel.

7_kep_transkribus_opti.jpgKonzultáció. Fotó: Visky Ákos

A modellépítés gyakorlatát tehát arról az oldalról közelítettük meg, hogy egy előkészített korpusz helyett a jelenlévőknek önállóan kellett létrehozniuk egy szegmentált és átírt dokumentumot, amelyet használni tudtunk a folyamat során. A feladat nagyságát ellensúlyozta, hogy a nagy népszerűségnek örvendő workshop napi közel 30 jelentkezőjének elég volt fejenként egy dokumentumot elkészíteni ahhoz, hogy összeálljon egy tanítókorpusz. A nap végén az előállított a dokumentumokat egy közös gyűjteménybe másolva megépítettük az első közös kézírás-felismertető modellt.

8_kep_transkribus_opti.jpgDolgoznak a gépek. Fotó: Visky Ákos

A háromnapos esemény komoly előkészületet és intenzív jelenlétet igényelt a részünkről, s ugyanígy aktív közreműködést a hallgatók részéről is. A résztvevők visszajelzései rendkívül pozitívak és előremutatóak voltak, nagy öröm számunkra, hogy a műhelymunka során valóban hasznos ismerteteket és gyakorlati tudást sikerült átadni, s újabb szakmai kapcsolatok, ismeretségek alakulhattak ki.

9_kep_transkribus_opti.jpgA csapat. Fotó: Visky Ákos

Szűcs Kata Ágnes és Varga Emese
(Digitális Bölcsészeti Központ Digitális Filológiai Osztály)

komment

A bejegyzés trackback címe:

https://nemzetikonyvtar.blog.hu/api/trackback/id/tr8518282059

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

süti beállítások módosítása