Forráskód

Harmadjára rendezték meg a Forráskutatás, forráskiadás, tudománytörténet konferenciát. A kódexektől a csillagászéletrajzig, sci-fitől a boszorkányperekig sokfelől megközelítették a témát. Pillantsunk be a tudomány ajtaján, és nézzük meg, mi a helyzet a digitális világgal!

 

Péntek délelőtt van, november tizenhetedike. Az ELTE A épületének földszintjén műanyag kávéspoharakkal és apró szendvicsekkel jönnek-mennek az emberek, ki kiöltözve, névtáblát csiptetve a felsőjére, ki lezseren. Az ELTE Magyar Nyelvtudományi és Finnugor Intézete és a Magyar Nyelvtudományi Társaság rendezésében létrejött III. Forráskonferencia második napján, a három helyszín egyikén (Gombocz terem), valahol az 52. előadás környékén járunk. 11.20-kor kezdődik a Forráskód 1. fantázianevű szekció, elsőként Ilyefalvi Emese a tudományterületek közötti kommunikáció, a digitalizáció során szükséges adatfelvétel kérdéseiről fog beszélni.

11.15-kor még ketten vagyunk a nagyelőadóban közönségként, a technikus és két előadó a projektort próbálja összehangolni a számítógéppel. A kivetített képernyő alja nem látszik, mert belelóg a sötétzöld tábla tetejébe. Úgy marad. 11.20 után szállingózni kezdenek az emberek, lassan eloszlik a tömeg a terem balfelén, föl a lejtős széksorokon, az ablakig. Kalcsó Gyula egy ponton előlép, és szekcióelnökként vezényelni kezdi a következő egy órát.

Ilyefalvi Emese első előadóként beszélni kezd, kiderül, hogy folklorisztikás, és a digitalizálásban is van már tapasztalata. Elsősorban a nyelvészek és a folklorisztika tudósainak eltérő adatfelvételéről van szó a következő fél órában: nyilván minden tudós, mondja, a kutatás témájának megfelelő szempontok szerint veszi fel az adatokat egy adott szövegnél. Azonban nem mindegy, hangzó szöveg-e az alap, vagy kézirat, vagy nyomtatott forrás. Szerinte hangzó szövegnél elsőként egy nyelvész kodifikálása lenne ideális (hiszen ő képes hűen leírni a hangzást, nem módosít a szövegen, és a nyelvészeti adatgyűjtésnek megfelelően feljegyzi a beszélő demográfiai adatait is). Ezzel tudna a többi szakterület továbbdolgozni, ideálisan TEI-XML kódnyelven, ahol egy adott adatjelölő-készletet lehet személyre szabottan, az aktuális célnak megfelelően felcímkézni. Ha az adatfelvétel nem így történik, az Ilyefalvi szerint nagyon megnehezíti, hogy a szöveget más tudományterület is használni tudja. Végszóként kijelenti: emiatt rengeteg pluszmunkát jelent, míg ki-ki újradigitalizálja magának, amit szeretne.

Ezen a ponton kisebb vándorlás kezdődik a hallgatóság körében, van, aki kifelé tart, mások próbálnak feltűnésmentesen felkopogni a lépcsőkön és helyet foglalni. Kalcsó Gyula második előadóként hasonló kérdéskört mutat be, mint az őt megelőző hölgy, szintén a nyelvészetről és az XML-kódolásról beszél, különböző nemzetközi adatbázisokat, gyűjtéseket hoz fel példaként. A nyelvész húsz perce után újabb vándorlási hullám, majd egy irodalomtörténész előadása következik.

Maróthy Szilvia az Ómagyar Mária-siralom elektronikus kritikai kiadásának készülésébe vezet be minket. Már ismerősként köszönthetjük az XML-nyelv szakkifejezéseit, az idősebb vagy egyszerűen digitalizációval nem foglakozó közönség is egészen eltájékozódhat a területen. Másodjára kerül szóba a Balassi összes 90-es évekbeli hálózati kritikai kiadása (ugyanakkorról beszélünk, amikor az Amerikában még CD-ROM-ra írtak ki digitalizált regényeket!), illetve a szegedi bölcsészinformatikai program (BIÖP), ami azóta már megszűnt. Maróthy a Balassi digitalizálása során felmerülő problémákról, és annak az ÓMS-re vonatkozó tanulságairól beszél. Ki hitte volna például, hogy a Balassi-féle módszer szerint a “scegenul scepsegud”-ben az első szó olvasata, azaz az, hogy “szegényül”-nek vagy “szégyenül”-nek értelmezzük-e, teljesen véletlenszerű lenne. Balassi hasonlóan kétértelmű szöveghelyén, mivel a kiadás mögötti kutatócsoport nem foglalt állást, a gépre bízták a döntést, melyiket tekinti főszövegnek: frissítésenként másik megoldás jön ki, a nem főszövegnek ítélt verziót lábjegyzetbe téve. Szilvia ezt például nem tekinti követendőnek: az ÓMS-ben más módszer lesz várható.

Az elmúlt másfél órát emésztgetve a nézők közül van, aki kérdez. Talán a leginkább előremutató hozzászólás, amikor egy, a digitalizálásban nem jártas férfi megkérdezte, ennek az XML-nyelvnek van-e tényleg ilyen fontos szerepe, nem lehet-e, hogy a rendszer (a könnyű személyre szabhatóság, újonnan bevezetett jelölők miatt) túl nagy lesz és összeomlik, vagy ugyanúgy nem lehet összehangolni más jelölőrendszerekkel, mint ahogyan a korábbi kódolásokat. Illetve nem lehetséges-e, hogy ahogyan a floppyt és lassan a CD-t, ezt az adathordozóformát is túlhaladja a technika, és sok adat ott marad majd feldolgozhatatlanul.

A válasz megnyugtató volt: de, mindkét kilátás lehetséges és valószerű.

A húszperces vita után – jelzem: az ebédszünetbe jócskán belelógva – elindultunk: a konferencia résztvevői meleg étel után nézve, én órára. Szép intermezzo volt ez a másfél óra különböző szakterületekbe bepillantva, mielőtt néhány emelettel fentebb elmerülhettem a regényelemzésben.