Kultúra

Ami ma közkézen forog, azt már digitalizáltuk

Interjú Biszak Sándorral, az Arcanum Adatbázis Kft. vezetőjével

Ki gondolná, hogy a régi lapok közül a sportújságok a legnépszerűbbek? És hogy az arcfelismerő program révén régi festményeken is be lehet azonosítani, kik vannak rajta? Biszak Sándorral, az Arcanum Adatbázis Kft. vezetőjével a több mint harminc éves tudástár történetéről, a mesterséges intelligencia vívmányairól és a nehezen fellelhető lapokról beszélgettünk.

Ami ma közkézen forog, azt már digitalizáltuk
Biszak Sándor szerint az a jó a régi napilapokban, hogy mindenki talál bennük hírt ismerősről vagy rokonról
Fotó: Purger Tamás

 Hogyan épül fel az önök által létrehozott adatbázis?

Az Arcanum Digitális Tudománytárban magyar nyelvű újságok, folyóiratok olvashatók, emellett az Arcanum által fejlesztett Hungaricana közgyűjteményi portálon mintegy száz könyvtárból, múzeumból, levéltárból képeslapok, térképek, festmények, középkori oklevelek és népzenei hangzóanyagok, kották is találhatók bőségesen.

Hogyan született meg az Arcanum ?

  A cég 1989-ben alakult. Kezdettől a digitalizálást tekintettük fő tevékenységünknek. 1989-ben még floppylemezre mentettük az anyagokat. Utána jött a CD. Leghíresebb sorozatunk az ötvenrészes Verstár volt. Arany János, Reményik Sándor és más jelentős magyar költő összes versét adtuk ki a CD-ken.  2000-ben tizenhárom bibliafordítást adtunk ki, illetve bibliamagyarázatokat és biblialexikont. Ezeket az anyagokat feltettük később az internetre, ingyenesen lehet őket használni a mai napig. Ha a költészet napja van, a verstárat akár százezren is olvassák.

Az Arcanumban régi és nemrég megjelent kötetek is olvashatók
Az Arcanumban régi és nemrég megjelent kötetek is olvashatók
Fotó: Purger Tamás


– Mi volt az alapgondolat, amikor létrehozták a digitális tudománytárat?

– Az Arcanum születése előtt öt évvel vegyészként végeztem az ELTE-n, és mivel kiderült, hogy nagyon gyenge manuális készségekkel rendelkezem, így a diploma után a régi Richter Gyógyszergyár, akkoriban Kőbányai Gyógyszergyár könyvtárába kerültem. Ott, kagylós telefonon tárcsázva, már akkor, 1983–84-ben külföldi adatbázisokat használtunk. Akkoriban Magyarországon még sehol nem volt az internet.  Az volt a meglepő, hogy ha egy magyar szabadalmat kerestem, Amerikába kellett telefonálnom. A Magyar Szabadalmi Hivatallal alakítottuk meg a céget. Furcsa idők voltak 1989-ben. Én vittem ötezer forintot, a hivatal meg egy asztalt tett bele a betéti társaságba. Szabadalmi adatokat kezdtünk el feldolgozni közösen.

– Hogyan vezetett az út a versek, a Biblia, később a folyóiratok és könyvek felé?

– Kialakult egy technológia, és mi ebbe verseket, Bibliát töltöttünk bele. 2000 táján kiderült, hogy itt olyan hatalmas mennyiségű adat van, amit nem lehet CD-n elhelyezni. Kisipari módszerekkel csak néhány dolgot tudtunk megcsinálni, például a Jókai összest, Mikszáth összest lehetett, de a Vasárnapi Újságot nem lehetett archiválni ezzel a technikával. Az áttörést az hozta meg, amikor rájöttünk, hogy ha szkenneljük és az internetre feltesszük az anyagokat, lesz annyi kapacitásunk, hogy az összes napilapot digitalizáljuk. Ez persze évek fejlődése volt. Először a Pesti Hírlapot, a Pesti Naplót, a Magyarországot, a második világháború előtti és a második világháború utáni Magyar Hírlapot, valamint a Népszavát, a Népszabadságot és a megyei lapokat digitalizáltuk. Mára eljutottunk oda, hogy mintegy negyven millió oldal van az Arcanum Digitális Tudománytárban, ami kereshető, és tudósok számára egyike a legfontosabb forrásoknak. Van egy Szaktárs nevű felületünk is, amely húsz szakkönyvkiadó társulása. Az általuk kiadott, digitalizált könyveket szintén nagyon jól lehet használni a felsőoktatásban és a kutatásban.

– Ha jól értem, itt nem csak arról van szó, hogy a könyveket egymás után beszkennelik és ingyen vagy díj ellenében elérhetővé teszik az interneten, hanem önöknek valamilyen rendszerbe is bele kell illeszteniük ezeket a szövegeket.

Az archívásában az jelentette az áttörést, amikor az internetre kezdték feltenni a szkennelt oldalakat
Az archiválásban az jelentette az áttörést, amikor az internetre kezdték feltenni a beszkennelt anyagokat
Fotó: Purger Tamás

  Valóban nagyon nehéz megfogni, mi alapján próbálom a digitalizálást elindítani. Nem is gondolná az ember, hogy a legjobb a kiadónkénti csoportosítás. A Google másképp oldotta meg. Elment a New York Public Library-ba, és az elsőtől a kétmillió-ötszázezredik könyvig mindet digitalizálta. Utána átment egy másik könyvtárba, és ott is digitalizálta a könyveket. Nekünk ez nem megy. Mi kiadónként digitalizálunk. Most nagyjából húsz kiadó műveit archiváltuk már. Amikor körbevezettem önt, a Szent István Társulat könyveit láthatta feldolgozás közben. 

– Mit tartalmaz a Hungaricana oldal?

– Több mint száz közgyűjteménnyel és levéltárral működünk együtt. A Hungaricanában megtalálhatóak a középkori magyar oklevelek, régi térképek, a szerencsi Zemplén Múzeum több mint félmilliós képeslapgyűjteménye, a teljes magyar népzenei gyűjtemény, húszezer óra hangzó népzenei anyag és kották is. Az én kedvencem Fodor Sándor Neti bácsi, kalotaszegi prímás. Bartók, Csoóri, Sebő és mások zenéi, gyűjtései is hallgathatók.

– Milyen hordozóról történt a hangzóanyag digitalizálása?

– A  Zenetudományi Intézetben évtizedek óta digitalizálják a felvételeket, fonográfról, magnóról. Félmillió oldalon le is van kottázva ez az anyag. Nekünk az volt a feladatunk, hogy a kottákat, a hozzá tartozó adatbázist digitalizáljuk. Nagyon jól tudják használni a néptáncegyüttesek. Ezekről meg tudják tanulni a dalokat a zenészek, és a tudományos kutatás számára is nagyszerű forrás ez.

– Úgy látom, festményeket is tartalmaz a Hungaricana. 

A Hungaricana adatbázisában régi oklevelekre kereshetünk rá
A Hungaricana adatbázisában régi oklevelekre kereshetünk rá
Fotó: Purger Tamás

– Igen. Ha megnézünk akár egy nem is közismert festményt, amelyen több személy van, az arcfelismerő programmal megpróbálhatjuk kideríteni, ki lehet az ábrázolt személy. Ki is lehet nagyítani a képeket annyira, hogy jól látható a festő ecsetkezelése a vásznon.

– Hogyan kapják az anyagokat?

– A Hungaricana esetében az a jellemző, hogy a levéltár vagy múzeum megbíz minket, és fizet a digitalizálásért. Jelenleg negyven-ötven könyvtár és levéltár anyagát dolgoztuk már fel.

– A régi térképek, oklevelek hogyan kerültek be a tárba?

– A bécsi Kriegsarchivban, a hadilevéltárban vannak a legjobb térképek, itt található az első, második, harmadik katonai felmérés, amit az osztrák hadsereg készített 1780, 1850 és 1880 körül.  A Magyar Hadtörténeti Intézet is őrzi a magyar területekről készített térképeket. Ott kezdtük a munkát, és kiderült, hogy ez egy nagyon fontos és fantasztikus forrás, túlzás nélkül állítható, hogy a leghitelesebb, amely megmutatja a korabeli a településszerkezetet, a házakat. Sikerült a bécsiekkel megegyeznünk, kimentünk, és digitalizáltuk a teljes állományt. Georeferáltuk a térképeket, vagyis a mai térképre ráhelyeztük a régit. Így látható, hogy mi van most a régi épületek, utcák, terek helyén. Az osztrák hadsereg európai viszonylatban is fantasztikusan elöl járt a térképek részletgazdagságát illetően. Vannak francia térképeink és amerikai térképeink is. Például az USA-beli Los Angeles térképe csak itt, nálunk tekinthető meg a mai térképre vetítve. Amerikában sincs ilyen. Úgy volt, hogy 20192020-ban kimegyünk Washingtonba, a Nemzeti Levéltárba, és digitalizáljuk az ottani térképeket, de a pandémia miatt elmaradt.

– Beszéljünk az oklevelekről is!

– Az okleveleket a Magyar Nemzeti Levéltárral (MNL) együttműködésben archiváltuk. Kétfajta gyűjtemény van. A Diplomatikai levéltárban százhétezer eredeti, 1526 előtti oklevél található, amelyeket a Magyar Nemzeti Levéltárban őriznek. A teljes anyagot digitalizáltuk. Emellett az összes magyar vonatkozású, nem az MNL-ben őrzött anyagot is lefotózták a hatvanas-hetvenes-nyolcvanas években, amit ugyancsak digitalizáltunk. A Diplomatikai fényképtárban kilencvenötezer oklevél található. Ugyancsak digitalizáltuk a királyi könyveket, vagyis a királyi kancellária másolati könyveit, amelyek minden kiadott oklevelet tartalmaznak. Nagyon gazdag a gyűjtemény Urbárium része. Mária Terézia urbáriuma azért különösen érdekes, mert ott a jobbágyneveket is kutathatjuk. Falvanként felsorolták a jobbágyok neveit, és hogy mijük van, mekkora robotot kell teljesíteniük, mennyi kappant kell beszolgáltatniuk, mekkora földterületet kaptak.

Az eredeti pecséteket is megtekinthetjük a a digitalizált okleveleken
Az eredeti pecséteket is megtekinthetjük a digitalizált okleveleken
Fotó: Purger Tamás

– Az országhatárokon túli magyar nyelvű kiadványok is bekerültek a tudománytárba?

– Együttműködésben vagyunk a marosvásárhelyi és a sepsiszentgyörgyi könyvtárral, a kolozsvári Egyetemi Könyvtárral, de a tengerentúlról is vannak magyar nyelvű anyagaink. Például az amerikai magyaroknak volt egy nagy könyvtáruk New Brunswickban. Hazahoztuk és digitalizáltuk a teljes folyóirat-állományt, mert ott már nem nagyon beszélnek magyarul. Amerikában rengeteg nagyszerű magyar nyelvű lap volt már a 19. század végén is. Ezek nyolcvan százaléka valószínűleg már sosem fog előkerülni. A húsz százalék, amit sikerült begyűjtenünk, azt mutatja, hatalmas volt a piac is. De csak a múlt század nyolcvanas éveiben sikerült kimenteni ezeket a folyóiratokat.

– És a régi erdélyi újságok?

– Legutóbb a Nagyszebeni Közlönyt és az Aradi Közlönyt a nagyszebeni román könyvtárból tudtuk beszerezni. Ott senki nem beszél magyarul, de nagyon szépen eltették a példányokat. Nagyon keressük a Nagyváradi Napló hiányzó számait, évfolyamait. Nagyváradon a Bihar Megyei Könyvtárral előkészítettünk egy szerződést, amit sajnos a Bihar Megyei Tanács elnöke nem engedélyezett. Ahogy én tudom, Nagyváradon komoly feszültségek vannak a kultúra területén, és ebben nemcsak a magyar, hanem a román intézmények is érintettek. Talán ennek esett áldozatul a könyvtári digitalizálás is.

– Mely lapok beszerzése a legnehezebb?

– Általánosságban elmondható, hogy egyre kalandosabban tudunk új anyagokhoz jutni, mert azokat az anyagokat, amelyek közkézen forognak, már archiváltuk. Nehéz például a hiányzó lapszámok beszerzése. Kidobják, kivágják, elpusztul, soha nem volt meg. Nagy hiánylistáink vannak. Nem a réges-régi lapokat a legnehezebb megszerezni, hanem például a Pesti Műsor vagy a Füles hatvanas-hetvenes évekbeli számait. Vagy a 2020-as lapszámokat. Ez a legfáradságosabb része a munkánknak. De egyre több gyűjtő és egyre több kiadó veszi fel velünk a kapcsolatot. A gyűjtők rájöttek, hogy jól járnak a digitalizálással, mert ami náluk van, kereshetővé válik az adatbázisban. Ma például az Eső című folyóirattól kerestek meg minket. Nemrégiben a már évekkel ezelőtt megszűnt Nagyítás című lap számait is megkaptuk, hogy archiválhassuk.

– Merrefelé terjeszkednek mostanában? 

Hazai nemzetiségi újságokat is archiválnak
Hazai nemzetiségi újságokat is archiválnak
Fotó: Purger Tamás

– Mivel egyre nehezebb beszerezni a folyóiratokat, elkezdtük a romániai román nyelvű folyóiratok digitalizálását. Most tartunk ott a romániai anyaggal, ahol öt évvel ezelőtt tartottunk Magyarországon. Már megvan a kritikus tömeg. Amíg az nincs meg, addig mindenki csak azzal jön, hogy ez az újság sincs, az az újság sincs, és fanyalognak. De most már tudjuk, hogy mit olvasnak szívesen az emberek.

– Milyen sajtótéma a legnépszerűbb az archívumban?

– Mindig is a sport, a sportlapok iránt a legnagyobb az érdeklődés, Magyarországon és Romániában is.

– Gondolom, a sporton belül a foci a legolvasottabb.

– És az olimpiák története. Az utóbbi három-négy évben nagyon sok sporttémájú könyv születik az adatbázis alapján. Szerződésünk is van a Magyar Sportújságírók Szövetségével, hogy összegyűjtik nekünk ezeket a sporttörténeti könyveket és az engedélyeket a digitalizáláshoz.

– Mi iránt van nagy érdeklődés a sporton kívül?

– Most a Népszava fotóarchívuma tudta beelőzni a Nemzeti Sportot. Erre mondom, hogy már tudjuk, mi kell az embereknek. A digitalizálást a Századokkal és az Etnográfiával kezdtük, de ezek a lapok csak egy szűk kört érintettek. Amikor a folyóiratokat választottuk a könyvek előtt, úgy érzem, jól döntöttünk.

– De miért?

– Annyira személyes a folyóirat. Például a két világháború idején megjelent lapok listáiban szerepel, ki került hadifogságba, ki halt hősi halált. A Tolnai Világlapjában, a Honvédségi Közlönyben és más lapokban is benne voltak ezek a hírek. A napilapban mindenki megtalálja vagy a családtagját, vagy a barátját vagy az ellenségét. 

Kapcsolódó írásaink

Bővült a RETÖRKI online tudástára

ĀAz 1956-os forradalom és szabadságharc 65. évfordulójára A rendszerváltás mérföldkövei – a Retörki Kronológia online tudástár a különleges tartalommal a duplájára bővült

Kincsek az archívumban

ĀA Magyar Művészeti Akadémia által elindított lexikon közérthetően mutatja be a magyar irodalom és filmkultúra legfontosabb alkotásait az előző évszázadból