Belföld
Adatokból megjósolt pandémia
Ahhoz, hogy a jövőben előrejelezhetőek legyenek a világjárványok, elengedhetetlen, hogy információkat gyűjtsenek rólunk, ez azonban a mi felelősségünk is – mondta a Magyar Hírlapnak Rab Árpád egyetemi docens

– Mára természetesnek vesszük, hogy hétköznapi cselekvéseink egy részével információkat árulunk el magunkról, amit aztán valakik, valahol elraktároznak és különböző célokkal kielemeznek. Ez volna a big data kora. Tekinthetjük ezt paradigmaváltásnak?
– Annyiban beszélhetünk paradigmaváltásról, hogy mára nagyon sokan lettünk. Hétmilliárd ember él a Földön, a világ pedig jóval bonyolultabb, mint egykor volt, ezért szükség van az adatokra, hogy kezelni tudjuk ezt az összetettséget. Az adatbázisok, illetve a mesterséges intelligencia által pedig rejtett összefüggésekre bukkanhatunk rá. Ez nagyon meggyőző szempont. Minden, ami a digitális térben zajlik, az valamilyen módon megőrződik adatként. Igaz, egy jelentős részüket valójában soha nem használják fel.
– Miért nem?
– Egy technikai probléma miatt: tudniillik mert különálló adatbázisokról beszélünk, amelyek nincsenek összekapcsolva. Hogy az emberek mennyit sétálnak naponta, milyen ételeket fogyasztanak, milyen könyveket vásárolnak – ezek gyűjthető információk –, különálló adatbázisokban raktározódik el. Ezért van előnyben a közösségi média. A legnagyobb adatbázisokkal ők rendelkeznek, hiszen minél több dologra használja az adott platformot a felhasználó, annál összetettebb képet kaphatnak róla. Ez számukra főként gazdasági érdek. Ha a hirdető el akarja adni a könyvét, könnyebben találják meg a hirdetések azokat, akiket érdekel és várhatóan meg is veszik. Ma már kifejezetten olcsók az adathordozók, valójában ezért tárolnak tömegesen adatokat, mintsem törölnének. Azt ugyanis kiválasztani, hogy milyen adattól szabaduljunk meg, eldönteni, mi nem releváns információ, kifejezetten költséges.
– Nem nehéz kritikus szemmel figyelni a nagy cégek adatbázis-építkezését. A Cambridge Analytica példája meg is mutatta, miért.
– A technika egyik legnagyobb újdonsága, hogy gyorsan és rugalmasan, ráadásul személyre szabottan lehet változtatni a vélemény befolyásolásához rendelkezésre álló módszereket. A Cambridge Analytica például feltérképezte, ki, hogyan viszonyul Donald Trumphoz, majd ez alapján ajánlott tartalmakat neki. Ha valaki tíz témában egyetértett vele, kettőben azonban nem, akkor csak arról a tízről látott híreket, amelyekben Trump kiállt az adott ügy mellett. Ez a piacon, marketinges céloknál is hasonlóképpen működik: megtehetjük, hogy az algoritmus elrejti a konkurens cégek hirdetéseit, hogy csak az enyémet lássa a felhasználó. Ezek legális, bár nem korrekt módszerek. Az emberek tudatossága ezért lenne fontos, hogy lássák, hol és milyen módon próbálják őket befolyásolni. Az internet végtelenül szabad helynek tűnik, ahol mindent ellenőrizhetünk, de tudjuk, hogy az emberek erre nem hajlanak. Hiszen a gazdasági modell is erre épít, a kényelemre. És lássuk be, a tudatosság fárasztó, ráadásul megvannak a maga korlátai is, hiszen mindennek nem lehet utánanézni. Elsősorban persze a közösségi média feladata volna ezt szabályozni, és megadni hozzá a megfelelő kereteket.
– Az optimisták itt szokták felvetni, hogy lehetne általánosan jó célokra is használni az adatbázisokat. Például járványok előrejelzésére.
– Jogos kérdés volt a koronavírus kirobbanásakor, miért nem látta előre ezt a mesterséges intelligencia. Az igazság az, hogy látta, a BlueDot cég nagyjából két héttel mindenki előtt figyelmeztetett külföldi hírforrások és kormányzati nyilatkozatok elemzése alapján, hogy aki tudja, kerülje el Vuhant. De fontos megjegyezni, minden digitális eszköz hátránya, hogy csak a digitális kódokat látja, a bevitt adatot. Ha egy szegény afrikai országban terjed el egy vírus, ahol nem használják a technológiát, nem láthatják előre. De tegyük fel, hogy használnak. Van tehát adat Kínából, Afrikából és Európából. De mint mondtam, ezek az adatbázisok nincsenek összekapcsolva, más forrásokat használnak, és ez egy akadály. A mesterséges intelligencia képes – fogalmazzunk úgy – jósolni, de ehhez a megfelelő kérdéseket kell feltennünk, különben a gép hibázik. Be kell állítanunk előre, milyen szempontokat figyeljenek az algoritmusaink. Például: beprogramozhatom, hogy ha a lakosság harminc százaléka hirtelen otthon marad, holott eddig bejártak dolgozni, akkor a rendszer küldjön riasztást, mert ez azt jelzi, hogy valami baj van. Ehhez hasonló riasztókat kell beállítani, de ez nem egyszerű, hiszen végtelen számú szempont van, amiket előre kellene látnunk. Az adat az csak adat, a program nem fogja magától egymás mellé tenni őket. Persze, létrehozhatunk szoftvereket, amelyek bizonyos összefüggéseket már képesek felismerni, de a világ bonyolultságát sohasem fogjuk tudni bekódolni. Újabb problémák, újabb kérdések fognak jelentkezni. Az emberi intelligenciára és intuícióra – hála Istennek – szükség van.
– A BlueDot később azt már pontosan megjósolta, a vírus mikor, mely országokra fog először átterjedni Kínából.
– Ebben már nagyon jól használható a mesterséges intelligencia. Ez elvileg manuálisan is elvégezhető, bár nagyon sok adatról beszélünk. Hogy Kínából merre terjed tovább a vírus, ahhoz több millió utazási információt – vonat- vagy repülőutak adatait – kell megvizsgálni és ellenőrizni. Ezt egy egyszerű algoritmussal lekérdezhetjük. Folyamatmodellezéseket, hálózatkutatásokat nagyon jól lehet végezni. Hozzáteszem, a megfelelő adatokat ebben az esetben is be kell vinni, például azt, hogy egy adott kínai városból mennyi idő eljutni egy másikba. Jelenleg a technológia nem a járvány kirobbanásának, hanem a hatásának vizsgálatában jó.
– Hol lehetne még hasznosítani ezt a képességét?
– Ha készen lesz a vakcina, hálózatkutatással meg lehetne vizsgálni, a lakosság hány százalékát kell beoltanunk, hogy védettség alakuljon ki. Ahogy a fertőzés terjedését le lehetett modellezni, úgy lehetne az immunitásét is. Persze, mivel nem hatékony világban élünk, nem hiszem, hogy így zajlik majd az oltás. Az emberek érthető módon máshogy működnek, így először a veszélyeztetett csoportokat fogjuk beoltani. Ebben az esetben is lehetne használni a gépeket, hiszen be lehet programozni, hogy vegye figyelembe, mondjuk a korosztályokat a számítás esetén. Ismétlem, a gép hatékonyan számol, ha jól kalibráljuk be.
– Ahhoz tehát, hogy az előrejelzés működjön nagyon sok adatra van szükség. De az elmúlt évek egyik kiemelt problémája éppen a személyes adatok védelme, elég csak a GDPR-ra gondolnunk. Nem ellentmondásos ez?
– Ez kétségtelenül napjaink fő problémája. Az Európai Unió élen jár az adatvédelem és –kezelés kérdésében. Emellett még van két modell: Kína kormányzati utasításra minden szempontot figyelmen kívül hagy, legalábbis ezt látjuk. Ott egyáltalán nincs szabályozva a kérdéskör. A másik modell az Egyesült Államoké, ahol üzleti alapon működik: ha akarod, eladhatod az adataidat. Azt gondolom, ez a két út van előttünk, nincs harmadik, idővel valószínűleg Európában is az amerikai modellre állunk át. Az emberek el fogják adni az adataikat, ebben biztos vagyok, mert mindkét modell ezt tartalmazza. Az egyetlen kérdés, hogy parancsra teszik-e vagy önszántukból.
– Miért érné meg valakinek eladni az adatait?
– Vehetünk egy egyszerű példát: a biztosító mondhatja a jövőben, hogy olcsóbb lesz a cascónk, ha eladjuk a közlekedési adatainkat. Így láthatják, hogy nem szoktunk gyorsan hajtani vagy mennyire forgalmas utakon közlekedünk. Még érdekesebbek azonban a bőr alatti adatok, amelyekre ugyebár egy világjárvány előrejelzéséhez is szükség volna, emellett azonban használni lehetne őket az egészségügyi szolgáltatásban. Mondhatja az orvosunk, hogy amennyiben eladjuk neki az adatainkat, a jövőben időben kiszűrheti és előrejelezheti a betegségeinket. Életeket lehetne megmenteni. Ez sokak számára meggyőző lesz. De ne legyenek illúzióink – ez egy csábító sziréndal is egyben. Nem nehéz elképzelni, hogyan lehet visszaélni ilyen érzékeny információkkal. Például, egy bőr alá ültetett szenzorral meg tudják mondani, mérges vagy-e éppen. Tegyük fel, hogy Észak-Koreában levetítenek egy rövidfilmet Kim Dzsongunról, és megnézik, kiből váltott ki dühöt. Ezeket az embereket másnap már bilincsben vezetik el.
– Ez gyakorlatilag sci-fibe illő forgatókönyv, de ha jól értem, a technikai lehetőségeket tekintve reális.
– Abszolút, és egyre jobbak az eszközeink már. Az adatgyűjtés a szenzorok egyre olcsóbbá válását teszi lehetővé. Az arcfelismerő technikák nem azért terjedtek el éppen most Kínában, mert az államvezetés korábban vonakodott bevezetni, hanem mert eddig drágák voltak. Most már egy egyszerű kamera is képes felismerni az arcokat.
– Hogyan lehetne akkor etikusan gyűjteni az adatokat?
– Úgy, hogy nem személyektől, hanem tömegektől kell gyűjteni őket. Fel kell tenni a kérdést, mi a cél. Ha járvány-előrejelzés, akkor anonim módon kell. Ha orvosi szolgáltatást adunk el, az csak személyre szóló lehet. Ez csakis akkor működhet, ha kialakul bizonyos szintű bizalom. Ha megadjuk az orvosunknak, milyen alapbetegségünk van, elvárjuk, hogy ne adja tovább. Ez azonban a mi felelősségünk is, tudnunk kell menedzselni az adatainkat. Tisztában kell lennünk vele, milyen adatokat gyűjtenek rólunk, és ezekből melyik anonim és melyik személyes.