Írta: Max Kozlov & Nature magazin
Bevezetés: A gondolatok szöveggé alakítása
A jövő tudományos víziója, miszerint képesek leszünk olvasni mások gondolatait az agyi aktivitásuk alapján, most egy lépéssel közelebb került a valósághoz. Egy új, „gondolatfeliratozásnak” nevezett technika lehetővé teszi, hogy egy személy fejében megjelenő képeket vagy jeleneteket pontos mondatok formájában írjon le – mindezt nem invazív agyi képalkotó módszerrel, funkcionális mágneses rezonancia képalkotással (fMRI).
Ez a technológia nem csupán a látottak pontos leírását teszi lehetővé, hanem betekintést nyújt abba is, hogyan reprezentálja az agy a világot még mielőtt a gondolatok szavakká formálódnának. Emellett segíthet azoknak is, akik nyelvi nehézségekkel küzdenek, például stroke utáni kommunikációs problémák esetén.
A technológia működése és jelentősége
Alex Huth, a kaliforniai Berkeley Egyetem számítógépes idegtudósa szerint a modell „rendkívül részletesen” képes megjósolni, hogy mit néz egy személy. Ez különösen figyelemre méltó, hiszen az ilyen részletesség elérése rendkívül nehéz feladat.
Korábbi kutatások és kihívások
Több mint egy évtizede léteznek olyan módszerek, amelyek segítségével megjósolható, hogy egy személy mit lát vagy hall az agyi aktivitás alapján. Azonban komplex tartalmak – például rövid videók vagy absztrakt formák – értelmezése eddig komoly akadályokba ütközött.
Tomoyasu Horikawa, a japán NTT Communication Science Laboratories számítógépes idegtudósa elmondta, hogy korábbi próbálkozások csak kulcsszavakat tudtak azonosítani a látottakról, nem pedig a teljes kontextust vagy cselekményt. Más kísérletek mesterséges intelligencia (AI) modelleket használtak mondatszerkezet generálására, ami megnehezítette annak megállapítását, hogy a leírás valóban az agyban reprezentált információt tükrözi-e.
A „gondolatfeliratozás” módszere
Horikawa és csapata először egy mélytanuló nyelvi AI modellt alkalmazott több mint 2000 videó szöveges feliratainak elemzésére. Minden videót egyedi numerikus „jelentés-aláírássá” alakítottak át. Ezután egy másik AI eszközt tanítottak be hat résztvevő agyi képalkotó adataira, miközben azok nézték a videókat. A rendszer megtanulta felismerni azokat az agyi aktivitásmintázatokat, amelyek megfelelnek az egyes jelentés-aláírásoknak.
Miután betanították, a rendszer képes volt új agyi felvételekből kinyerni a jelentés-aláírást és egy külön AI szövegalkotó eszköz segítségével megtalálni azt a mondatot, amely leginkább megfelel ennek az aláírásnak.
Példa a működésre
Egy résztvevő például megnézett egy rövid videót, amelyen egy személy ugrik le egy vízesés tetejéről. Az AI modell először olyan kifejezéseket tippelt, mint „spring flow” (tavaszi áramlás), majd tízedik próbálkozásra „above rapid falling water fall” (gyorsan zuhanó vízesés felett), végül századik próbálkozásra pontosan megfogalmazta: „a person jumps over a deep water fall on a mountain ridge” (egy személy ugrik át egy mély vízesésen egy hegygerincen).
A kutatók arra is megkérték a résztvevőket, hogy idézzék fel korábban látott videók jeleneteit. Az AI sikeresen generált ezekről is pontos leírásokat, ami arra utal, hogy az agy hasonló módon reprezentálja mind a látottakat, mind az emlékeket.
A jövő lehetőségei és etikai kérdések
Ez a nem invazív fMRI alapú technika hozzájárulhat ahhoz is, hogy továbbfejlesszük az implantált agy-számítógép interfészeket (BCI), amelyek közvetlenül képesek lehetnek nem verbális mentális reprezentációkat szöveggé alakítani. Alex Huth szerint „ha ezeket a mesterséges rendszereket használva el tudjuk érni ezt, talán segíthetünk azoknak az embereknek is, akik kommunikációs nehézségekkel küzdenek.”
Mentális magánélet és adatvédelem: Az ilyen fejlesztések azonban komoly aggályokat vetnek fel a mentális magánélet védelmével kapcsolatban. Ahogy közelebb kerülünk ahhoz, hogy feltárjuk intim gondolatainkat, érzelmeinket vagy egészségi állapotunkat – amelyek elméletileg visszaélésre vagy diszkriminációra is alkalmasak lehetnek –, fontos biztosítani ezeknek az adatoknak védelmét.
Huth és Horikawa hangsúlyozzák: jelenleg egyik modell sem lépi át azt a határt, amely lehetővé tenné privát gondolatok olvasását vagy azok engedély nélküli feltárását. Ezekhez ugyanis mindig szükség van a résztvevők beleegyezésére.
Záró gondolatok
A „gondolatfeliratozás” technológiája forradalmi lépést jelenthet abban, ahogyan megértjük és kommunikáljuk mentális világunkat. Nemcsak tudományos áttörést hozhat az idegtudományban és mesterséges intelligenciában, hanem gyakorlati segítséget nyújthat azok számára is, akik számára eddig nehézkes volt a kommunikáció.
Ugyanakkor fontos szem előtt tartani az etikai kérdéseket és biztosítani azt, hogy ezek az innovációk mindig tiszteletben tartsák az emberi jogokat és magánszférát.






