Az agyi aktivitás olvasása: a „mind captioning” technológia forradalma

nov 5, 2025 | Tudomány

Agyunk működésének feltérképezése és értelmezése régóta az egyik legnagyobb kihívás a tudományban. A funkcionális mágneses rezonancia képalkotás (fMRI) segítségével ma már nem-invazív módon vizsgálhatjuk az agyi aktivitást, és egyre közelebb kerülünk ahhoz, hogy megértsük, mit lát vagy képzel el egy személy pusztán az agyhullámainak elemzésével. Az újonnan kifejlesztett „mind captioning” (gondolatfelirat) technika forradalmi lépést jelent ebben a folyamatban, hiszen képes leíró mondatokat generálni arról, amit az ember éppen lát vagy elképzel.

Mi az a „mind captioning” és hogyan működik?

A „mind captioning” egy olyan módszer, amely az agyi aktivitás fMRI-vel rögzített mintázatait elemzi, majd mesterséges intelligencia segítségével megalkotja annak a leírását, amit a személy éppen lát vagy gondol. Ez a technika nem csupán kulcsszavakat azonosít, hanem részletes, összefüggő mondatokat képes alkotni, amelyek pontosan tükrözik a vizuális élményt vagy képzeletet.

Alex Huth, a kaliforniai Berkeley Egyetem számítási idegtudósa szerint: „Ez nagyon nehéz feladat, és meglepő, hogy ilyen részletességgel képesek vagyunk megjósolni, mit néz valaki.”

A kutatás háttere és jelentősége

Már több mint tíz éve folynak kísérletek arra, hogy az agyi aktivitás alapján megjósolják, mit lát vagy hall egy személy. Azonban komplex tartalmak – például rövid videók vagy absztrakt formák – dekódolása sokkal nagyobb kihívást jelentett. Korábbi próbálkozások csak kulcsszavakat tudtak azonosítani, amelyek leírták a látottakat, de nem adtak teljes kontextust vagy részletes magyarázatot arra vonatkozóan, mi történik a videóban.

Tomoyasu Horikawa, a japán NTT Communication Science Laboratories számítási idegtudósa elmondta: „Más módszerek mesterséges intelligenciát használtak mondatszerkezetek generálására, de így nehéz volt megállapítani, hogy ezek a leírások valóban az agyban reprezentált tartalmakból származnak-e.”

A „mind captioning” technika lépései

  1. Szöveges elemzés: Egy mélytanuló nyelvi AI modellt alkalmaztak több mint 2000 videó szöveges felirataira. Ezáltal minden videóhoz egyedi numerikus „jelentés aláírás” (meaning signature) készült.
  2. Agyi aktivitás tanítása: Hat résztvevő agyi fMRI-felvételeit elemezték miközben nézték ezeket a videókat. Egy külön AI eszköz megtanulta felismerni azokat az agyi aktivitási mintázatokat, amelyek megfelelnek az egyes jelentés aláírásoknak.
  3. Új adatok dekódolása: A betanított modell képes volt új agyi felvételekből kinyerni a jelentés aláírást akkor is, amikor valaki új videót nézett.
  4. Szöveg generálása: Egy másik AI szövegalkotó eszköz ezután megkereste azt a mondatot, amely leginkább megfelel a dekódolt jelentés aláírásnak.

Milyen előnyökkel járhat ez a technológia?

A „mind captioning” nem csupán tudományos áttörésként szolgálhat az agykutatásban, hanem gyakorlati alkalmazásokkal is bírhat. Különösen ígéretes lehet azok számára, akik nyelvi nehézségekkel küzdenek – például stroke után –, mivel segíthet nekik pontosabban kommunikálni gondolataikat és érzéseiket.

Ezen túlmenően betekintést nyújt abba is, hogyan reprezentálja az emberi agy a világot még mielőtt azt szavakba öntenénk. Ez új perspektívákat nyithat meg a kognitív tudományok és mesterséges intelligencia fejlesztése terén is.

Összegzés

A funkcionális mágneses rezonancia képalkotás és a mesterséges intelligencia ötvözése révén létrejött „mind captioning” technológia forradalmasíthatja azt, ahogyan megértjük és kommunikáljuk gondolatainkat. Bár még korai szakaszban van, már most lenyűgöző pontossággal képes leírni azt, amit egy személy lát vagy elképzel. Ez nemcsak tudományos áttörés, hanem potenciális segítség lehet azok számára is, akiknek nehézséget okoz a beszéd vagy írás.

Forrás: National Institute of Mental Health/National Institutes of Health/SPL; Science Advances

Forrás: https://www.nature.com/articles/d41586-025-03624-1

FAA 10%-os légi forgalomcsökkentést vezet be 40 nagy forgalmú amerikai repülőtéren

Washington D.C., 2024. április – A Szövetségi Légügyi Hivatal (Federal Aviation Administration, FAA) szerdán bejelentette, hogy péntektől kezdődően 10%-kal csökkenti a légi forgalmat az Egyesült Államok 40 legforgalmasabb repülőterén. Ez a lépés közvetlen válasz az...

Okos porszívók és az otthonod 3D térképezése: adatvédelem és biztonság

Az okos eszközök világa egyre inkább beépül mindennapjainkba, azonban nem minden „okos” készülék olyan ártalmatlan vagy biztonságos, mint amilyennek elsőre tűnik. Az utóbbi időben egy újabb aggasztó eset került napvilágra, amely rávilágít arra, hogy a modern...

OpenAI CFO Sarah Friar a Szövetségi Garanciákról az AI Chip Beruházások Támogatására

Sarah Friar, az OpenAI pénzügyi igazgatója (CFO) nemrégiben a Wall Street Journal Tech Live eseményén Kaliforniában részletesen beszélt a mesterséges intelligencia (AI) fejlesztésének egyik legnagyobb kihívásáról: a hatalmas beruházások finanszírozásáról, különösen az...

AI és könyvellenőrzés az iskolai könyvtárakban: a texasi iskolaszékek új kihívásai

Nick Herrera egy rövid szünetet tartva a Lake Travis középiskola könyvtárában januárban, telefonját böngészte. Az iskola könyvtári anyagairól szóló viták közepette, 2024 márciusában a Lake Travis iskolaszék egy szülői kérésre reagálva megőrizte az egyik könyv...

Sam Smith őszintén a tinédzserkori liposzukcióról és önelfogadásról

Sam Smith, a világhírű énekes-dalszerző, aki olyan slágerekkel vált ismertté, mint a „Latch”, nemrégiben nyíltan beszélt fiatalkori nehézségeiről és arról a döntéséről, hogy 13 évesen liposzukción essen át. A műtét és az azt megelőző időszak mélyen meghatározta...

Az Egyesült Államok Legfelsőbb Bírósága és Trump vámháborúja: Jog, Gazdaság és Nemzetbiztonság

Az Egyesült Államok Legfelsőbb Bírósága hamarosan megkezdi azokat a szóbeli tárgyalásokat, amelyek során egy fontos jogi kihívást vizsgálnak meg: vajon Donald Trump elnök jogosult-e arra, hogy széles körű vámokat vessen ki az importált árukra az 1977-es nemzetközi...

FOMC: Az amerikai monetáris politika kulcsszereplője

A Federal Open Market Committee (FOMC) az Egyesült Államok jegybankrendszerének, a Federal Reserve Systemnek (Fed) egyik legfontosabb döntéshozó testülete. Feladata, hogy meghatározza az ország monetáris politikájának irányvonalát, különösen a federal funds rate,...

AMC Theatres negyedéves eredményei: visszaesés a jegyeladásokban és veszteségek a 2025-ös év harmadik negyedében

Az AMC Theatres, a világ legnagyobb mozihálózata, nagy reményeket fűzött a 2025-ös nyári filmekhez, mint például a Jurassic World Rebirth, Weapons és Superman. Ezek az alkotások ugyan kasszasikert értek el, azonban bevételük messze elmaradt az előző év nyarának...

Hyundai AutoEver America kibertámadás: személyes adatok kerültek veszélybe

Hyundai AutoEver America (HAEA), a Hyundai Motor Group leányvállalata, amely az autóipari informatikai megoldások és szolgáltatások teljes életciklusát támogatja, nemrégiben súlyos kibertámadás áldozata lett. A támadók behatoltak a cég informatikai környezetébe, és...

Biometrikus adatok gyűjtése az amerikai bevándorlási rendszerben – aggályok és következmények

Az Egyesült Államok Belbiztonsági Minisztériuma (Department of Homeland Security, DHS) egy új, vitatott szabálymódosítást javasolt, amely lehetővé tenné a széles körű biometrikus adatok gyűjtését minden bevándorlóról, korhatár nélkül. Ez a lépés komoly aggodalmakat...