Memorizáció és érvelés az AI neurális hálózatokban: Új kutatási irányok a veszteség tájképek elemzésében

nov 11, 2025 | Tech

Az utóbbi években az mesterséges intelligencia (AI) fejlődése robbanásszerű volt, különösen a neurális hálózatok területén. Ezek a modellek képesek komplex feladatokat ellátni, legyen szó nyelvi feldolgozásról, képfelismerésről vagy akár kreatív alkotásokról. Ugyanakkor egyre nagyobb figyelem irányul arra, hogy miként tárolják és kezelik az érzékeny vagy szerzői joggal védett információkat ezek a rendszerek. Egy új kutatás most betekintést nyújt abba, hogyan különböztethetjük meg a memorizált adatokat az érvelési képességektől a neurális hálózatokon belül, és milyen lehetőségek rejlenek az információk célzott eltávolításában.

Az információ eltávolításának jövője az AI-ban

A kutatók szerint, ha az információeltávolító technikák tovább fejlődnek, akkor a jövőben az AI cégek akár képesek lehetnek arra, hogy például szerzői joggal védett tartalmakat, személyes adatokat vagy káros memorizált szövegeket eltávolítsanak egy neurális hálózatból anélkül, hogy ez rontaná a modell átalakító (transzformatív) képességeit. Ez hatalmas előrelépést jelentene mind az adatvédelem, mind a mesterséges intelligencia biztonságos alkalmazása szempontjából.

Ugyanakkor jelenleg még nem teljesen értjük, hogyan tárolják elosztott módon az információkat ezek a hálózatok, ezért a kutatók hangsúlyozzák, hogy jelenlegi módszereik nem garantálják a teljes érzékeny információk eltávolítását. Ez egy új kutatási irány kezdeti lépéseit jelenti az AI területén.

A neurális tájkép bejárása: A veszteség tájkép fogalma

Ahhoz, hogy megértsük, miként különböztetik meg a Goodfire kutatói a memorizációt az érveléstől a neurális hálózatokban, fontos megismerkedni egy alapvető AI-konceptussal: a veszteség tájképpel.

A veszteség tájkép egy vizuális eszköz arra, hogy megmutassa, mennyire helyes vagy helytelen egy AI modell előrejelzése attól függően, hogyan állítjuk be annak belső paramétereit, amelyeket súlyoknak nevezünk.

Képzeljük el úgy, mintha egy összetett gépet hangolnánk be több millió tekerőgomb segítségével. A „veszteség” azt méri, hogy mennyi hibát követ el ez a gép. Ha magas a veszteség, sok hibát vét; ha alacsony, kevés hibát. A „tájkép” pedig azt jelenti, hogy ha minden lehetséges tekerőállást feltérképeznénk, láthatnánk egy térképet arról, hol vannak sok vagy kevés hibával járó beállítások.

Hogyan tanulnak az AI modellek? – A lejtmenet és a völgyek keresése

Az AI modellek tanítása során lényegében „lefelé gurulnak” ezen a veszteség tájképen (ezt hívjuk gradiens csökkenésnek), miközben folyamatosan állítják súlyaikat annak érdekében, hogy megtalálják azokat a mélyedéseket (völgyeket), ahol a hibák száma minimális.

Ez a folyamat biztosítja azt is, hogy az AI képes legyen helyes válaszokat adni kérdésekre vagy más feladatokat ellátni.

A veszteség görbületének elemzése: Memorizált tények vs. érvelési képességek

A Merullo és munkatársai által írt „From Memorization to Reasoning in the Spectrum of Loss Curvature” című tanulmányban (lásd 1. ábra) részletesen elemezték bizonyos nyelvi AI modellek veszteség tájainak görbületét. Ez azt jelenti, hogy megmérték, mennyire érzékeny egy modell teljesítménye apró változtatásokra különböző súlyok esetén.

  • Éles csúcsok és völgyek: Ezek magas görbületet jelentenek – apró változtatások nagy hatással vannak a modell teljesítményére.
  • Lapos síkságok: Alacsony görbületű területek – itt a változtatásoknak minimális hatásuk van.

K-FAC technika alkalmazása és eredményei

A kutatók egy speciális módszert használtak, amelyet K-FAC-nak (Kronecker-Factored Approximate Curvature) hívnak. Ennek segítségével sikerült elkülöníteniuk az egyedi memorizált tények által okozott éles csúcsokat ebben a veszteség tájképben.

Kiderült, hogy minden memorizált tény egy-egy éles kiugrást okoz különböző irányokban. Amikor azonban ezeket átlagolják együtt, akkor ezek az éles kiugrások kiegyenlítik egymást és így lapos profilt alkotnak.

Ezzel szemben azok az érvelési képességek, amelyek sokféle bemenetre épülnek, következetesen mérsékelt görbületű domborzati formákat mutatnak – olyanokat mint enyhe hullámzó dombok –, amelyek nagyjából ugyanazt a formát tartják meg függetlenül attól, hogy honnan közelítjük meg őket.

Következtetések és jövőbeli kilátások

Ezek az eredmények új perspektívát nyitnak meg abban, hogyan érthetjük meg és kezelhetjük az AI rendszerekben tárolt információkat. Azáltal, hogy elkülöníthetjük a memorizált adatokat az általános érvelési képességektől, lehetőség nyílhat arra is, hogy célzottan eltávolítsunk bizonyos érzékeny vagy nem kívánt tartalmakat anélkül, hogy ezzel rontanánk a modell általános teljesítményét.

Bár még korai szakaszban járunk ezen az úton, ezek az eredmények megalapozhatják a jövő fejlettebb adatvédelmi és biztonsági technológiáit mesterséges intelligencia rendszerekben.

Forrás: https://arstechnica.com/ai/2025/11/study-finds-ai-models-store-memories-and-logic-in-different-neural-regions/

Chicago lakói figyelmeztető sípokat terveznek az ICE jelenlétére

Chicago lakói figyelmeztető sípokat terveznek az ICE jelenlétére

Chicago közösségei kreatív és hatékony módon reagálnak az Egyesült Államok Bevándorlási és Vámhivatalának (ICE) tevékenységére. Egyre több helyi lakos készít, oszt meg és nyomtat olyan sípokat, amelyek célja, hogy figyelmeztessék a környezetükben tartózkodókat az ICE...

Jeremy Renner és Yi Zhou jogi vitája az AI-animált Stardust Futures kapcsán

Jeremy Renner, a Hawkeye sztárja, több milliós kártérítési pert helyez kilátásba egy dokumentumfilmes ellen, aki állítása szerint engedély nélkül használta fel hangját egy mesterséges intelligencia által készített animációs filmben. Az ügy azonban jóval összetettebb...

A szülés utáni depresszió és az autizmus spektrum zavar közötti kapcsolat: Nagyszabású svéd kutatás eredményei

A szülés utáni depresszió (PPD) a világon az egyik leggyakoribb pszichiátriai állapot az újdonsült anyák körében, amely a gyermek fejlődésére is jelentős hatással lehet. Egy új, Svédországban végzett nagyszabású epidemiológiai vizsgálat feltárta a PPD és az autizmus...

Chicago lakói figyelmeztető sípokat terveznek az ICE jelenlétére

Chicago közösségei kreatív és hatékony módon reagálnak az Egyesült Államok Bevándorlási és Vámhivatalának (ICE) tevékenységére. Egyre több helyi lakos készít, oszt meg és nyomtat olyan sípokat, amelyek célja, hogy figyelmeztessék a környezetükben tartózkodókat az ICE...

Az Egyesült Államok Belbiztonsági Hálózata és a Főiskolai Futball Megfigyelése

A FOIAball, egy főiskolai futballra és közérdekű adatokra fókuszáló hírlevél, korábban már közölt egy cikket arról, hogy az Egyesült Államok Belbiztonsági Minisztériuma (DHS) hogyan alkalmazza a Homeland Security Information Network (HSIN) nevű információmegosztó...

Goldman Sachs vezérigazgatója figyelmeztet az Egyesült Államok növekvő államadósságára

David Solomon, a Goldman Sachs vezérigazgatója élesen figyelmeztetett az Egyesült Államok államadósságának drámai növekedésére. A jelenlegi pénzügyi pálya folytatódása esetén, jelentős gazdasági bővülés nélkül, „elszámolásra” kell számítani – fogalmazott a pénzügyi...

Oklo Inc. megkapta az engedélyt az Aurora üzemanyaggyártó létesítményére az Idaho Nemzeti Laboratóriumban

Idaho Falls, Idaho – 2025. november 11. – Az Oklo Inc. (NYSE: OKLO), egy fejlett nukleáris technológiával foglalkozó vállalat, bejelentette, hogy az Egyesült Államok Energiaügyi Minisztériumának (DOE) Idaho Műveleti Irodája jóváhagyta a Nukleáris Biztonsági Tervezési...

ClickFix és PureRAT: Új, kifinomult kártevő kampányok Windows és macOS felhasználók ellen

Az online biztonság területén folyamatosan újabb és újabb fenyegetések jelennek meg, amelyek egyre kifinomultabb módszerekkel próbálják megfertőzni a felhasználók számítógépeit. Egy friss jelentés szerint két különálló, de hasonló technikákat alkalmazó kampány is...

Az Egyesült Államok és az EU államadósságának összehasonlítása: Miért bírja jobban az USA a magas adósságot?

2025 elején három európai uniós gazdaság – Görögország, Olaszország és Franciaország – egyértelműen 100% feletti államadósság/GDP aránnyal rendelkezik. Hasonló helyzetben van az Egyesült Államok is, ahol a közadósság a GDP körülbelül 120%-át teszi ki. Papíron tehát...

Fenntartható és tápláló növényi alapú étrendek: összehasonlító elemzés

A növényi alapú étrendek (PBD-k) globális elterjedése egyre növekszik, amit számos etikai, vallási, egészségügyi, társadalmi és környezeti tényező motivál. A nyugati étrendekről PBD-kre való áttérés jelentős mértékben csökkentheti az üvegházhatású gázok kibocsátását,...

Sally Kirkland: Egy sokoldalú színésznő életútja és öröksége

Sally Kirkland, a New York-i születésű színésznő, aki egykor modellként kezdte pályafutását, majd a színpadon, filmvásznon és televízióban is rendszeres szereplővé vált, 84 éves korában elhunyt. Legismertebb alakításai közé tartozik a Paul Newman és Robert Redford...