Memorizáció és érvelés az AI neurális hálózatokban: Új kutatási irányok a veszteség tájképek elemzésében

nov 11, 2025 | Tech

Az utóbbi években az mesterséges intelligencia (AI) fejlődése robbanásszerű volt, különösen a neurális hálózatok területén. Ezek a modellek képesek komplex feladatokat ellátni, legyen szó nyelvi feldolgozásról, képfelismerésről vagy akár kreatív alkotásokról. Ugyanakkor egyre nagyobb figyelem irányul arra, hogy miként tárolják és kezelik az érzékeny vagy szerzői joggal védett információkat ezek a rendszerek. Egy új kutatás most betekintést nyújt abba, hogyan különböztethetjük meg a memorizált adatokat az érvelési képességektől a neurális hálózatokon belül, és milyen lehetőségek rejlenek az információk célzott eltávolításában.

Az információ eltávolításának jövője az AI-ban

A kutatók szerint, ha az információeltávolító technikák tovább fejlődnek, akkor a jövőben az AI cégek akár képesek lehetnek arra, hogy például szerzői joggal védett tartalmakat, személyes adatokat vagy káros memorizált szövegeket eltávolítsanak egy neurális hálózatból anélkül, hogy ez rontaná a modell átalakító (transzformatív) képességeit. Ez hatalmas előrelépést jelentene mind az adatvédelem, mind a mesterséges intelligencia biztonságos alkalmazása szempontjából.

Ugyanakkor jelenleg még nem teljesen értjük, hogyan tárolják elosztott módon az információkat ezek a hálózatok, ezért a kutatók hangsúlyozzák, hogy jelenlegi módszereik nem garantálják a teljes érzékeny információk eltávolítását. Ez egy új kutatási irány kezdeti lépéseit jelenti az AI területén.

A neurális tájkép bejárása: A veszteség tájkép fogalma

Ahhoz, hogy megértsük, miként különböztetik meg a Goodfire kutatói a memorizációt az érveléstől a neurális hálózatokban, fontos megismerkedni egy alapvető AI-konceptussal: a veszteség tájképpel.

A veszteség tájkép egy vizuális eszköz arra, hogy megmutassa, mennyire helyes vagy helytelen egy AI modell előrejelzése attól függően, hogyan állítjuk be annak belső paramétereit, amelyeket súlyoknak nevezünk.

Képzeljük el úgy, mintha egy összetett gépet hangolnánk be több millió tekerőgomb segítségével. A „veszteség” azt méri, hogy mennyi hibát követ el ez a gép. Ha magas a veszteség, sok hibát vét; ha alacsony, kevés hibát. A „tájkép” pedig azt jelenti, hogy ha minden lehetséges tekerőállást feltérképeznénk, láthatnánk egy térképet arról, hol vannak sok vagy kevés hibával járó beállítások.

Hogyan tanulnak az AI modellek? – A lejtmenet és a völgyek keresése

Az AI modellek tanítása során lényegében „lefelé gurulnak” ezen a veszteség tájképen (ezt hívjuk gradiens csökkenésnek), miközben folyamatosan állítják súlyaikat annak érdekében, hogy megtalálják azokat a mélyedéseket (völgyeket), ahol a hibák száma minimális.

Ez a folyamat biztosítja azt is, hogy az AI képes legyen helyes válaszokat adni kérdésekre vagy más feladatokat ellátni.

A veszteség görbületének elemzése: Memorizált tények vs. érvelési képességek

A Merullo és munkatársai által írt „From Memorization to Reasoning in the Spectrum of Loss Curvature” című tanulmányban (lásd 1. ábra) részletesen elemezték bizonyos nyelvi AI modellek veszteség tájainak görbületét. Ez azt jelenti, hogy megmérték, mennyire érzékeny egy modell teljesítménye apró változtatásokra különböző súlyok esetén.

  • Éles csúcsok és völgyek: Ezek magas görbületet jelentenek – apró változtatások nagy hatással vannak a modell teljesítményére.
  • Lapos síkságok: Alacsony görbületű területek – itt a változtatásoknak minimális hatásuk van.

K-FAC technika alkalmazása és eredményei

A kutatók egy speciális módszert használtak, amelyet K-FAC-nak (Kronecker-Factored Approximate Curvature) hívnak. Ennek segítségével sikerült elkülöníteniuk az egyedi memorizált tények által okozott éles csúcsokat ebben a veszteség tájképben.

Kiderült, hogy minden memorizált tény egy-egy éles kiugrást okoz különböző irányokban. Amikor azonban ezeket átlagolják együtt, akkor ezek az éles kiugrások kiegyenlítik egymást és így lapos profilt alkotnak.

Ezzel szemben azok az érvelési képességek, amelyek sokféle bemenetre épülnek, következetesen mérsékelt görbületű domborzati formákat mutatnak – olyanokat mint enyhe hullámzó dombok –, amelyek nagyjából ugyanazt a formát tartják meg függetlenül attól, hogy honnan közelítjük meg őket.

Következtetések és jövőbeli kilátások

Ezek az eredmények új perspektívát nyitnak meg abban, hogyan érthetjük meg és kezelhetjük az AI rendszerekben tárolt információkat. Azáltal, hogy elkülöníthetjük a memorizált adatokat az általános érvelési képességektől, lehetőség nyílhat arra is, hogy célzottan eltávolítsunk bizonyos érzékeny vagy nem kívánt tartalmakat anélkül, hogy ezzel rontanánk a modell általános teljesítményét.

Bár még korai szakaszban járunk ezen az úton, ezek az eredmények megalapozhatják a jövő fejlettebb adatvédelmi és biztonsági technológiáit mesterséges intelligencia rendszerekben.

Forrás: https://arstechnica.com/ai/2025/11/study-finds-ai-models-store-memories-and-logic-in-different-neural-regions/

Chicago lakói figyelmeztető sípokat terveznek az ICE jelenlétére

Chicago lakói figyelmeztető sípokat terveznek az ICE jelenlétére

Chicago közösségei kreatív és hatékony módon reagálnak az Egyesült Államok Bevándorlási és Vámhivatalának (ICE) tevékenységére. Egyre több helyi lakos készít, oszt meg és nyomtat olyan sípokat, amelyek célja, hogy figyelmeztessék a környezetükben tartózkodókat az ICE...

Tylenol használata terhesség alatt: nincs bizonyított kapcsolat az autizmus és az ADHD kialakulásával

A közelmúltban megjelent átfogó tanulmány szerint nem áll rendelkezésre meggyőző bizonyíték arra, hogy a terhesség alatt alkalmazott paracetamol (közismertebb nevén Tylenol) növelné a gyermekeknél az autizmus spektrumzavar vagy a figyelemhiányos hiperaktivitás-zavar...

November 11, 2025 – Fontos események és részletek

2025. november 11-e számos jelentős eseményt és megemlékezést foglal magában, amelyek mély hatással vannak a társadalomra, a kultúrára és a történelemre egyaránt. Ebben a cikkben részletesen bemutatjuk, miért fontos ez a nap, milyen események zajlanak világszerte,...

Dodge Durango SRT Hellcat: Visszatér a Hemi V8, és terjeszkedik az USA-ban

A Stellantis amerikai márkái nagy lépéseket tesznek a legendás Hemi V8 motor visszahozataláért, melynek élharcosa a Dodge Durango SRT Hellcat. Ez a szuper SUV nemcsak teljesítményével, hanem piaci terjeszkedésével is izgalmas híreket hozott az autórajongóknak. Az...

Az EPA káosza a kormányzati leállás idején: Felfüggesztések és deregulációs törekvések

Az Egyesült Államok kormányzati leállásának vége közeledik, ám a szövetségi ügynökségeknél továbbra is zavaros állapotok uralkodnak. Az Environmental Protection Agency (EPA) munkatársai az elmúlt öt hétben egyre növekvő káosszal szembesültek, ahogy a WIRED-nek...

Szegénység és klímaváltozás: A fejlődő országok és a gazdag nemzetek kihívásai

A klímaváltozás hatásai világszerte egyre nyilvánvalóbbak, ám az egyik legaggasztóbb tény, hogy még a fejlett országokban is a szegényebb rétegek vannak leginkább kitéve az extrém időjárási jelenségeknek. Egy friss kutatás szerint a fejlett államokban élő szegény...

Zöld pénzügyek és a klímaváltozás: A horizont tragédiája és a fenntartható finanszírozás kihívásai

Mark Carney, a Bank of England egykori kormányzója, jelenleg Kanada miniszterelnöke, tíz évvel ezelőtt egy meghatározó beszédében világított rá arra, hogy a klímaváltozás nem csupán környezeti, hanem súlyos gazdasági kockázatot is jelent, amely fenyegeti a pénzügyi...

A figyelem gazdasága és a digitális kor kihívásai

A figyelem gazdasága fogalma az elmúlt évtizedekben egyre nagyobb jelentőséget kapott, különösen az internet és a digitális platformok térnyerésével. Ez a cikk átfogó képet nyújt a témáról, bemutatva annak elméleti alapjait, gyakorlati megjelenési formáit, valamint a...

Lauren Morais és Diane Morgan csatlakoznak a Marvel Cinematic Universe-hez a Disney+ “VisionQuest” sorozatában

A Marvel Cinematic Universe (MCU) rajongói izgalmas hírt kaptak: két új tehetség, Lauren Morais és Diane Morgan, csatlakozik az MCU világához az érkező Disney+ sorozat, a “VisionQuest” révén. A sorozat a már jól ismert “WandaVision” és “Agatha All Along” történetét...

Feliratkozás és Adatvédelem: Mit Jelent, Ha Hírlevelet Kapsz?

Az online világban egyre gyakrabban találkozunk olyan lehetőségekkel, amikor e-mail címünk megadásával iratkozhatunk fel különböző hírlevelekre vagy marketing üzenetekre. De vajon pontosan mit is jelent ez a gyakorlatban? Milyen jogokat és kötelezettségeket vállalunk,...

Teljes digitális hozzáférés a Financial Times minőségi újságírásához – Éves előfizetéssel 20% kedvezmény

A Financial Times (FT) az egyik legelismertebb nemzetközi üzleti és gazdasági napilap, amely mélyreható elemzéseket, hiteles híreket és szakértői véleményeket kínál az iparág vezetőitől. Ha Ön is szeretne naprakész lenni a globális gazdasági trendekkel, piaci...