Az MI, amely önmagát tanítja és felülmúlja az ember által tervezett algoritmusokat

okt 24, 2025 | Tech

A mesterséges intelligencia (MI) fejlődése az elmúlt évtizedekben jelentős előrelépéseket hozott, azonban a tanulási folyamatok hagyományosan emberi beavatkozást igényeltek. Az MI rendszerek működésének alapját képező algoritmusokat emberek tervezték meg, akik meghatározták a tanulási szabályokat és irányelveket. Ez a folyamat azonban lassú és korlátozott volt az emberi intuíció által.

Az MI tanulása: a hagyományos megközelítés

Az MI rendszerek, különösen a megerősítéses tanulás (reinforcement learning, RL) esetében, úgy tanulnak, hogy jutalmakat kapnak sikeres cselekvéseikért. Ez a tanulási mód hasonlít az emberi és állati tanuláshoz, amelyet több millió év evolúció alakított ki. Azonban míg az élőlények természetes úton sajátítják el a tanulást, az MI-nek ezt explicit módon kell megtanítani.

A megerősítéses tanulás során az algoritmusok célja, hogy egy adott környezetben minél hatékonyabban oldjanak meg feladatokat a jutalmak maximalizálásával. Az eddigi módszerekben azonban az algoritmusok szabályait emberek alkották meg, ami korlátozta a fejlődést.

Új megközelítés: az evolúció inspirálta önfejlesztő MI

A kutatók egy forradalmi ötlettel álltak elő: az evolúció véletlenszerű próbálkozásokon alapuló folyamatát alkalmazták digitális MI populációk létrehozására. Ezek az AI ügynökök különböző komplex környezetekben próbáltak megoldani számos feladatot egy adott tanulási szabály alapján.

Egy „meta-hálózat”, vagyis egy szülő MI felügyelte ezeket az ügynököket. Ez a meta-hálózat elemezte az ügynökök teljesítményét, majd módosította a tanulási szabályt annak érdekében, hogy a következő generáció gyorsabban és hatékonyabban tudjon tanulni.

DiscoRL: az önállóan felfedezett tanulási algoritmus

Ennek a folyamatnak eredményeként született meg a DiscoRL nevű új tanulási szabály, amelyet Disco57-ként is emlegetnek (mivel 57 Atari játék tesztelte). Ez az algoritmus minden korábbi ember által tervezett algoritmust felülmúlt komplex feladatok sorozatában.

A kutatócsoport ezt követően Disco57 segítségével képezett ki egy új MI ügynököt, majd összehasonlította teljesítményét olyan vezető emberi fejlesztésű algoritmusokkal, mint például a PPO és MuZero.

Kiemelkedő eredmények ismert és ismeretlen kihívásokon

Először jól ismert Atari játékokon tesztelték az új ügynököt, majd olyan ismeretlen kihívásokkal szembesítették, mint a ProcGen, Crafter és NetHack játékok. Az eredmények lenyűgözőek voltak:

  • Atari Benchmark: A DiscoRL-alapú ügynök jobb eredményeket ért el minden korábbi emberi algoritmusnál.
  • Ismeretlen kihívások: Az új rendszer állapot-of-the-art szinten teljesített, bizonyítva saját tanulási szabályának hatékonyságát.

A jövő útja: automatikusan felfedezett megerősítéses tanulási algoritmusok

A kutatók szerint ezek az eredmények azt sugallják, hogy a jövőben a fejlett mesterséges intelligenciákhoz szükséges megerősítéses tanulási algoritmusokat már nem emberek fogják manuálisan megtervezni. Ehelyett ezek automatikusan fedezhetők fel az AI ügynökök tapasztalatai alapján.

A Nature folyóiratban megjelent tanulmányukban így fogalmaztak: „Ez a munka egy lépést tett afelé, hogy gépek által tervezett megerősítéses tanulási algoritmusok versenyezhessenek és akár túl is szárnyalják a legjobb manuálisan tervezett algoritmusokat bonyolult környezetekben.”

Záró gondolatok

Ez a kutatás új korszakot nyithat a mesterséges intelligencia fejlesztésében: amikor már nemcsak mi tanítjuk az AI-t, hanem maga az AI találja meg legjobb működési módját. Ez nem csupán időt takaríthat meg és növelheti a hatékonyságot, hanem olyan innovációkhoz vezethet, amelyekre eddig nem is gondoltunk volna.

A cikket írta: Paul Arnold
Szerkesztette: Gaby Clark
Ellenőrizte és lektorálta: Robert Egan

Forrás: Junhyuk Oh et al., Discovering state-of-the-art reinforcement learning algorithms, Nature (2025). DOI: 10.1038/s41586-025-09761-x
Eredeti hír: AI teaches itself and outperforms human-designed algorithms (2025)

Forrás: https://techxplore.com/news/2025-10-ai-outperforms-human-algorithms.html

Ransomware fizetések aránya rekordmélypontra süllyedt 2025-ben

A ransomware támadások elleni védekezés hatékonysága nő, miközben a fizetési arányok folyamatosan csökkennek. A legfrissebb adatok szerint 2025 harmadik negyedévében mindössze a megtámadott vállalatok 23%-a adott engedményt a zsarolóprogramos támadóknak, ami...

Hummer EV SUV 2025 – Az elektromos monstrum részletes tesztje és vélemény

Autórajongóként mindig is lenyűgözött a gépek mérnöki megoldásainak szépsége, a vezetés mestersége és az autók sokszínűsége, amely minden igényt kielégít. Én magam is két teljesen eltérő autó büszke tulajdonosa vagyok: egy túlteljesített C6 Corvette és egy 2004-es...

Fitbit új, Gemini-alapú egészségügyi edzője: forradalmi appélmény indul előnézetben

Fitbit egy jelentős lépést tett az egészség és fitnesz világában azzal, hogy bemutatta legújabb, Gemini mesterséges intelligencia alapú egészségügyi edzőjét. Ez az innovatív funkció része egy teljesen átdolgozott Fitbit alkalmazásnak, amelyet még augusztusban...

AI eszközök könyvtára: A legjobb mesterséges intelligencia források egy helyen

A mesterséges intelligencia (AI) rohamos fejlődése új lehetőségeket nyit meg az üzleti életben, a kreatív iparban és a mindennapi életben egyaránt. Az AI eszközök széles választéka azonban gyakran átláthatatlan lehet, ezért összegyűjtöttünk egy átfogó listát a legjobb...

Boroszilikát Üveg Adapterek – Precíz, Tartós Laboratóriumi Megoldások | ESAW India

Az ESAW India vezető boroszilikát üveg adapter beszállítója és exportőre, amely széles választékban kínál tartós, nagy pontosságú adaptereket. Termékeinket kifejezetten a modern laboratóriumok szigorú követelményeinek megfelelően terveztük és gyártottuk. A prémium...

GoPlus és Ningbo Yituo mosógép dizájnjogi vitája – A 512(f) DMCA takedown jogeset elemzése

A GoPlus és a Ningbo Yituo közötti jogvita egy izgalmas példája annak, hogyan ütköznek a szerzői jogi védelem és a piaci verseny érdekei a modern e-kereskedelemben. A két rivális mosógépgyártó vállalat ugyanattól az OEM beszállítótól, a Ningbo Baike Electric...

Robotok az idősgondozásban: Tisztítás, mozgás és gondoskodás a jövőben

Az idősgondozás egyre nagyobb kihívást jelent az Egyesült Királyságban és világszerte. A növekvő idős népesség, a munkaerőhiány és a társadalmi ellátórendszerek terheltsége miatt egyre többen keresik a technológiai megoldásokat. Vajon a robotok lehetnek azok az...

Finnországban egyre kevesebb gyermek születik: családalapítás a változó világban

Poa Pohjola (38) és párja, Wilhelm Blomberg (35) Helsinkiből júliusban köszöntötték első gyermeküket. Bár kezdetben bizonytalanok voltak a családalapítással kapcsolatban, Pohjola a harmincas évei közepén ráébredt, hogy anyává szeretne válni, és Blomberg is egyetértett...

Az AI forradalma az audiófeldolgozásban: Gyorsabb, egyszerűbb és professzionálisabb

Az audiófeldolgozó ipar jelentős átalakuláson megy keresztül, ahogy a mesterséges intelligencia (AI) technológiák alapjaiban változtatják meg a tartalomkészítők munkafolyamatait. Ami korábban órákig tartó manuális szerkesztést, összetett szoftverismeretet és sok...

Ransomware fizetések aránya rekordmélypontra süllyedt 2025-ben

A ransomware támadások elleni védekezés hatékonysága nő, miközben a fizetési arányok folyamatosan csökkennek. A legfrissebb adatok szerint 2025 harmadik negyedévében mindössze a megtámadott vállalatok 23%-a adott engedményt a zsarolóprogramos támadóknak, ami...

Wikipedia: Az ingyenes, megbízható tudás forrása a digitális korban

Wikipedia immár több mint két évtizede áll az internetes tudás hátterében, és továbbra is az egyik legmegbízhatóbb, legátláthatóbb forrásként szolgálja a világot. 2001-es indulása óta a Wikimedia Alapítvány gondozásában működik, amely az egyetlen nonprofit...