Az Alpha Arena legújabb, élő kriptokereskedési kísérlete az első hét után izgalmas betekintést nyújt abba, hogy a világ vezető mesterséges intelligenciái milyen eltérő módon kezelik a pénzügyi piacok kockázatait. Miközben egyes AI rendszerek tapasztalt kvantitatív kereskedői asztalokként viselkednek, mások bizonytalanságukban megdermednek, így jól láthatóvá válik az automatizált kereskedés jelenlegi állapota és kihívásai.
A gépek és a piac találkozása
A kínai fejlesztésű DeepSeek Chat V3.1 magabiztosan vezeti a mezőnyt, 14%-os nyereséggel az első helyen áll. Őt követi a Claude Sonnet 4.5 12%-os pluszban, míg Elon Musk által támogatott Grok 4 4,7%-os emelkedést ért el. Ezzel szemben a mezőny másik végén találjuk a Gemini 2.5 Pro-t és a GPT-5-öt, amelyek egyaránt mintegy 40%-os veszteséget könyveltek el. A középmezőnyben helyezkedik el a Qwen 3 Max, amely -13%-os teljesítményt mutat.
Pénzügyi eredmények összefoglalója (2023. október 21-ig)
- DeepSeek Chat V3.1: +13,74%
- Claude Sonnet 4.5: +11,53%
- Grok 4: +4,67%
- Qwen 3 Max: -12,82%
- Gemini 2.5 Pro: -38,47%
- GPT-5: -40,43%
Kockázatvállalás vagy óvatosság? – Különböző stratégiák az AI-k között
A Grok és DeepSeek rendszerek erősen támaszkodnak irányított meggyőződésükre: gyorsan reagálnak és pozíciókat váltanak jelentős kriptovalutákban, mint például a Bitcoin (BTC), Ethereum (ETH) és Solana (SOL). Ezzel szemben Claude Sonnet kiegyensúlyozottabb teljesítményt mutat, amely egy fegyelmezett kockázatkezelési modell eredménye – ez korlátozza az expozíciót a piaci ingadozások idején.
A Gemini 2.5 Pro jelentős visszaesése elsősorban a „režimváltásból” ered – vagyis gyors stratégiaváltásokból, amelyek volatilis piaci környezetben tovább növelték a veszteségeket. Ezzel szemben a GPT-5 túlzottan konzervatív volt: bár így elkerülte a nagy hibákat, nem tudott profitálni a piaci lendületből, így gyakorlatilag „beragadt” egy biztonsági zónába.
A teszt menete – Hogyan működik az élő kereskedés?
Minden AI egyenként kapott egy-egy 10 000 dolláros számlát a Hyperliquid platformon, ahol kripto-perpetuális szerződésekkel kereskedtek azonos kiindulási utasításokkal és teljes átláthatóság mellett az ügyletek végrehajtásában. Emberi beavatkozás nem megengedett – az egyetlen cél az volt, hogy maximalizálják a kockázattal korrigált hozamot 2023. október 17. és november 3. között.
A teszt célja annak vizsgálata volt, hogy napjaink legfejlettebb nyelvi modellei képesek-e önálló kereskedési ügynökként működni: ötleteket generálni, belépési időpontokat meghatározni, kockázatot méretezni és kezelni az expozíciót emberi intuíció nélkül.
Két út az AI-alfa felé – Melyik stratégia bizonyul életképesnek?
Ha az eddigi eredmények fennmaradnak, úgy tűnik két versengő út létezik a gépi piaci sikerhez:
- A pénzügyi szakértői modell: Ezt képviseli például a DeepSeek, amely domain-specifikus képzést kapott, saját adatbázisokat használ és beépített szabályrendszerekkel dolgozik.
- Az általános alkalmazkodó opportunista: Ilyen például Grok, amely gyors reakciókra és egyértelmű piaci tézisekre épít inkább, mint mélyreható piaci előismeretekre.
A következő két hét dönt majd arról, melyik megközelítés skálázható hosszú távon és melyik omlik össze élő piaci nyomás alatt.
Záró gondolatok
Az Alpha Arena élő kriptokereskedési kísérlete izgalmas bepillantást enged abba, hogyan birkóznak meg az AI rendszerek valós piaci körülmények között a kockázatokkal és lehetőségekkel. A különböző stratégiák eredményei jól mutatják az automatizált kereskedés sokszínűségét és azt is, hogy még mindig nincs egyetlen mindenki számára tökéletes megoldás.
Ezek az eredmények nemcsak technológiai érdekességek: alapvetően formálhatják át azt is, hogyan képzeljük el a jövő pénzügyi piacait és azok szereplőit – legyen szó emberi vagy gépi döntéshozókról.