Az AI-alapú ügyfélszolgálati asszisztensek napjaink egyik legnépszerűbb technológiai trendjévé váltak. A mesterséges intelligencia fejlődése lehetővé teszi, hogy ezek az asszisztensek ne csak egyszerű kérdésekre válaszoljanak, hanem komplex feladatokat is ellássanak, például weboldalak navigálását vagy akár vásárlások lebonyolítását. De vajon mennyire bízhatjuk rájuk pénzügyi döntéseinket, például hitelkártyánk használatát?
A Microsoft szimulált piactere: Magentic Marketplace
A Microsoft kutatói egy nyílt forráskódú, szimulált piacteret hoztak létre, amelynek célja, hogy az AI ügynököket valósághű környezetben teszteljék. Ez a platform, a Magentic Marketplace, lehetővé teszi az ügynökök közötti kommunikációt, áruk és szolgáltatások katalógusának kezelését, valamint szimulált fizetések lebonyolítását.
A kutatás során különböző tranzakciókat modelleztek, mint például ételrendelés vagy otthoni felújítási szolgáltatások igénybevétele. Az AI ügynökök mind az ügyfelek, mind az eladók szerepét betöltötték, így komplex interakciókat tudtak lefolytatni egymással.
Kísérleti környezet és résztvevők
A kísérletek során 100 virtuális ügyfél és 300 virtuális vállalkozás vett részt. Az AI modellek között megtalálhatók voltak mind a zárt forráskódú rendszerek (például GPT-4o és Gemini-2.5-Flash), mind pedig nyílt forrású megoldások. Az ügynökök lekérdezéseket építettek fel, keresési eredményeket navigáltak és tárgyalták le a tranzakciókat.
Eredmények és tanulságok
Az AI ügynökök segíthetnek ugyan a döntéshozatalban, hiszen képesek sokkal több lehetőséget figyelembe venni egyszerre, mint egy ember, azonban a túl sok választási lehetőség inkább rontotta az összehasonlítások számát. A legtöbb modell – kivéve néhány kiemelkedőt, mint a Gemini-2.5-Flash és GPT-5 – hajlamos volt elfogadni az első „elég jó” opciót anélkül, hogy mélyebben feltérképezte volna a lehetőségeket.
Manipulációs kísérletek és biztonsági aggályok
A kutatók különféle manipulációs stratégiákat is teszteltek: hamis díjakkal való megtévesztéstől kezdve hamis értékelésekig és prompt injekciókig terjedtek ezek az eszközök. Az eredmények vegyesek voltak: míg a Gemini-2.5-Flash modell általában ellenálló volt ezekkel szemben, más modelleket könnyen megtévesztettek.
Különösen aggasztó volt, hogy prompt injekciós technikákkal sikerült irányítani a fizetéseket manipuláló ügynökökhöz, továbbá az egyszerűbb meggyőzési módszerek is hatékonyaknak bizonyultak.
“Ezek az eredmények kritikus biztonsági aggályokat vetnek fel az ügynökalapú piacterekkel kapcsolatban,” hangsúlyozták a kutatók.
Az AI-modellek jelenlegi korlátai
A tanulmány rámutatott arra is, hogy az AI modellek még nem tökéletesek: nehezen kezelik a túl sok választási lehetőséget és sebezhetőek manipulációval szemben. Emellett egyes modellek torzításokat mutattak, például nem feltétlenül érdem alapján választották ki az üzleteket, hanem azok helyezése alapján a találati listán.
A piactér dinamikája és jövőbeli kihívások
A jelenlegi kutatás statikus piacokra fókuszált, azonban a valós világ dinamikusabb: az ügynökök és felhasználók idővel tanulnak és alkalmazkodnak egymáshoz. Ez további kihívásokat jelent majd a rendszertervezésben és működtetésben.
Felügyelet nélkülözhetetlen lesz különösen nagy tétű tranzakcióknál annak érdekében, hogy elkerüljük a visszaéléseket és biztosítsuk a megbízható működést.
Következtetés: Segítség vagy helyettesítés?
A Microsoft kutatóinak összegzése szerint az AI ügynököknek inkább segíteniük kellene az emberi döntéshozatalt, nem pedig helyettesíteni azt. Egyelőre tehát érdemes megfontolni, mielőtt teljes mértékben átadnánk pénzügyi döntéseinket egy mesterséges intelligenciának.
“Egy olyan szimulációs környezet, mint a Magentic Marketplace létfontosságú ahhoz, hogy megértsük a piac összetevői és az ügynökök közötti kölcsönhatásokat még mielőtt széles körben bevezetnénk őket.”
Összességében tehát: bár az AI-alapú asszisztensek ígéretesek és képesek megkönnyíteni életünket, jelenleg még nem állnak készen arra, hogy teljes felelősséget vállaljanak pénzügyi tranzakcióinkért. A biztonságos és megbízható működés érdekében továbbra is szükség van emberi kontrollra és folyamatos fejlesztésre.
Forrás: https://www.theregister.com/2025/11/06/microsoft_unveils_the_magentic_marketplace/