Az utóbbi években a mesterséges intelligencia (AI) startupokba áramló hatalmas befektetések miatt kiváló időszakot élünk az AI kutatók számára, akik új ötleteiket szeretnék megvalósítani. Ha az ötlet kellően újszerű, gyakran könnyebb független vállalkozásként megszerezni a szükséges erőforrásokat, mint egy nagy laboratórium részeként. Ezt a tendenciát példázza az Inception, egy olyan startup, amely diffúziós alapú AI modelleket fejleszt, és nemrégiben 50 millió dolláros seed finanszírozást kapott.
Az Inception sikertörténete és finanszírozási háttere
Az Inception finanszírozási körét a Menlo Ventures vezette, amelyhez olyan neves befektetők csatlakoztak, mint a Mayfield, Innovation Endeavors, Microsoft M12 alapja, Snowflake Ventures, Databricks Investment és az Nvidia kockázati tőke ága, az NVentures. Ezen felül Andrew Ng és Andrej Karpathy angyalbefektetőként is támogatták a projektet.
Stefano Ermon professzor vezetésével a diffúziós modellek új dimenziói
A projekt élén Stefano Ermon, a Stanford Egyetem professzora áll, aki kutatásait kifejezetten a diffúziós modellekre fókuszálja. Ezek a modellek nem szavanként generálnak kimenetet, hanem iteratív finomítással dolgoznak – ez a megközelítés különösen hatékony képalapú AI rendszereknél, mint például a Stable Diffusion, Midjourney vagy Sora.
Ermon már az AI boom előtt is dolgozott ezekkel a rendszerekkel, és most az Inception segítségével szeretné alkalmazni őket szélesebb körű feladatokra is. Ezáltal nemcsak képek generálására alkalmas technológiát fejlesztenek tovább, hanem komplex szoftverfejlesztési és szöveges alkalmazásokra is.
A Mercury modell: új mérföldkő a szoftverfejlesztésben
A friss finanszírozás mellett az Inception bemutatta Mercury modelljének új verzióját, amely kifejezetten szoftverfejlesztési feladatokra készült. A Mercury már integrálva van több fejlesztői eszközbe is, például ProxyAI-ba, Buildglare-be és Kilo Code-ba.
Stefano Ermon
“Ezek a diffúziós alapú nagyméretű nyelvi modellek (LLM-ek) sokkal gyorsabbak és hatékonyabbak, mint amit ma mások építenek. Teljesen más megközelítésről van szó, ahol még rengeteg innováció hozható be.”
Technikai háttér: Diffúziós modellek vs. autoregresszív modellek
A diffúziós modellek szerkezetileg eltérnek az autoregresszív modellektől, amelyek jelenleg dominálnak a szöveg alapú AI szolgáltatásokban. Az autoregresszív modellek – mint például a GPT-5 vagy Gemini – szekvenciálisan működnek: minden egyes következő szót vagy szófragmentumot az előzőek alapján jósolnak meg.
Ezzel szemben a diffúziós modelleket eredetileg képgenerálásra fejlesztették ki; ezek holisztikus módon közelítik meg a választ úgy, hogy fokozatosan módosítják annak teljes szerkezetét addig, amíg el nem érik a kívánt eredményt.
A diffúziós modellek előnyei nagy mennyiségű adat feldolgozásánál
Bár az autoregresszív megközelítés rendkívül sikeres volt a szöveges AI rendszereknél, egyre több kutatás mutat rá arra, hogy diffúziós modellek jobban teljesíthetnek nagy mennyiségű szöveg vagy adat kezelésekor. Ermon szerint ezek az előnyök különösen fontosak nagy kódbázisok elemzésénél és kezelésénél.
Hatékonyabb hardverhasználat és párhuzamos feldolgozás
A diffúziós modellek nagyobb rugalmasságot kínálnak hardverhasználat terén is – ez kulcsfontosságú előny ahogy az AI infrastruktúra igényei növekednek. Míg az autoregresszív modelleknek egymás után kell végrehajtaniuk műveleteiket, addig a diffúziós modellek egyszerre több műveletet is képesek párhuzamosan feldolgozni.
Ez jelentősen csökkenti a késleltetést összetett feladatok esetén. Ermon elmondása szerint:
“Több mint 1000 token/másodperces sebességet értünk el benchmark teszteken – ez messze meghaladja az autoregresszív technológiák jelenlegi lehetőségeit. A mi rendszerünk párhuzamosan működik és rendkívül gyors.”
Kitekintés: Az AI jövője és az Inception szerepe
Az Inception által képviselt diffúziós modell-alapú megközelítés új irányt mutat az AI fejlesztésében. A gyorsabb válaszidő és alacsonyabb számítási költségek mellett ezek a technológiák lehetővé teszik komplexebb problémák hatékonyabb kezelését is.
Ahogy egyre több fejlesztői eszköz integrálja ezeket az innovatív modelleket, várhatóan jelentős változásokat hoznak majd mind az ipari alkalmazásokban, mind pedig a kutatás-fejlesztés területén.