2025 szeptemberének elején mutatták be a svájci szövetségi műszaki egyetemek legújabb fejlesztését, az Apertus nevű nagyszabású mesterséges intelligencia (MI) modellt. Az új technológia körül számos vélemény és állítás látott napvilágot, amelyek között nehéz eligazodni. Cikkünkben részletesen bemutatjuk, mi igaz és mi téves az Apertusszal kapcsolatban, valamint megvizsgáljuk annak erősségeit és korlátait.
Mi az Apertus?
Az ETH Zürich és az EPFL által fejlesztett Apertus egy nemzeti nagyméretű nyelvi modell (Large Language Model – LLM), amelyet teljes mértékben nyílt forráskódúnak terveztek. Ez azt jelenti, hogy a modell minden alkotóeleme – az architektúra, a súlyok és a tanítási utasítások – nyilvánosan elérhetőek. A fejlesztők szerint ez mérföldkő a generatív MI területén, különösen az átláthatóság és a sokszínűség szempontjából.
Apertus nem egy svájci ChatGPT
Egy gyakori tévhit, hogy az Apertus a ChatGPT svájci megfelelője lenne. Ez azonban nem igaz. Az Apertust nem személyes használatra tervezték, mint például az OpenAI által fejlesztett ChatGPT-t. Inkább egy alapmodellként szolgál, amelyet különféle alkalmazásokhoz és szolgáltatásokhoz lehet adaptálni, főként üzleti és kutatási célokra.
Imanol Schlag, az ETH Zürich kutatója és az Apertus technikai fejlesztésének vezetője hangsúlyozza: „A nagyközönség nem a fő célcsoportunk.” Emiatt a modellt nem látták el felhasználóbarát funkciókkal vagy mobilalkalmazással.
Maria Grazia Giuffreda, a Lugano-i Svájci Tudományos Számítástechnikai Központ (Swiss Centre for Scientific Computing) igazgatóhelyettese hozzátette: „Nem az volt a célunk, hogy a svájci válasz legyen a ChatGPT-re.” Az érdeklődők számára azonban a Public AI nevű civil szervezet weboldalán elérhető néhány chatfunkció kipróbálásra.
Apertus teljesítménye – összehasonlítás más modellekkel
Apertus jelenleg a legerősebb teljesen nyílt LLM, amelynek legnagyobb változata 70 milliárd paraméterrel rendelkezik – ez a tanulási kapacitás egyik mérőszáma. Ugyanakkor nem éri el olyan zárt forrású modellek szintjét, mint például a GPT-4 vagy Gemini, amelyek jóval nagyobb adathalmazokon tanultak és hatalmas számítási kapacitással rendelkeznek.
El Mahdi El Mhamdi, párizsi École Polytechnique professzora szemléletes hasonlattal él: „Az Apertust összehasonlítani az amerikai techóriások modelljeivel olyan, mintha egy kis völgyi gazdát vetnénk össze egy hatalmas marhahús-termelővel.”
Ugyanakkor kisebb modellek előnye lehet hatékonyságukban, hozzáférhetőségükben kis- és középvállalkozások számára, valamint alacsonyabb energiaigényükben. A minőségi adat fontosságát is kiemelik szakértők.
Néhány közéleti szakértő azonban kritikusan viszonyul az Apertushoz. Például Bruno Frey emeritus professzor szerint a modell pontatlan tudományos forrásokat adott meg, míg Xavier Comtesse matematikus LinkedIn-bejegyzésében rámutatott arra, hogy bár sok eredmény hitelesnek tűnik, valójában téves (ún. hallucination) válaszokat is produkál.
Ezzel szemben Schlag kiemeli, hogy már az Apertus kisebb változata (8 milliárd paraméterrel) is felülmúlja más nyilvános intézmények hasonló méretű modelljeit.
Átláthatóság és etika – az Apertus egyik legnagyobb erénye
Apertus elsőként felel meg teljes mértékben az Európai Unió 2024-ben életbe lépett AI-törvényének kulcsfontosságú követelményeinek. Ezek közé tartozik az átláthatóság, az adatok visszakövethetősége, valamint a szellemi tulajdonjogok és adatvédelem tiszteletben tartása.
A modellhez használt adatkészletek kizárólag nyilvános és jogszerű forrásokból származnak; nem tartalmaznak szerzői jogvédelem alatt álló anyagokat vagy olyan weboldalakat, amelyek kifejezetten kizárták magukat a tanítóadatok közül.
Ezzel szemben a nagy techcégek hosszú ideje több milliárd felhasználó adatát használják fel engedély nélkül – beleértve szerzői joggal védett tartalmakat is –, gyakran alulfizetett emberi munkaerő kihasználásával fejlődő országokban.
El Mahdi El Mhamdi szerint „még nem ismerjük fel teljesen azt a mértékű visszaélést, amely normálisnak számít a mai mainstream MI ellátási láncában.”
Ezért különösen vonzó lehetőség azoknak a vállalatoknak, kutatóintézeteknek és állami szerveknek az Apertus használata, akik etikus módon szeretnének MI alkalmazásokat fejleszteni jogszabályi megfelelés mellett.
Több mint 1800 nyelven képes kommunikálni – de milyen minőségben?
A fejlesztők nagy hangsúlyt fektettek arra, hogy az Apertust több mint 1800 nyelven képezzék ki – ideértve kisebbségi nyelveket és dialektusokat is, mint például a rétoromán vagy a svájci német. Ez jelentős előrelépés azokhoz képest, amelyek főként csak széles körben beszélt nyelvekre koncentrálnak.
Ugyanakkor egy dolog megérteni egy nyelvet, más kérdés helyesen beszélni azt. Kisebb nyelvek esetében még előfordulhatnak hibák vagy furcsa mondatok. Például tesztjeink során olasz nyelven néha ügyetlen vagy helytelen mondatok jelentek meg; rétorománban pedig hibás fordítást adott egy egyszerű szó esetében („nagypapa”).
Imanol Schlag elismeri ezeket a hiányosságokat ugyanakkor hangsúlyozza: bizonyos feladatokban – például német-rétoromán fordításban – már most jobb eredményeket ér el más modelleknél.
Ezzel szemben Aldo Podestà, egy svájci AI startup vezetője úgy véli: „Mi értelme van egy olyan modellnek rétorománul beszélni, ha átlagos teljesítménye messze elmarad más modellekétől?” Ezzel ellentétben Mary-Anne Hartley professzor szerint fontos képviselni azon kisebbségi nyelveket is technológiai szinten, amelyeket kevesebben beszélnek – ezt célozza meg az Apertus is.
Apertus nem kizárólag Svájcnak készült
Bár svájci intézmények fejlesztették ki, téves azt gondolni, hogy csak Svájcban lenne hasznos. A tanítóadatok többsége nemzetközi forrásból származik; kivételek például a svájci német vagy rétoromán adatok és egy ún. „svájci értékek kartája”, amely olyan alapelveket fogalmaz meg mint semlegesség vagy nyelvi sokszínűség.
Imanol Schlag szerint „a modelltől ezen túlmenően semmi sem specifikusan svájci.” A fejlesztők remélik, hogy más országok is érdeklődnek majd projekt iránt és hozzájárulnak annak további fejlődéséhez európai vagy akár globális szinten.
Apertus nem frissíti magát valós időben
Egy félreértés szerint az Apertus azért nem tud valós időben frissülni mert nincs internetkapcsolata. Valójában azonban egyik nagy nyelvi modell sem képes erre: egyszer betanított állapotban maradnak statikusak még akkor is ha internethez kapcsolódó termékekbe építik őket (például ChatGPT).
A változtatások csak újratanítással vihetők be – ami rendkívül költséges folyamat –, ezért ezt csak nagy erőforrásokkal rendelkező cégek engedhetik meg maguknak gyakran.
A következő tanítási körre az Apertus 20 millió svájci franknyi állami támogatást kapott és egy teljes egészében vízenergiával működő alpesi szuperszámítógépet használ majd. Hosszabb távon azonban további finanszírozásra lesz szükség ahhoz, hogy fenntartható legyen fejlődése.
Kitekintés: Mi várható még?
- További fejlesztések: Az Apertust folyamatosan finomhangolják majd mind technikai teljesítményében mind pedig többnyelvűségében.
- Európai együttműködés: A projekt célja bővíteni partnerségeit európai országokkal és kutatóintézetekkel.
- Etikus MI példája: Az Apertus demonstrálja, hogy generatív MI felelősségteljesen is fejleszthető anélkül, hogy megsértenénk mások szellemi tulajdonát vagy adatvédelmi szabályokat.
- Közösségi hozzáférés: Bár elsődlegesen üzleti-kutatási célokra készült modellről van szó, bizonyos funkciókat már most kipróbálhatnak érdeklődők nonprofit platformokon keresztül.
Összegzés
Svájc új mesterséges intelligencia modellje, az Apertus jelentős előrelépést képvisel mind átláthatóságban mind etikai normák betartásában. Bár jelenleg nem versenyezhet közvetlenül olyan óriásokkal mint GPT-4 vagy Gemini méretben és tudásban, mégis fontos szereplő lehet különösen azok számára akik felelősen szeretnének MI-t alkalmazni kutatásban vagy üzleti életben.
Kiemelendő továbbá soknyelvűsége és inkluzív megközelítése is – noha még vannak hiányosságai –, amelyek hosszabb távon hozzájárulhatnak ahhoz hogy kisebbségi nyelvek is helyet kapjanak a digitális világban.
Forrás: https://www.swissinfo.ch/eng/swiss-ai/fact-and-fiction-about-the-swiss-ai-model-apertus/90110034