Az online világban már szinte minden területen uralkodó mesterséges intelligencia (MI) most egy új kihívással néz szembe: meg kell tanulnia, hogyan mozogjunk fizikailag a valós térben. Ehhez egyre növekvő globális csapat dolgozik azon, hogy az MI-t kivezessék a számítógépek képernyője mögül, és bevezessék otthonainkba, irodáinkba és gyárainkba. Az egyik ilyen helyszín Dél-Indiában, Karur ipari városában található, ahol az MI fizikai mozgások elsajátításához szükséges adatokat gyűjtik és elemzik.
A fizikai mozgások adatgyűjtése Karurban
Naveen Kumar, 28 éves mérnök, nap mint nap ugyanazt a feladatot végzi: kézi törölközőket hajtogat. Nem egy szállodában dolgozik, hanem egy olyan startupnál, amely fizikai adatokat készít az MI képzéséhez. Munkája során GoPro kamerát erősít a homlokára, majd egy előre meghatározott mozdulatsort követve hajtogatja a törölközőket. A folyamat során csak a jobb kezét használja, először kiemeli a törölközőt egy kosárból az asztal jobb oldalán, majd két kézzel kisimítja azt, háromszor hajtogatja össze, végül pedig az asztal bal sarkába helyezi el.
Ha több mint egy percig tart vagy kihagy egy lépést, újrakezdi a folyamatot. Az Objectways nevű cég, ahol Kumar dolgozik, több mint 200 ilyen videót küldött el amerikai ügyfeleinek. A vállalat több mint 2000 alkalmazottat foglalkoztat; fele autonóm járművek és robotika szenzoradatainak címkézésével foglalkozik, míg a másik fele generatív MI-vel dolgozik.
A fizikai adatok szerepe az MI fejlődésében
A törölközőhajtogatás aprólékos mozdulatai – kar kinyúlása, ujjak szorítása, anyag csúszása – mind-mind fontos részletek ahhoz, hogy az MI megtanulja az emberi mozgás finomságait. Kumar és csapata ezeket a videókat annotálja: dobozokat rajzolnak a különböző részek köré, megjelölik a törölközőket, jelölik az arm mozgásának irányát és osztályozzák az egyes gesztusokat.
Ez a munka nemcsak precizitást igényel, hanem türelmet is. Kumar elmondta: „Néha akár 150-200 videót is törölnünk kell buta hibák miatt.” Ez jól mutatja, milyen fontos az adatok minősége ahhoz, hogy az MI hatékonyan tanulhasson.
Az MI és robotika jövője – globális perspektíva
Az Encord nevű szanfranciskói adatkezelő platform társalapítója, Ulrik Stig Hansen szerint „a cégek alapmodelleket építenek ki a fizikai világ számára”, ami hatalmas fellendülést hozott a robotika területén. Számos nagyvállalat – Tesla, Boston Dynamics, Nvidia – vezető szerepet tölt be az új generációs robotok fejlesztésében. Például Tesla Optimus robotjai már most különböző eseményeken vesznek részt.
A Google és OpenAI is aktívan fejleszti saját robotikai MI modelljeit. Az Nvidia előrejelzése szerint a humanoid robotok piaca akár 38 milliárd dollárra is nőhet az elkövetkező tíz évben.
Adatgyűjtés és teleoperáció – emberi segítség az MI tanításában
A nagy nyelvi modellekhez hasonlóan (mint például ChatGPT) az MI rengeteg online adatot használ fel nyelvhasználat és képfeldolgozás terén. Azonban a fizikai világ működéséről szóló adatok – például mekkora erő szükséges egy szalvéta hajtogatásához – sokkal nehezebben hozzáférhetők és értelmezhetők.
Ezért számos cég emberi demonstrációkat használ arra, hogy megtanítsa az MI-nek a valós mozgásokat. San Franciscóban működő Micro1 alapítója, Ali Ansari elmondta: „Az új robotikai adatgyűjtés egyre inkább teleoperációra fókuszál.” Ez azt jelenti, hogy emberek távolról irányítanak robotokat különféle feladatok elvégzésére – például csésze felemelésére vagy tea készítésére –, miközben az MI ezekből a sikeres vagy sikertelen próbálkozásokból tanul.
Ezeket az irányítási folyamatokat akár ugyanabban a helyiségben vagy más országokból is végezhetik. Encord tervezi kelet-európai raktárak létrehozását olyan operátorok számára, akik joystickkal irányítják majd világszerte a robotokat.
„Karok farmjai” és emberi adatgyűjtés világszerte
Mohammad Musa, a kaliforniai Deepen AI alapítója szerint egyre több „karfarm” alakul ki világszerte – ezek olyan helyek, ahol nagy csapatok irányítanak robotkarokat különféle feladatokra. Az adatgyűjtés ma már valós és szintetikus adatok keverékéből áll össze: emberi demonstrációkból, teleoperációs munkamenetekből és előre megtervezett környezetekből.
Egyes vállalatok okosszemüvegekkel rögzítenek mindennapi emberi mozdulatokat Brazíliában, Argentínában, Indiában és az Egyesült Államokban is. A San José-i Figure AI például együttműködik Brookfield ingatlanóriással 100 000 otthon belső tereinek felvételezésében annak érdekében, hogy megtanítsa humanoid robotjait az emberi terekben való mozgásra.
A Meta által támogatott Scale AI pedig 100 000 órányi hasonló képzési anyagot gyűjtött össze San Franciscóban működő prototípus laboratóriumában.
Kihívások és lehetőségek India piacán
Bengaluru-ban Dev Mandal húszéves vállalkozó próbált üzletet építeni abból, hogy India olcsó munkaerejével gyűjtsön fizikai mozgásadatokat AI képzéshez. Több megrendelést kapott robotkarok betanítására ételkészítéshez vagy kábelek csatlakoztatásához adatközpontokban.
Azonban hamar rá kellett jönnie: az ügyfelek rendkívül specifikus követelményeket támasztanak az adatok gyűjtésével kapcsolatban – például pontosan meghatározott robotkar típusra vagy bizonyos színű asztalra volt szükségük –, ami megnehezítette számára a profitábilis működést még India olcsó munkaerejével is.
Karur törölközőhajtogatói és jövőképük
Karurban azonban továbbra is nagy szükség van olyan precíz munkára, mint amit Kumar végez. Ravi Shankar, az Objectways alapítója elmondta: cégük nemrégiben kezdett el annotálni videókat fejlettebb humanoid robotokról is. Ezeket segítik abban, hogy megtanulják összeszedni és hajtogatni törölközőket vagy ruhadarabokat különböző asztalsarkokba helyezve.
Kumar kollégája, Kavin így fogalmazott: „Néha a robot karjai feldobják vagy szétszórják a ruhákat, de gyorsan tanulnak.” Hozzátette: „Öt-tíz éven belül ezek a robotok minden munkát el tudnak majd végezni – nekünk pedig nem marad semmi.”
Összegzés
A mesterséges intelligencia fejlődése ma már nem csak virtuális térben zajlik; egyre inkább szüksége van arra is, hogy megértse és utánozza az emberi test finommozgásait valós környezetben. Ehhez nélkülözhetetlenek azok az emberek szerte a világon – így Dél-Indiában is –, akik precíziós munkával gyűjtik és címkézik ezeket az adatokat.
Ez nemcsak technológiai áttörést jelenthet a robotika területén, hanem átalakíthatja munkahelyeinket és mindennapi életünket is. Bár sokan aggódnak amiatt, hogy ez munkahelyek elvesztéséhez vezethet, mások úgy vélik: ezek az eszközök felszabadíthatják az embert monoton feladatai alól és lehetőséget teremthetnek kreatívabb tevékenységekre.






