Mochi 1: Genmo nyílt forráskódú AI modellje a szövegből generált videókhoz

nov 6, 2025 | Tech

Genmo, az AI-alapú videógenerálásra specializálódott vállalat, nemrégiben bejelentette Mochi 1 kutatási előzetes verzióját. Ez az új, nyílt forráskódú modell lehetővé teszi, hogy szöveges utasításokból kiváló minőségű videókat hozzunk létre, miközben teljesítménye vetekszik vagy akár felül is múlja a vezető zárt forrású és tulajdonosi megoldásokat, mint például a Runway Gen-3 Alpha, Luma AI Dream Machine, Kuaishou Kling vagy Minimax Hailuo.

A Mochi 1 újdonságai és elérhetősége

A Mochi 1 modellt az engedékeny Apache 2.0 licenc alatt tették elérhetővé, így a felhasználók ingyenesen hozzáférhetnek a legmodernebb videógenerálási képességekhez. Ezzel szemben más modellek ára korlátozott ingyenes csomagoktól indul, és akár havi 94,99 dollárig is terjedhet (például a Hailuo Unlimited esetében).

A teljes modell súlyok és kód letölthetők a Hugging Face platformról, azonban a saját gépen való futtatáshoz legalább négy Nvidia H100 GPU szükséges. Emellett Genmo egy hosztolt játszóteret is biztosít, ahol bárki kipróbálhatja a Mochi 1 funkcióit élőben.

Jelenleg a 480p felbontású változat érhető el, de még idén várható egy magasabb felbontású verzió, a Mochi 1 HD, amely még részletesebb és élethűbb mozgást ígér.

Lenyűgöző valósághűség és mozgásminőség

A Genmo által megosztott első videók – például egy idős hölgyet ábrázoló jelenet – rendkívül élethű tájakat és mozgásokat mutatnak be. A Mochi 1 jelentős előrelépést hoz a videógenerálás területén:

  • Magas hűségű mozgás
  • Pontos promptkövetés, amely lehetővé teszi részletes utasítások követését karakterekre, helyszínekre és cselekményekre vonatkozóan
  • Erős vizuális következetesség

Paras Jain, a Genmo vezérigazgatója szerint: „Még csak az út elején járunk a generatív videók jövőjében. A valódi kihívás hosszú, magas minőségű és folyékony mozgású videók létrehozása. Mi elsősorban a mozgás minőségének fejlesztésére koncentrálunk.”

Nyílt forráskódú megközelítés és demokratizálás

A Genmo alapítói küldetésüknek tekintik az AI-technológia mindenki számára elérhetővé tételét. Jain hangsúlyozta: „Fontosnak tartjuk ezt a technológiát demokratizálni és minél több ember kezébe adni. Ezért döntöttünk az open source mellett.”

Belső tesztek alapján a Mochi 1 jobb eredményeket ér el promptkövetésben és mozgásminőségben, mint számos zárt forrású versenytárs – például a Runway vagy Luna modellek.

28,4 millió dolláros Series A befektetés

A Mochi 1 kutatási előzetesével egy időben Genmo bejelentette egy 28,4 millió dolláros Series A finanszírozási kör sikeres lezárását is. A vezető befektető az NEA volt, további résztvevők között szerepeltek The House Fund, Gold House Ventures, WndrCo, Eastlink Capital Partners és Essence VC. Több angyalbefektető is támogatja a céget, köztük Abhay Parasnis (Typespace CEO) és Amjad Masad (Replit CEO).

Jain szerint a videó nem csupán szórakoztatás vagy tartalomgyártás eszköze: „A videó az egyik legfontosabb kommunikációs forma – agyunk 30-50%-a vizuális jelek feldolgozására specializálódott.” A hosszú távú cél pedig olyan eszközök fejlesztése, amelyek támogatják a robotika és autonóm rendszerek jövőjét.

Mochi 1 technológiai alapjai és hatékonysága

A Mochi 1 az innovatív Asymmetric Diffusion Transformer (AsymmDiT) architektúrán alapul. Ez az eddigi legnagyobb nyílt forráskódú videógeneráló modell 10 milliárd paraméterrel.

Kiemelt figyelmet kapott a vizuális következtetés: négyszer annyi paraméter dolgozza fel a videóadatokat, mint a szöveget. Emellett hatékony memóriahasználatot biztosít egy video VAE (Variational Autoencoder) segítségével, amely jelentősen tömöríti az adatokat.

Ezek az optimalizációk lehetővé teszik fejlesztők számára is a könnyebb hozzáférést: letölthetik a modellt Hugging Face-ről vagy integrálhatják API-n keresztül.

Képzéshez használt adatok és átláthatóság kérdése

Ami az adatforrást illeti – ami gyakran vitatott pont az AI kreatív eszközök esetében –, Jain csak annyit árult el: „Általában nyilvánosan elérhető adatokat használunk, illetve különféle adatpartnerekkel dolgozunk együtt.” Versenyhelyzet miatt további részleteket nem közölt.

Kiemelte azonban az adatok sokszínűségének fontosságát: „Ez kritikus számunkra.”

Korlátok és jövőbeli fejlesztések

Bár ígéretes újdonságokat hoz, jelenleg még vannak korlátai:

  • Támogatott maximális felbontás jelenleg csak 480p
  • Bonyolult mozgásoknál előfordulhatnak kisebb vizuális torzulások
  • Kiváló fotorealisztikus stílusban, de animált tartalmak generálása még kihívást jelent számára

Az év második felében érkezik majd a Mochi 1 HD, amely már 720p-ben képes dolgozni és tovább javítja majd a mozgásminőséget.

Jain szerint „a mozgás maga a videó lelke – ezért fektettünk bele annyi energiát ebbe más modellekhez képest.” Továbbá fejlesztik majd az image-to-video synthesis képességeket és növelik majd a felhasználói kontrollt is.

Széles körű alkalmazási lehetőségek nyílnak meg

A Mochi 1 megjelenése új távlatokat nyit különféle iparágak számára:

  • Kutatók továbbfejleszthetik a videógenerálási technológiákat
  • Fejlesztők és termékcsapatok új alkalmazásokban gondolkodhatnak szórakoztatásban, reklámokban vagy oktatásban
  • Szinergia alakulhat ki robotika és autonóm rendszerek mesterséges intelligencia tréningjéhez szükséges szintetikus adatok előállításában is

Jain így fogalmazott az esélyekről: „Öt év múlva elképzelem azt a világot, ahol egy szegény gyerek Mumbaiban előveszi telefonját, megvalósít egy nagyszerű ötletet és akár Oscar-díjat is nyerhet – ez az igazi demokratizáció.”

Kipróbálható élmény és toborzás

A Genmo meghív minden érdeklődőt, hogy próbálják ki személyre szabott promptokkal a Mochi 1 előzetes verzióját saját hosztolt játszóterükön keresztül: genmo.ai/play. Bár cikkünk írásakor ez az oldal még nem töltődött be megfelelően VentureBeat számára.

Eközben Genmo aktívan keresi kutatóit és mérnökeit is: „Kutatólaboratóriumként dolgozunk határvonalbeli modelleken video generáláshoz. Ez egy rendkívül izgalmas terület – az AI jobb agyának felszabadítása,” mondta Jain. A cég célja továbbfejleszteni az általános mesterséges intelligencia jövőképét is.

Forrás: https://venturebeat.com/ai/video-ai-startup-genmo-launches-mochi-1-an-open-source-model-to-rival-runway-kling-and-others

Filmkészítés és mozipremierek jövője a Warner Bros. Discovery körüli felvásárlási hírek tükrében

Adam Aron, az AMC Entertainment vezérigazgatója nemrégiben nyilatkozott a Warner Bros. Discovery (WBD) körül kialakult felvásárlási helyzetről, amely jelenleg még nem valósult meg, így szerinte nincs értelme túl sok spekulációnak. Ugyanakkor hangsúlyozta, hogy az...

Lina Khan és Zohran Mamdani: Az új korszak kezdete New York városában

Nem telt el még 24 óra sem azóta, hogy Zohran Mamdani megnyerte New York város polgármesteri választását, de máris jelentős változások körvonalazódnak a nagyvállalatok és a helyi politika viszonyában. Az egyik legfigyelemreméltóbb fejlemény, hogy a korábbi Federal...

Toyota profitja 7%-kal csökkent, de éves előrejelzését növelte

A Toyota Motor Corporation 2024. szeptember végével záródó pénzügyi év első hat hónapjában 7%-os éves szintű profitcsökkenést jelentett be, amelyet részben az Egyesült Államokban bevezetett vámok okoztak. Ugyanakkor a japán autógyártó optimistán tekint a teljes...

Tech Részvénypiaci Korrekció és Az AI Befektetések Kockázatai

Az elmúlt héten az egyik legnagyobb pénzügyi piaci korrekciót tapasztalhattuk, amikor is becslések szerint félbillió dollárnyi érték tűnt el a globális részvénypiacokról. A legnagyobb technológiai vállalatok, mint az Nvidia, Microsoft és Palantir Technologies...

Jennifer Lawrence és Robert Pattinson intim jelenetei a Die My Love forgatásán – őszinte vallomások

Die My Love című filmjéről és a forgatás során szerzett élményeiről nyíltan mesélt Jennifer Lawrence, aki a produkcióban Robert Pattinson oldalán játszik. A film Lynne Ramsay rendezésében készült, aki a forgatókönyvet Enda Walsh-sal és Alice Birch-csel közösen írta. A...

Ex-‘American Idol’ versenyző Randy Madden letartóztatva kiskorúval való szexuális visszaélés miatt

Randy Madden, a népszerű énekes tehetségkutató, az American Idol nyolcadik évadának egykori versenyzője, komoly vádakkal néz szembe. A hírek szerint a 45 éves énekest kiskorúval való szexuális visszaélés gyanújával tartóztatták le, amely több súlyos bűncselekményt...

Manouria morla: Az ősi teknős a cseh mocsarakból – Új faj a Manouria nemzetségből

A paleontológia világában izgalmas felfedezés született: a Lengyel Tudományos Akadémia Paleobiológiai Intézetének és a barcelonai Universitat Autònoma kutatóinak közös munkája nyomán egy új teknősfajt írtak le, amely a Manouria nemzetséghez tartozik. A...

Baktériumfágok szerepe a bélmikrobiota alakításában és ökológiai hatásaik

A baktériumfágok, vagyis a baktériumokat fertőző vírusok, egyre nagyobb figyelmet kapnak a mikrobiológia és biotechnológia területén. Szerepük nem csupán a baktériumpopulációk szabályozásában, hanem a bélmikrobiota összetételének alakításában, az evolúciós...

Teljes digitális hozzáférés a minőségi Financial Times újságíráshoz – Spóroljon 20%-ot éves előfizetéssel!

Fedezze fel a Financial Times (FT) exkluzív digitális tartalmait, amelyek naprakész, megbízható és mélyreható elemzéseket kínálnak a globális gazdaság, üzlet, politika és pénzügyek világából. A világ vezető iparági szakértőinek véleményeivel és elemzéseivel támogatott...

Microsoft Ausztráliában visszatérítéseket kínál az AI-előfizetések árazási problémái miatt

Majdnem hárommillió ausztrál előfizető kap visszatérítést a Microsofttól, miután a vállalat bocsánatot kért az ügyfelek mesterséges intelligencia (AI) eszközökhöz való hozzáférésének díjszabása kapcsán felmerült problémák miatt. Az eset rávilágít arra, milyen fontos a...