Mochi 1: Genmo nyílt forráskódú AI modellje a szövegből generált videókhoz

nov 6, 2025 | Tech

Genmo, az AI-alapú videógenerálásra specializálódott vállalat, nemrégiben bejelentette Mochi 1 kutatási előzetes verzióját. Ez az új, nyílt forráskódú modell lehetővé teszi, hogy szöveges utasításokból kiváló minőségű videókat hozzunk létre, miközben teljesítménye vetekszik vagy akár felül is múlja a vezető zárt forrású és tulajdonosi megoldásokat, mint például a Runway Gen-3 Alpha, Luma AI Dream Machine, Kuaishou Kling vagy Minimax Hailuo.

A Mochi 1 újdonságai és elérhetősége

A Mochi 1 modellt az engedékeny Apache 2.0 licenc alatt tették elérhetővé, így a felhasználók ingyenesen hozzáférhetnek a legmodernebb videógenerálási képességekhez. Ezzel szemben más modellek ára korlátozott ingyenes csomagoktól indul, és akár havi 94,99 dollárig is terjedhet (például a Hailuo Unlimited esetében).

A teljes modell súlyok és kód letölthetők a Hugging Face platformról, azonban a saját gépen való futtatáshoz legalább négy Nvidia H100 GPU szükséges. Emellett Genmo egy hosztolt játszóteret is biztosít, ahol bárki kipróbálhatja a Mochi 1 funkcióit élőben.

Jelenleg a 480p felbontású változat érhető el, de még idén várható egy magasabb felbontású verzió, a Mochi 1 HD, amely még részletesebb és élethűbb mozgást ígér.

Lenyűgöző valósághűség és mozgásminőség

A Genmo által megosztott első videók – például egy idős hölgyet ábrázoló jelenet – rendkívül élethű tájakat és mozgásokat mutatnak be. A Mochi 1 jelentős előrelépést hoz a videógenerálás területén:

Magas hűségű mozgás
Pontos promptkövetés, amely lehetővé teszi részletes utasítások követését karakterekre, helyszínekre és cselekményekre vonatkozóan
Erős vizuális következetesség

Paras Jain, a Genmo vezérigazgatója szerint: „Még csak az út elején járunk a generatív videók jövőjében. A valódi kihívás hosszú, magas minőségű és folyékony mozgású videók létrehozása. Mi elsősorban a mozgás minőségének fejlesztésére koncentrálunk.”

Nyílt forráskódú megközelítés és demokratizálás

A Genmo alapítói küldetésüknek tekintik az AI-technológia mindenki számára elérhetővé tételét. Jain hangsúlyozta: „Fontosnak tartjuk ezt a technológiát demokratizálni és minél több ember kezébe adni. Ezért döntöttünk az open source mellett.”

Belső tesztek alapján a Mochi 1 jobb eredményeket ér el promptkövetésben és mozgásminőségben, mint számos zárt forrású versenytárs – például a Runway vagy Luna modellek.

28,4 millió dolláros Series A befektetés

A Mochi 1 kutatási előzetesével egy időben Genmo bejelentette egy 28,4 millió dolláros Series A finanszírozási kör sikeres lezárását is. A vezető befektető az NEA volt, további résztvevők között szerepeltek The House Fund, Gold House Ventures, WndrCo, Eastlink Capital Partners és Essence VC. Több angyalbefektető is támogatja a céget, köztük Abhay Parasnis (Typespace CEO) és Amjad Masad (Replit CEO).

Jain szerint a videó nem csupán szórakoztatás vagy tartalomgyártás eszköze: „A videó az egyik legfontosabb kommunikációs forma – agyunk 30-50%-a vizuális jelek feldolgozására specializálódott.” A hosszú távú cél pedig olyan eszközök fejlesztése, amelyek támogatják a robotika és autonóm rendszerek jövőjét.

Mochi 1 technológiai alapjai és hatékonysága

A Mochi 1 az innovatív Asymmetric Diffusion Transformer (AsymmDiT) architektúrán alapul. Ez az eddigi legnagyobb nyílt forráskódú videógeneráló modell 10 milliárd paraméterrel.

Kiemelt figyelmet kapott a vizuális következtetés: négyszer annyi paraméter dolgozza fel a videóadatokat, mint a szöveget. Emellett hatékony memóriahasználatot biztosít egy video VAE (Variational Autoencoder) segítségével, amely jelentősen tömöríti az adatokat.

Ezek az optimalizációk lehetővé teszik fejlesztők számára is a könnyebb hozzáférést: letölthetik a modellt Hugging Face-ről vagy integrálhatják API-n keresztül.

Képzéshez használt adatok és átláthatóság kérdése

Ami az adatforrást illeti – ami gyakran vitatott pont az AI kreatív eszközök esetében –, Jain csak annyit árult el: „Általában nyilvánosan elérhető adatokat használunk, illetve különféle adatpartnerekkel dolgozunk együtt.” Versenyhelyzet miatt további részleteket nem közölt.

Kiemelte azonban az adatok sokszínűségének fontosságát: „Ez kritikus számunkra.”

Korlátok és jövőbeli fejlesztések

Bár ígéretes újdonságokat hoz, jelenleg még vannak korlátai:

Támogatott maximális felbontás jelenleg csak 480p
Bonyolult mozgásoknál előfordulhatnak kisebb vizuális torzulások
Kiváló fotorealisztikus stílusban, de animált tartalmak generálása még kihívást jelent számára

Az év második felében érkezik majd a Mochi 1 HD, amely már 720p-ben képes dolgozni és tovább javítja majd a mozgásminőséget.

Jain szerint „a mozgás maga a videó lelke – ezért fektettünk bele annyi energiát ebbe más modellekhez képest.” Továbbá fejlesztik majd az image-to-video synthesis képességeket és növelik majd a felhasználói kontrollt is.

Széles körű alkalmazási lehetőségek nyílnak meg

A Mochi 1 megjelenése új távlatokat nyit különféle iparágak számára:

Kutatók továbbfejleszthetik a videógenerálási technológiákat
Fejlesztők és termékcsapatok új alkalmazásokban gondolkodhatnak szórakoztatásban, reklámokban vagy oktatásban
Szinergia alakulhat ki robotika és autonóm rendszerek mesterséges intelligencia tréningjéhez szükséges szintetikus adatok előállításában is

Jain így fogalmazott az esélyekről: „Öt év múlva elképzelem azt a világot, ahol egy szegény gyerek Mumbaiban előveszi telefonját, megvalósít egy nagyszerű ötletet és akár Oscar-díjat is nyerhet – ez az igazi demokratizáció.”

Kipróbálható élmény és toborzás

A Genmo meghív minden érdeklődőt, hogy próbálják ki személyre szabott promptokkal a Mochi 1 előzetes verzióját saját hosztolt játszóterükön keresztül: genmo.ai/play. Bár cikkünk írásakor ez az oldal még nem töltődött be megfelelően VentureBeat számára.

Eközben Genmo aktívan keresi kutatóit és mérnökeit is: „Kutatólaboratóriumként dolgozunk határvonalbeli modelleken video generáláshoz. Ez egy rendkívül izgalmas terület – az AI jobb agyának felszabadítása,” mondta Jain. A cég célja továbbfejleszteni az általános mesterséges intelligencia jövőképét is.

Forrás: https://venturebeat.com/ai/video-ai-startup-genmo-launches-mochi-1-an-open-source-model-to-rival-runway-kling-and-others

Lina Khan és Zohran Mamdani: Az új korszak kezdete New York városában

nov 6, 2025 | Tech

Nem telt el még 24 óra sem azóta, hogy Zohran Mamdani megnyerte New York város polgármesteri választását, de máris jelentős változások körvonalazódnak a nagyvállalatok és a helyi politika viszonyában. Az egyik legfigyelemreméltóbb fejlemény, hogy a korábbi Federal...

Microsoft Ausztráliában visszatérítéseket kínál az AI-előfizetések árazási problémái miatt

nov 6, 2025 | Tech

Majdnem hárommillió ausztrál előfizető kap visszatérítést a Microsofttól, miután a vállalat bocsánatot kért az ügyfelek mesterséges intelligencia (AI) eszközökhöz való hozzáférésének díjszabása kapcsán felmerült problémák miatt. Az eset rávilágít arra, milyen fontos a...

Google és Epic megegyezése: véget érhet az öt éve tartó jogi csata

nov 6, 2025 | Tech

Az elmúlt öt évben zajló jogi csata a Google és az Epic Games között hamarosan lezárulhat, miután a két vállalat megállapodásra jutott. Az ügy 2020-ban kezdődött, amikor az Epic beperelte a Google-t azzal vádolva a techóriást, hogy visszaél Android ökoszisztéma...

Hyundai AutoEver America kibertámadás: személyes adatok kerültek veszélybe

nov 6, 2025 | Tech

Hyundai AutoEver America (HAEA), a Hyundai Motor Group leányvállalata, amely az autóipari informatikai szolgáltatások teljes körét nyújtja, nemrégiben súlyos kibertámadás áldozata lett. A támadók behatoltak a cég informatikai környezetébe, és hozzáfértek személyes...

Xbox és PlayStation Ökoszisztéma Harca: A PlayStation Átvette a Vezetést

nov 6, 2025 | Tech

Az Xbox teljesen engedett a PlayStation nyomásának. Idén a Halo sorozat is megjelenik PlayStation konzolokon, miközben a Sony gyakorlatilag semmilyen viszonzást nem kínál saját játékaival. Ez azt jelenti, hogy a PlayStation ökoszisztémája több játékot kínál majd, mint...

Fizikusok az információ fénysebességnél gyorsabb továbbításáról – Einstein relativitása sértetlen

nov 6, 2025 | Tech

Az Univerzum egyik legnagyobb törvénye, Einstein speciális relativitáselmélete, kimondja, hogy semmilyen információ vagy anyagi objektum nem haladhat gyorsabban a fény sebességénél vákuumban. Ennek ellenére a Rochester Egyetem kutatói egy forradalmi kísérletben...

Filmkészítés és mozipremierek jövője a Warner Bros. Discovery körüli felvásárlási hírek tükrében

Szerző: admin | november 6, 2025 | Bulvár | 0 Hozzászólások

Adam Aron, az AMC Entertainment vezérigazgatója nemrégiben nyilatkozott a Warner Bros. Discovery (WBD) körül kialakult felvásárlási helyzetről, amely jelenleg még nem valósult meg, így szerinte nincs értelme túl sok spekulációnak. Ugyanakkor hangsúlyozta, hogy az...

Bővebben

Lina Khan és Zohran Mamdani: Az új korszak kezdete New York városában

Szerző: admin | november 6, 2025 | Tech | 0 Hozzászólások

Bővebben

Toyota profitja 7%-kal csökkent, de éves előrejelzését növelte

Szerző: admin | november 6, 2025 | Üzlet | 0 Hozzászólások

A Toyota Motor Corporation 2024. szeptember végével záródó pénzügyi év első hat hónapjában 7%-os éves szintű profitcsökkenést jelentett be, amelyet részben az Egyesült Államokban bevezetett vámok okoztak. Ugyanakkor a japán autógyártó optimistán tekint a teljes...

Bővebben

Tech Részvénypiaci Korrekció és Az AI Befektetések Kockázatai

Szerző: admin | november 6, 2025 | Üzlet | 0 Hozzászólások

Az elmúlt héten az egyik legnagyobb pénzügyi piaci korrekciót tapasztalhattuk, amikor is becslések szerint félbillió dollárnyi érték tűnt el a globális részvénypiacokról. A legnagyobb technológiai vállalatok, mint az Nvidia, Microsoft és Palantir Technologies...

Bővebben

Jennifer Lawrence és Robert Pattinson intim jelenetei a Die My Love forgatásán – őszinte vallomások

Szerző: admin | november 6, 2025 | Bulvár | 0 Hozzászólások

Die My Love című filmjéről és a forgatás során szerzett élményeiről nyíltan mesélt Jennifer Lawrence, aki a produkcióban Robert Pattinson oldalán játszik. A film Lynne Ramsay rendezésében készült, aki a forgatókönyvet Enda Walsh-sal és Alice Birch-csel közösen írta. A...

Bővebben

Ex-‘American Idol’ versenyző Randy Madden letartóztatva kiskorúval való szexuális visszaélés miatt

Szerző: admin | november 6, 2025 | Bulvár | 0 Hozzászólások

Randy Madden, a népszerű énekes tehetségkutató, az American Idol nyolcadik évadának egykori versenyzője, komoly vádakkal néz szembe. A hírek szerint a 45 éves énekest kiskorúval való szexuális visszaélés gyanújával tartóztatták le, amely több súlyos bűncselekményt...

Bővebben

Manouria morla: Az ősi teknős a cseh mocsarakból – Új faj a Manouria nemzetségből

Szerző: admin | november 6, 2025 | Tudomány | 0 Hozzászólások

A paleontológia világában izgalmas felfedezés született: a Lengyel Tudományos Akadémia Paleobiológiai Intézetének és a barcelonai Universitat Autònoma kutatóinak közös munkája nyomán egy új teknősfajt írtak le, amely a Manouria nemzetséghez tartozik. A...

Bővebben

Baktériumfágok szerepe a bélmikrobiota alakításában és ökológiai hatásaik

Szerző: admin | november 6, 2025 | Tudomány | 0 Hozzászólások

A baktériumfágok, vagyis a baktériumokat fertőző vírusok, egyre nagyobb figyelmet kapnak a mikrobiológia és biotechnológia területén. Szerepük nem csupán a baktériumpopulációk szabályozásában, hanem a bélmikrobiota összetételének alakításában, az evolúciós...

Bővebben

Teljes digitális hozzáférés a minőségi Financial Times újságíráshoz – Spóroljon 20%-ot éves előfizetéssel!

Szerző: admin | november 6, 2025 | Üzlet | 0 Hozzászólások

Fedezze fel a Financial Times (FT) exkluzív digitális tartalmait, amelyek naprakész, megbízható és mélyreható elemzéseket kínálnak a globális gazdaság, üzlet, politika és pénzügyek világából. A világ vezető iparági szakértőinek véleményeivel és elemzéseivel támogatott...

Bővebben

Microsoft Ausztráliában visszatérítéseket kínál az AI-előfizetések árazási problémái miatt

Szerző: admin | november 6, 2025 | Tech | 0 Hozzászólások

Bővebben