Microsoft MAI-Image-1: Az első saját fejlesztésű AI képgenerátor

nov 4, 2025 | Tech

A Microsoft új korszakot nyit az mesterséges intelligencia alapú képgenerálásban az MAI-Image-1 nevű, első saját fejlesztésű AI képgenerátorával. Ez a modell már elérhető két termékben: a Bing Image Creator és a Copilot Audio Expressions platformokon. A cég 2023 októberében jelentette be a modellt, amely azóta is folyamatosan bővül és fejlődik.

MAI-Image-1 – A Microsoft saját AI képgeneráló modellje

Az MAI-Image-1 egy szövegből képet generáló mesterséges intelligencia modell, amelyet kifejezetten a Microsoft fejlesztett ki házon belül. Mustafa Suleyman, a Microsoft AI vezetője egy X-en (korábbi Twitter) megjelent posztjában jelezte, hogy a modell hamarosan elérhető lesz az Európai Unióban is.

A modell különösen jól teljesít olyan témákban, mint az ételek és természetképek megalkotása, valamint művészi világítási effektusok és fotorealisztikus részletek megjelenítése. Ez a képesség kiemeli az MAI-Image-1-et a piacon lévő többi AI képgenerátor közül.

Gyorsaság és minőség – Az MAI-Image-1 előnyei

A Microsoft hivatalos blogján részletesen is bemutatta az MAI-Image-1 képességeit:

  • Fotorealisztikus képek generálása: A modell kiválóan kezeli a fényhatásokat, például visszaverődéseket és indirekt világítást (bounce light).
  • Landschaftok és természetábrázolás: Képes lenyűgöző tájképek létrehozására, amelyek élethűek és részletgazdagok.
  • Gyors működés: Az MAI-Image-1 gyorsabb, mint sok nagyobb és lassabb alternatíva, így a felhasználók gyorsabban juthatnak vizuális ötleteikhez.
  • Könnyű iteráció: A gyors képalkotás lehetővé teszi a felhasználók számára, hogy könnyedén módosítsák és finomítsák alkotásaikat.
  • Zökkenőmentes integráció: Az elkészült képek könnyen átvihetők más eszközökbe további szerkesztéshez vagy felhasználáshoz.

MAI-Image-1 szerepe a Copilot Audio Expressions platformon

A Microsoft nemcsak önálló képgenerátorként használja az MAI-Image-1-et, hanem integrálta azt a Copilot Audio Expressions „story mode” funkciójába is. Ebben a szöveg-alapú beszédplatformban az AI által generált történetekhez készülnek vizuális kísérőműalkotások, amelyek még élvezetesebbé teszik a felhasználói élményt.

A Microsoft AI-modellek fejlődése és jövője

2023 augusztusában a Microsoft bejelentette első házon belüli AI modelljeit: a beszédalapú MAI-Voice-1-et és a szövegalapú MAI-1-preview-t. Akkoriban azt is közölték, hogy az MAI-1-preview-t bizonyos esetekben integrálni tervezik Copilot AI asszisztensükbe – ez arra utalhat, hogy a vállalat fokozatosan csökkenti függőségét az OpenAI modellektől.

Ezzel párhuzamosan azonban jelenleg is zajlik a Copilot chatbot átállítása az OpenAI legújabb GPT-5 modelljére. Emellett lehetőség van Anthropic Claude AI modellek használatára is, így a Microsoft többféle mesterséges intelligencia megoldást kínál felhasználóinak.

Bing Image Creator – Több AI modell egy helyen

A Bing Image Creator weboldalán és alkalmazásában három különböző AI modell érhető el képgenerálásra:

  1. MAI-Image-1: A Microsoft saját fejlesztése, amely gyorsaságával és minőségével tűnik ki.
  2. DALL-E 3: Az OpenAI által fejlesztett népszerű képgenerátor.
  3. GPT-4o: Szintén OpenAI modell, amely szöveg-alapú kreatív tartalmak létrehozására alkalmas.

Ezzel a választékkal a felhasználók széles körben kipróbálhatják az eltérő technológiák előnyeit egyetlen platformon belül.

Összegzés

A Microsoft MAI-Image-1 egy jelentős mérföldkő az AI alapú képgenerálás területén. Gyorsasága, fotorealisztikus képességei és könnyű integrálhatósága révén új lehetőségeket nyit meg mindazok számára, akik kreatív vizuális tartalmakat szeretnének létrehozni. A Bing Image Creatorban való elérhetősége pedig egyszerűvé teszi ezt a technológiát bárki számára.

A jövőben várhatóan további fejlesztések érkeznek majd az MAI-modellek terén, amelyek tovább erősítik majd a Microsoft pozícióját az AI-technológiák piacán.

Forrás: https://www.theverge.com/news/813789/microsoft-in-house-ai-image-generator-mai-image-1

Mind Robotics: Rivian új ipari AI és robotikai vállalkozása

Rivian, az elektromos járművek gyártója, idén már másodszor hozott létre egy új, önálló vállalatot. Ezúttal egy ipari mesterséges intelligenciára (AI) és robotikára fókuszáló startupot indítottak Mind Robotics néven. Az új cég célja, hogy az ipari AI segítségével...

Mind Robotics: Rivian új ipari AI és robotikai vállalkozása

Rivian, az elektromos járművek gyártója, idén már másodszor hozott létre egy új, önálló vállalatot. Ezúttal egy ipari mesterséges intelligenciára (AI) és robotikára fókuszáló startupot indítottak Mind Robotics néven. Az új cég célja, hogy az ipari AI segítségével...

IBM létszámcsökkentés és fókuszváltás a szoftveres szegmensre 2024-ben

Az IBM bejelentette, hogy 2024 negyedik negyedévében létszámcsökkentést hajt végre, amely várhatóan több ezer alkalmazottat érint majd világszerte. A vállalat célja, hogy átalakítsa működését, és egyre inkább a magas haszonkulcsú szoftveres üzletágra összpontosítson,...

Az amerikai vámok gazdasági hatásai: GDP-csökkenés, bérveszteség és háztartási terhek

Frissítve: 2025. április 16. Bevezetés 2025. április 2-án Donald Trump elnök végrehajtási rendeletet írt alá, amely legalább 10 százalékos vámot vet ki az Egyesült Államokba érkező összes importárura, továbbá magasabb, 11-50 százalék közötti vámokat szabott ki 57...

A nikotin addiktivitásának vitája és a mesterséges intelligencia elméleti elméletei

Nikotin addiktivitás: Az 1994-es év meghatározó pillanat volt a dohányipar és a közegészségügy szempontjából, amikor a dohányipari vezetők a Kongresszus előtt azt állították, hogy a nikotin nem addiktív. Ez az állítás máig vitatott, és jelentős hatással volt a...

Ujjlenyomatok visszanyerése kilőtt töltényhüvelyekről – áttörés ír tudósoktól

Két ír tudós forradalmi módszert dolgozott ki az ujjlenyomatok visszanyerésére kilőtt töltényhüvelyekről, ami korábban szinte lehetetlennek számított. Dr. Eithne Dempsey és volt PhD-hallgatója, Dr. Colm McKeever a Maynooth Egyetem Kémiai Tanszékéről egy új...

GM járművek: Az infotainment rendszerek applikációinak letöltése megszűnt

General Motors bejelentette, hogy jelentős számú, korábbi generációs infotainment technológiával felszerelt járművében megszünteti az alkalmazások letöltésének lehetőségét. Ez a változás érinti a 2017 és 2021 között gyártott modelleket, amelyek az NGI (Next Generation...

Melatonin és szívbetegségek: új kutatás a hosszú távú használat kockázatairól

Az álmatlanság kezelésére gyakran alkalmazott melatonin hosszú távú használata összefüggésbe hozható a szívelégtelenség kialakulásának, kórházi kezelések szükségességének, valamint a halálozás fokozott kockázatával – derült ki egy friss, előzetes kutatásból. A...

Űrgrillezés a kínai űrállomáson: frissen sült csirkeszárnyak az űrben

Kína űrhajósai új ízt csempésztek az űrbéli életbe: frissen grillezett csirkeszárnyakat fogyasztanak a világűrben. Ez az első alkalom, hogy a Kínai Űrállomáson egy speciális sütő segítségével az űrhajósok saját maguk készíthetnek ízletes, meleg ételeket, ezzel...

Szívizom-infarktus utáni szívelégtelenség csökkentése őssejtterápiával – PREVENT-TAHA8 vizsgálat eredményei

A szívizom-infarktus (szívinfarktus) után jelentősen megnő a szívelégtelenség kialakulásának kockázata, amely hosszú távon súlyos egészségügyi problémákhoz vezethet. Az elmúlt években a kutatók egyre nagyobb figyelmet fordítanak az őssejtterápiák alkalmazására a szív...

Sora Androidra: Az OpenAI új mobilalkalmazása AI videók készítéséhez

Az OpenAI, az AI-alapú közösségi médiaalkalmazás, a Sora fejlesztője bejelentette, hogy mostantól elérhető az alkalmazás Androidos verziója is. Korábban az androidos felhasználók csak böngészőn keresztül használhatták a Sora szolgáltatásait, de mostantól a Google Play...