The Verge

Microsoft spustil vlastní generátor obrázků MAI-Image-1

Microsoft spustil vlastní generátor obrázků MAI-Image-1

Souhrn

Microsoft zpřístupnil svůj první vlastní AI generátor obrázků MAI-Image-1, který je nyní integrován do služeb Bing Image Creator a Copilot Audio Expressions. Model byl oznámen v říjnu 2025 a představuje další krok Microsoftu k nezávislosti na externích AI modelech, zejména od OpenAI. V Evropské unii zatím není dostupný.

Klíčové body

  • MAI-Image-1 je první interně vyvinutý generátor obrázků Microsoftu, dostupný v Bing Image Creator a Copilot Audio Expressions
  • Model vyniká v generování fotorealistických snímků jídla, přírodních scén a detailního osvětlení
  • V EU zatím není k dispozici, podle Mustafy Suleymana (šéf Microsoft AI) přijde “brzy”
  • Microsoft pokračuje v budování vlastních AI modelů po srpnovém uvedení MAI-Voice-1 a MAI-1-preview
  • Copilot přechází na GPT-5 od OpenAI, ale nabízí i modely Claude od Anthropic

Podrobnosti

MAI-Image-1 je text-to-image model, který podle Microsoftu vyniká rychlostí a kvalitou generování fotorealistických obrázků. Mustafa Suleyman, šéf divize Microsoft AI, zdůraznil, že model je obzvláště dobrý v zobrazování jídla, přírodních scén a pokročilých světelných efektů jako odrazy a odražené světlo. Microsoft na svém blogu uvádí, že kombinace rychlosti a kvality umožňuje uživatelům rychleji iterovat své nápady a následně je přenést do dalších nástrojů pro další úpravy.

V rámci Bing Image Creator slouží model k běžnému generování obrázků z textových popisů. Zajímavější využití je v Copilot Audio Expressions, konkrétně v režimu “story mode”, kde MAI-Image-1 vytváří AI generované ilustrace k AI generovaným zvukovým příběhům. Jedná se o text-to-speech platformu, která nyní dostává vizuální doprovod.

Microsoft v srpnu 2025 oznámil své první vlastní AI modely - hlasový model MAI-Voice-1 a textový model MAI-1-preview. Tento krok naznačoval možný odklon od závislosti na modelech OpenAI, se kterou má Microsoft strategické partnerství a do které investoval miliardy dolarů. Aktuální situace je však složitější - zatímco Microsoft buduje vlastní modely, jeho asistent Copilot přechází na nejnovější GPT-5 od OpenAI a zároveň nabízí uživatelům možnost využít modely Claude od konkurenční společnosti Anthropic.

Proč je to důležité

Uvedení MAI-Image-1 je významné z několika důvodů. Zaprvé ukazuje, že Microsoft aktivně buduje vlastní AI infrastrukturu napříč různými modalitami - text, hlas i obraz. To mu dává větší kontrolu nad technologií, náklady a možnostmi přizpůsobení. Zadruhé, absence dostupnosti v EU odráží pokračující regulatorní výzvy, kterým čelí AI technologie v Evropě.

Zajímavé je také strategické pozicování Microsoftu. Místo úplného odklonu od OpenAI volí hybridní přístup - využívá nejnovější GPT-5, nabízí Claude od Anthropic a zároveň vyvíjí vlastní modely pro specifické případy použití. Tato diverzifikace snižuje riziko závislosti na jednom dodavateli a dává Microsoftu flexibilitu v rychle se vyvíjejícím AI ekosystému. Pro uživatele to znamená přístup k různým AI modelům s různými silnými stránkami v rámci jedné platformy.


Číst původní článek

Zdroj: ⚡ The Verge