Souhrn
OpenAI vydalo ChatGPT Image 1.5, aktualizaci generátoru obrázků integrovaného do ChatGPT, která zvyšuje rychlost generování čtyřnásobně a snižuje náklady na API o 20 %. Tento nástroj přináší nové funkce pro kreativní úpravy a technickou přesnost, což ho staví do přímé konkurence s Nano Banana Pro od Google, modelem zaměřeným na konzistentní generování obrázků.
Klíčové body
- Čtyřnásobně rychlejší generování obrázků oproti předchozím verzím, což zkracuje čas na tvorbu složitých scén.
- Snížení nákladů na API o 20 %, což usnadňuje použití pro vývojáře a firmy s velkým objemem požadavků.
- Nová záložka „Obrázky“ s přednastavenými styly, zachováním podobnosti postav a funkcí pro objevování trendů.
- Technická vylepšení: vícekrokové úpravy, lepší prostorové uvažování, přesnější renderování textu a zpracování složitých prvků jako tváře nebo loga.
- Srovnání s Nano Banana Pro, který exceluje v konzistenci, ale zaostává v kreativní flexibilitě.
Podrobnosti
ChatGPT Image 1.5 je integrován přímo do ChatGPT, což umožňuje generování obrázků na základě textových popisů s následnými úpravami v jednom rozhraní. Nová záložka „Obrázky“ slouží k rychlému výběru přednastavených stylů, jako jsou realistické fotografie nebo abstraktní ilustrace, a funkce zachování podobnosti zajišťuje konzistentní vzhled postav přes více generací – užitečné pro tvorbu sérií obrázků, například v marketingu nebo hrách. Funkce objevování trendů navrhuje populární použití na základě dat od uživatelů, což zjednodušuje vstup pro začátečníky.
Technicky vyniká v multi-step editingu, kde lze obrázek upravovat po krocích – například nejprve změnit pozadí, pak přidat objekty – bez ztráty celkové kompozice. Lepší prostorové uvažování zvládá složité layouty, jako jsou více objektů v různých perspektivách, a vylepšené renderování textu minimalizuje chyby jako zkreslené písmena, což je klíčové pro design loga nebo plagátů. Zpracování tváří a log je přesnější díky pokročilým modelům trénovaným na velkých datech.
Ve srovnání s Nano Banana Pro od Google, který je optimalizován pro vysokou konzistenci a spolehlivost v profesionálních workflow, ChatGPT Image 1.5 přináší větší kreativní svobodu, ale může mít občasné nesrovnalosti v detailích. Rychlostní zlepšení je dosaženo optimalizací modelů na GPU, zatímco snížení nákladů na API umožňuje zpracování tisíců požadavků za zlomek předchozích cen. Matt Wolfe v článku zdůrazňuje, že tyto změny nejsou jen inkrementální, ale mění ekonomiku generování obrázků pro vývojáře.
Proč je to důležité
Tato aktualizace posiluje pozici OpenAI v boji o trh AI generátorů obrázků, kde konkurují i Midjourney nebo Stable Diffusion. Pro uživatele znamená rychlejší iterace a nižší ceny, což demokratizuje přístup k profesionální kvalitě – od grafických designérů po e-commerce. Pro průmysl to zvyšuje tlak na optimalizaci nákladů a inovace, protože 4x rychlost umožňuje real-time aplikace, jako generování personalizovaného obsahu. V širším kontextu urychluje adopci AI v kreativních odvětvích, ale vyvolává otázky ohledně autorských práv a kvality trénovacích dat. Pokud Nano Banana Pro nereaguje, OpenAI by mohl získat větší podíl na API trhu, což ovlivní celý ekosystém umělé inteligence.
Zdroj: 📰 Geeky Gadgets