Únik ukazuje schopnosti Nano Banana 2 v práci s textem a opravě nekvalitních obrázků

Krátké zveřejnění přístupu k Nano Banana 2 na platformě Media.ai, následované rychlým stažením, vyvolalo zájem kolem nového generativního modelu pro tvorbu a úpravu obrázků. Sdílené ukázky, údajně pocházející z testování a z prostředí spojených s Gemini, ukazují zejména dvě oblasti: výrazně lepší remasterování nekvalitních zdrojových snímků a přesnější plnění složitých textových instrukcí pro barvení, úpravy a doplňování vizuálních prvků.

Podle uniklých materiálů dokáže Nano Banana 2 vykreslovat komplexní text na tabulích či infografikách s konzistentním písmem, což je oblast, kde dosavadní generativní AI modely často selhávaly (rozbité písmo, chybné znaky, nereálné nápisy). Další ukázky naznačují schopnost řešit fyzikálně založené vizuální úlohy, například správně vykreslit trajektorii pohybujícího se objektu při převodu z obrázku na obrázek (img2img), a lepší porozumění “world knowledge” – tedy kontextu reálného světa, grafů, infografik a vícejazyčného textu.

Pokud by se tyto parametry potvrdily v produkční verzi, Nano Banana 2 by byl prakticky využitelný pro automatizovanou tvorbu bannerů, sociálních vizuálů, prezentační grafiky či lokalizovaných infografik přes API, a to s menší potřebou ruční korekce. To by bylo relevantní pro menší studia, marketingové týmy i poskytovatele SaaS nástrojů, kteří potřebují rychlé generování konzistentních vizuálů. Zatím však chybí oficiální technická dokumentace, jasné informace o dostupnosti, omezeních, bezpečnostních filtrech i licenčních podmínkách. Vzhledem k tomu, že jde o neoficiální úniky a předprodukční ukázky, je na místě opatrnost: kvalita veřejné verze může být odlišná, některé ukázky mohou být kurátorsky vybrané a skutečné chování modelu v rozsáhlém nasazení je nutné ověřit nezávislým testováním.

Číst původní článek

Zdroj: 📰 Testingcatalog.com