Souhrn
Google Project Genie je nový nástroj od společnosti Google, který využívá model DeepMind Genie 3 k vytváření interaktivních virtuálních světů. Uživatelé mohou tyto světy prozkoumávat, upravovat prvky jako pozadí nebo postavy a nahrávat vlastní obrázky pro simulaci reálných prostředí. Projekt je aktuálně dostupný pouze pro zákazníky Google AI Ultra v USA.
Klíčové body
- Model DeepMind Genie 3 generuje 2D virtuální světy s interaktivními prvky, které reagují na uživatelské vstupy.
- Možnost remixování světů v reálném čase: změna pozadí, postav, objektů a dynamiky.
- Podpora nahrávání uživatelských obrázků pro převod reálných scén do interaktivních prostředí.
- Omezený přístup: pouze pro prémiové zákazníky Google AI Ultra v USA.
- Zaměřeno na kreativní aplikace, jako prototypování her nebo virtuální průzkumy.
Podrobnosti
Google Project Genie představuje aplikaci modelu DeepMind Genie 3, který patří do rodiny world modelů vyvinutých divizí DeepMind – výzkumným oddělením Google zaměřeným na pokročilou umělou inteligenci. Tento model generuje sekvence videa podobné 2D videohrám, kde postavy a prostředí reagují na akce podobně jako ve skutečných hrách. Na rozdíl od běžných generativních AI nástrojů, které vytvářejí statické obrázky nebo krátké klipy, Genie 3 umožňuje kontinuální interakci: uživatel zadá textový popis nebo obrázek a model vytvoří prozkoumatelný svět, kde lze libovolně měnit parametry.
Například lze začít s jednoduchým obrázkem lesa, přidat postavu jako skákajícího robota a pak v reálném čase upravit gravitaci nebo přidat nepřátele. Nahrávání vlastních fotografií umožňuje převést skutečné místo, jako kancelář nebo ulici, do interaktivního prostředí, kde se objekty pohybují autonomně. Model je trénován na obrovských datech z videohier, což mu dává schopnost simulovat fyziku, pohyb a chování postav bez nutnosti manuálního programování.
DeepMind Genie 3 navazuje na předchozí verze: Genie 1 byl experimentální, Genie 2 open-source pro výzkumníky, zatímco třetí iterace přináší lepší konzistenci a delší sekvence. V praxi slouží k rychlému prototypování herních úrovní, tvorbě virtuálních prohlídek nebo testování interakcí v simulacích. Omezení zahrnují 2D formát (ne 3D), občasné artefakty v generovaném obsahu a závislost na cloudových výpočetních zdrojích Google. Dostupnost je vázána na předplatné Google AI Ultra, což znamená měsíční poplatek kolem stovek dolarů, a geografické omezení na USA brání širšímu testování.
Proč je to důležité
Project Genie posouvá generativní AI od pasivní tvorby obsahu k aktivním simulacím, což má dopady na herní průmysl, kde umožňuje vývojářům testovat mechaniky bez kódování. Pro průmysl to znamená zkrácení vývojového cyklu pro 2D hry nebo AR aplikace, kde lze rychle iterovat design. V širším kontextu ekosystému AI od Google (Gemini, Veo) ukazuje integraci modelů DeepMind do spotřebitelských nástrojů, což posiluje konkurenční postavení vůči OpenAI (Sora) nebo Stability AI. Nicméně placený model a regionální limity zpomalují adopci; dlouhodobě by to mohlo vést k novým standardům v interaktivní generaci, ale zatím nejde o průlom k AGI, spíš o specializovaný nástroj pro kreativy. Celkově přispívá k diverzifikaci AI aplikací mimo text a obrázky.
Zdroj: 📰 Uncrate.com