Souhrn
Google spustil experimentální prototyp Project Genie, který využívá model Genie 3 k generování hratelných, fotorealistických světů na základě popisu uživatele. Přístup je omezen na předplatitele AI Ultra v USA, s relacemi trvajícími maximálně 60 sekund v rozlišení 720p. Systém simuluje fyziku a interakce v reálném čase, což představuje krok k univerzálním modelům světa pro umělou inteligenci.
Klíčové body
- Uživatelé popisují prostředí (vzhled, způsob prozkoumávání jako chůze, létání nebo řízení), pohled (první nebo třetí osoba) a postavu (člověk, zvíře, objekt).
- Generování náhledového obrázku (World Sketching) pomocí Nano Banana Pro pro úpravy před spuštěním.
- Interakce v reálném čase s rychlostí 20-24 snímků za vteřinu, simulací fyziky a možností remixování světů.
- Další funkce: galerie kurátorských světů, náhodný generátor a stahování videí procházek.
- Omezení: 60sekundové relace, varování před nedokonalostmi generovaných světů.
Podrobnosti
Model Genie 3, poprvé představený v srpnu, funguje jako univerzální model světa, který simuluje dynamiku prostředí, predikuje jeho vývoj a ovlivnění akcemi uživatele. Na rozdíl od specializovaných agentů DeepMind pro hry jako šachy nebo Go, které Google vyvinul dříve, cílí tento prototyp na rozmanitost reálného světa, což je klíčové pro pokrok k AGI. Proces začíná popisem: uživatel zadá, jak má svět vypadat, jak se v něm pohybovat (chůze, jízda, létání, řízení) a z jakého pohledu (první nebo třetí osoba). Dále specifikuje postavu – člověka, zvíře, objekt nebo něco jiného. Systém pak vygeneruje náhledový obrázek World Sketching pomocí Nano Banana Pro, což umožňuje vizuální úpravy před finálním vytvořením světa.
Po kliknutí na „Vytvořit svět“ se spustí 60sekundová relace v rozlišení 720p. Při pohybu model generuje cestu vpřed v reálném čase na základě akcí, s konzistentní simulací fyziky a interakcí. Uživatel může měnit úhel kamery, prozkoumávat prostředí a stahovat video záznamy. Funkce Remix Worlds umožňuje upravovat existující světy novými popisy, zatímco galerie a náhodný generátor poskytují inspiraci z kurátorských příkladů. Google varuje, že generované světy nemusí být zcela konzistentní, což odráží experimentální povahu projektu. Tento rollout následuje za historií DeepMind v agentech pro uzavřená prostředí a posouvá se k otevřeným, dynamickým simulacím, které by mohly sloužit k tréninku AI agentů.
Proč je to důležité
Project Genie představuje významný pokrok v modelech světa, které jsou esenciální pro vývoj AGI schopných navigovat reálným světem. Pro herní průmysl to znamená potenciál rychlého prototypování světů bez manuálního modelování, i když současné limity (krátké relace, nižší rozlišení) brání okamžitému komerčnímu nasazení. V širším kontextu posiluje pozici Google v soutěži s OpenAI nebo Meta o generativní AI pro interaktivní obsah. Pro uživatele to otevírá experimentální nástroj k testování AI kreativity, ale vyžaduje placené předplatné AI Ultra a je dostupné jen v USA. Dlouhodobě by takové modely mohly zlepšit trénink robotů nebo autonomních systémů tím, že poskytnou nekonečné simulované prostředí pro učení.
Zdroj: 📰 9to5google.com