Chrome s Gemini nyní zpracovává formuláře, plánuje cesty a naviguje v aplikacích, zatímco se vy soustředíte na podstatné

Souhrn

Google integroval model Gemini 3 AI do prohlížeče Chrome, čímž jej proměnil v nástroj s agentickou umělou inteligencí schopnou automatizovat vícekrokové úkoly. Chrome nyní zvládá interakce s uživatelským rozhraním, jako je klikání, psaní textu nebo navigace za přihlašovacími obrazovkami, což usnadňuje například vyplňování formulářů nebo srovnávání cen produktů napříč kartami. Tato funkce respektuje soukromí uživatele a integruje se s ekosystémem Google.

Klíčové body

Integrace Gemini 3 AI do Chrome pro automatizaci složitých úkolů, včetně interakce s webovými prvky jako klikání a psaní.
Agentic Vision Technology pro zpracování vizuálních dat, jako je analýza obrázků nebo extrakce informací z vizuálů.
Schopnost zpracovávat vícekrokové workflow, například plánování cest nebo sumarizace obsahu.
Nano Banana jako nástroj pro editaci obrázků v reálném čase přímo v prohlížeči.
Personalizovaná podpora s důrazem na soukromí a adaptaci na složité scénáře.

Podrobnosti

Model Gemini 3 AI, vyvinutý Googlem, přináší do Chrome schopnosti agentické umělé inteligence, která překračuje pasivní zobrazení informací. Prohlížeč nyní aktivně interaguje s webovými stránkami: dokáže simulovat lidské akce, jako je zadávání textu do polí, klikání na tlačítka nebo procházení stránek za přihlašovacími stěnami. Například při vyplňování formuláře Chrome automaticky vyhledá potřebná data z jiných karet nebo historie a doplní je, což šetří čas u opakujících se úkolů jako žádosti o formuláře nebo rezervace.

Agentic Vision Technology rozšiřuje tyto možnosti o zpracování vizuálních informací. Prohlížeč analyzuje obrázky, extrahuje text z grafik nebo porovnává vizuální prvky, jako jsou ceny produktů na různých e-shopech. Funkce Nano Banana umožňuje rychlou úpravu obrázků přímo v prohlížeči – uživatel zadá příkaz a AI aplikuje změny v reálném čase, například ořezání, filtry nebo generování variant. Pro plánování cest Chrome prohledá dostupné zdroje, srovná lety, hotely a dopravu a sestaví itinerář, přičemž naviguje v aplikacích jako Google Maps nebo rezervačních portálech.

Tato integrace je dostupná v experimentálním režimu a vyžaduje aktivaci v nastavení Chrome. Google zdůrazňuje bezpečnost: AI neukládá citlivá data bez souhlasu a funguje lokálně kde je to možné. V porovnání s předchozími verzemi Gemini tento update zlepšuje porozumění kontextu a zpracování dlouhých sekvencí akcí, což je klíčové pro reálné workflow. Pro uživatele to znamená méně manuální práce s webem, ale zároveň riziko závislosti na jednom ekosystému.

Proč je to důležité

Tato aktualizace posouvá hranice prohlížečů směrem k autonomním agentům, což ovlivní produktivitu v kancelářském prostředí i osobní správě úkolů. V širším kontextu urychluje vývoj agentických AI systémů, kde modely jako Gemini 3 přecházejí od generování textu k plnohodnotné interakci s digitálním světem. Pro průmysl to znamená konkurenční tlak na Microsoft Edge nebo Safari, aby rozšířily podobné funkce, a posiluje dominanci Google v AI ekosystému. Dlouhodobě to může změnit způsob, jak lidé pracují s webem, ale vyžaduje pečlivé řízení soukromí a etických rizik spojených s autonomními akcemi AI.

Číst původní článek

Zdroj: 📰 Geeky Gadgets