Souhrn
Google integroval model Gemini 3 AI do prohlížeče Chrome, čímž jej proměnil v nástroj s agentickou umělou inteligencí schopnou automatizovat vícekrokové úkoly. Chrome nyní zvládá interakce s uživatelským rozhraním, jako je klikání, psaní textu nebo navigace za přihlašovacími obrazovkami, což usnadňuje například vyplňování formulářů nebo srovnávání cen produktů napříč kartami. Tato funkce respektuje soukromí uživatele a integruje se s ekosystémem Google.
Klíčové body
- Integrace Gemini 3 AI do Chrome pro automatizaci složitých úkolů, včetně interakce s webovými prvky jako klikání a psaní.
- Agentic Vision Technology pro zpracování vizuálních dat, jako je analýza obrázků nebo extrakce informací z vizuálů.
- Schopnost zpracovávat vícekrokové workflow, například plánování cest nebo sumarizace obsahu.
- Nano Banana jako nástroj pro editaci obrázků v reálném čase přímo v prohlížeči.
- Personalizovaná podpora s důrazem na soukromí a adaptaci na složité scénáře.
Podrobnosti
Model Gemini 3 AI, vyvinutý Googlem, přináší do Chrome schopnosti agentické umělé inteligence, která překračuje pasivní zobrazení informací. Prohlížeč nyní aktivně interaguje s webovými stránkami: dokáže simulovat lidské akce, jako je zadávání textu do polí, klikání na tlačítka nebo procházení stránek za přihlašovacími stěnami. Například při vyplňování formuláře Chrome automaticky vyhledá potřebná data z jiných karet nebo historie a doplní je, což šetří čas u opakujících se úkolů jako žádosti o formuláře nebo rezervace.
Agentic Vision Technology rozšiřuje tyto možnosti o zpracování vizuálních informací. Prohlížeč analyzuje obrázky, extrahuje text z grafik nebo porovnává vizuální prvky, jako jsou ceny produktů na různých e-shopech. Funkce Nano Banana umožňuje rychlou úpravu obrázků přímo v prohlížeči – uživatel zadá příkaz a AI aplikuje změny v reálném čase, například ořezání, filtry nebo generování variant. Pro plánování cest Chrome prohledá dostupné zdroje, srovná lety, hotely a dopravu a sestaví itinerář, přičemž naviguje v aplikacích jako Google Maps nebo rezervačních portálech.
Tato integrace je dostupná v experimentálním režimu a vyžaduje aktivaci v nastavení Chrome. Google zdůrazňuje bezpečnost: AI neukládá citlivá data bez souhlasu a funguje lokálně kde je to možné. V porovnání s předchozími verzemi Gemini tento update zlepšuje porozumění kontextu a zpracování dlouhých sekvencí akcí, což je klíčové pro reálné workflow. Pro uživatele to znamená méně manuální práce s webem, ale zároveň riziko závislosti na jednom ekosystému.
Proč je to důležité
Tato aktualizace posouvá hranice prohlížečů směrem k autonomním agentům, což ovlivní produktivitu v kancelářském prostředí i osobní správě úkolů. V širším kontextu urychluje vývoj agentických AI systémů, kde modely jako Gemini 3 přecházejí od generování textu k plnohodnotné interakci s digitálním světem. Pro průmysl to znamená konkurenční tlak na Microsoft Edge nebo Safari, aby rozšířily podobné funkce, a posiluje dominanci Google v AI ekosystému. Dlouhodobě to může změnit způsob, jak lidé pracují s webem, ale vyžaduje pečlivé řízení soukromí a etických rizik spojených s autonomními akcemi AI.
Zdroj: 📰 Geeky Gadgets