Souhrn
Microsoft představil Fara-7B, svůj první agenský malý jazykový model určený pro lokální provoz na běžných osobních počítačích. Model s 7 miliardami parametrů dokáže ovládat myš a klávesnici a plnit úkoly jako nákup online, vyhledávání informací nebo měření vzdáleností na mapách – vše na základě jednoduchého uživatelského zadání.
Klíčové body
- Fara-7B je agenský model schopný přímé interakce s operačním systémem prostřednictvím myši a klávesnice.
- Běží lokálně na běžných PC, nevyžaduje cloudové prostředí ani připojení k internetu pro základní funkce.
- Má pouze 7 miliard parametrů, ale podle Microsoftu dosahuje špičkového výkonu ve své třídě a konkuruje i náročnějším systémům jako GPT-4o v úlohách procházení webu.
- Model „vidí“ obrazovku stejně jako člověk – bez použití pomocných struktur jako accessibility trees.
- Uživatel musí schvalovat jednotlivé kroky, což zvyšuje bezpečnost, ale snižuje rychlost plnění úkolů.
Podrobnosti
Fara-7B je navržen pro tzv. „computer-use“ úkoly – tedy pro aktivní ovládání počítače na základě uživatelského příkazu. Na rozdíl od tradičních LLM, které pouze generují text, tento model interaguje s uživatelským rozhraním vizuálně: analyzuje obrazovku jako obraz a rozhoduje se na základě toho, co „vidí“. Tento přístup eliminuje potřebu speciálních API nebo struktur pro přístupnost, což zvyšuje univerzálnost, ale zároveň zpomaluje provádění úkolů. Microsoft ukázal tři demonstrační videa, ve kterých model úspěšně provedl nákup produktu, shrnul informace z webu a změřil vzdálenost mezi dvěma místy na mapě. Všechny akce vyžadovaly mezitímní schválení uživatele, což naznačuje, že systém ještě není zcela autonomní.
Proč je to důležité
Fara-7B představuje významný krok směrem k praktickému nasazení agenské AI na běžných zařízeních. Lokální provoz snižuje závislost na cloudu, zlepšuje soukromí a umožňuje offline funkce. Zároveň ukazuje, že i menší modely mohou plnit složité úkoly, pokud jsou specializované a dobře navržené. Tento přístup může ovlivnit budoucí vývoj asistentů v systémech Windows a konkurovat podobným iniciativám od Google, Apple nebo OpenAI. Nicméně pomalost a nutnost lidského schvalování naznačují, že plně autonomní AI asistenti jsou stále v rané fázi vývoje.
Zdroj: 📰 SiliconANGLE News
|