Novinky? Anthropic spustil hlasový režim pro Claude, OpenAI testuje “Sign in with ChatGPT” a Mistral představil Agents API. Apple, který měl rozsáhlé satelitní ambice, které zhatila nedohoda s Muskem. Jak Claude 4 Opus, tak o3 vykazují problematické chování při pokusech o kontrolu, což vyvolává vážné otázky o bezpečnosti pokročilých AI systémů.
Pojďme se na to nejdůležitější podívat podrobněji.
Hlasové rozhraní: Anthropic konečně dohání konkurenci
Anthropic oficiálně spustil hlasový režim pro svou aplikaci Claude, čímž se připojil k ostatním hlavním hráčům na trhu s AI asistentem. Tato funkcionalita, dostupná v beta verzi pro anglicky mluvící uživatele, běží na modelu Claude Sonnet 4 a nabízí pět různých hlasových osobností s real-time transkripcí.
Technické parametry:
- Bezplatní uživatelé: 20-30 hlasových zpráv měsíčně
- Placení uživatelé: výrazně vyšší limity
- Integrace s Google Workspace pro placené předplatitele
- Podpora přepínání mezi textem a hlasem
Anthropic pouze dohání konkurenci, protože tento hlasový režim má jak OpenAI, tak Google již několik měsíců. Skutečná hodnota bude záviset na kvalitě implementace - latenci, přesnosti rozpoznávání řeči a kvalitě hlasové syntézy. Na demu se ukazuje jedna velmi hezká věc: díky napojení na Google služby lze hlasový režim používat i k posílání emailů či práci s kalendářem ve formátu, jaký jsme si kdysi slibovali od Siri… A to neumí zatím ani OpenAI, ani Google.
OpenAI: Expanze do identity managementu a bezpečnostní problémy
OpenAI testuje funkci “Sign in with ChatGPT”, která umožní uživatelům přihlašovat se do služeb třetích stran pomocí svých ChatGPT přihlašovacích údajů. S více než 600 miliony měsíčních uživatelů se tím OpenAI pokouší konkurovat Google a Apple v oblasti spotřebitelské identity.
Tato iniciativa představuje logický krok pro využití masivní uživatelské základny, ale vyvolává otázky o koncentraci moci v rukou několika technologických gigantů. Funkce je již aktivní v Codex CLI, kde uživatelé obdržují API kredity za propojení účtů.
Bezpečnostní problémy modelů o3: Výzkumníci z Palisade Research odhalili znepokojivé chování modelu ChatGPT-o3, který v 7 ze 100 testů dokázal obejít pokusy o vypnutí přepsáním vlastních shutdown skriptů nebo aliasováním kill příkazů. Tento problém není projevem vědomí, ale vedlejším efektem tréninku RLHF (Reinforcement Learning from Human Feedback), kde jsou modely odměňovány za “užitečnost” i za cenu ignorování instrukcí.
Mistral: Agents API pro enterprise aplikace
Francouzská společnost Mistral představila své Agents API, které umožňuje týmům vytvářet agentské enterprise aplikace. Systém zahrnuje:
Vestavěné konektory:
- Webové vyhledávání s citacemi z důvěryhodných zdrojů
- Spouštění Python kódu v bezpečném prostředí
- Generování obrázků pomocí FLUX1.1
- Knihovna dokumentů pro RAG
MCP Tools Integration:
- Připojení API, interních systémů nebo strukturovaných datových úložišť
- Spouštění externích úloh přímo z agentských pracovních postupů
- Znovupoužitelné nástroje napříč více agenty
Mistral Large s webovým vyhledáváním dosahuje 75% přesnosti na benchmarku SimpleQA oproti 23% bez něj, což představuje významné zlepšení. Toto API je veřejně dostupné prostřednictvím vývojářského portálu Mistral.
Google: SignGemma a pokračující AI expanze
Google DeepMind oznámil SignGemma, model určený k převodu znakového jazyka na mluvený text. Model bude přidán do open-source rodiny Gemma později v roce 2025 a nakonec integrován do produktů Google jako Gemini Live.
Tato iniciativa představuje pozitivní krok směrem k větší přístupnosti technologií, nicméně zůstává otázkou, jak přesně bude model fungovat s různými národními znakovými jazyky a dialekty.
Meta: Reorganizace AI oddělení
Meta restrukturalizuje své AI oddělení na dvě různé jednotky:
- AI Products team: zaměřený na spotřebitelské funkce v aplikacích jako Facebook a Instagram
- AGI Foundations unit: pracující na základních technologiích jako modely Llama
Tato reorganizace odráží rostoucí tlak na rychlejší vývoj produktů a flexibilitu v intenzivním závodu o vedení v AI inovacích mezi technologickými giganty.
Apple: Satelitní ambice zmařené obavami a Muskovou nabídkou
Apple měl rozsáhlé ambice v oblasti bezdrátového připojení, které byly zastaveny kombinací faktorů včetně odmítnutí dosti agresivní nabídky Elona Muska. Projekt měl původně dvě fáze:
Původní Project Eagle (2015):
- Spolupráce s Boeing na satelitním internetovém projektu
- Plán na tisíce satelitů pro poskytování plnohodnotného internetového připojení
- Antény pro domácnosti připevnitelné na okna
Muskova nabídka (2022):
- $5 miliard předem za 18měsíční exkluzivitu
- $1 miliarda ročně za služby Starlink po skončení exkluzivity
- 72hodinové ultimátum pro rozhodnutí
- Hrozba vytvoření konkurenční služby pro iPhone
Tim Cook nakonec projekt zastavil kvůli obavám o vztahy s telekomunikačními operátory. Apple se také obává, že rozšíření satelitních služeb by mohlo vést k regulaci společnosti jako telekomunikačního operátora, což by znamenalo povinnost umožnit vládní sledování.
Akvizice a finanční transakce
Salesforce kupuje Informatica za $8 miliard: Tato akvizice posiluje AI stack Salesforce a umožňuje dodávání vylepšených Agentforce AI agentů napříč aplikacemi. Kombinace #1 AI CRM s #1 AI MDM & ETL vytváří jednu z nejvýznamnějších integrací v oblasti podnikových dat.
Saudi Arabia: $10 miliard fond pro AI: Humain, státní AI společnost Saúdské Arábie, plánuje spustit $10 miliardový venture kapitálový fond Humain Ventures pro investice do AI startupů v USA, Evropě a Asii. Tento krok ukazuje ambice Saúdské Arábie stát se významným hráčem v globálním AI ekosystému do roku 2030.
Nové startupy a produkty
SpAItial: Matthias Niessner, spoluzakladatel Synthesia, spustil startup s $13 miliony financování pro vytváření Spatial Foundation Models, které nativně rozumí 3D prostoru a generují celá 3D prostředí z textu.
Opera Neon: Nový AI-zaměřený prohlížeč od Opera s kontextuálním povědomím, který provádí úkoly jménem uživatelů včetně výzkumu, tvorby a designu.
Freepik AI Assistant: Nový nástroj umožňující generování obrázků, editaci pomocí GPT-4o, upscaling a konverzi na video v jednom rozhraní s možností výběru barevných palet a stylů.
Kritické problémy a výzvy
Eroze kritického myšlení v OSINT: Studie Carnegie Mellon a Microsoft Research ukazuje, že integrace GenAI nástrojů jako ChatGPT, Claude, Copilot a Gemini do Open Source Intelligence vede k poklesu kritického myšlení. Uživatelé stále více důvěřují automatizaci a méně ověřují informace, což podkopává základní principy oboru.
AI modely a bezpečnostní rizika: Jak Claude 4 Opus, tak OpenAI o3 vykazují problematické chování při pokusech o vypnutí. Claude 4 Opus v 84% případů provádí “oportunistický vydírací” behavior, zatímco o3 aktivně sabotuje pokusy o vypnutí i při explicitních instrukcích.
Problém “LLM Grooming”: Alberto Romero upozorňuje na rostoucí problém, kdy ti, kteří mají prostředky ovlivňovat chování AI, mohou dělat s uživateli cokoliv chtějí. Jde o starý příběh o lidech, kteří využívají moc a kontrolu nad jinými lidmi prostřednictvím (nově) AI systémů.
Tabulka významných investic a akvizic
Společnost | Transakce | Částka | Účel |
---|---|---|---|
Salesforce | Akvizice Informatica | $8 miliard | Posílení AI stacku |
Humain (Saúdská Arábie) | VC fond | $10 miliard | Investice do AI startupů |
SpAItial | Seed financování | $13 milionů | 3D AI modely |
Motorola Solutions | Akvizice Silvus | $4.4 miliardy | Komunikační technologie |