Google získává špičkové talenty z hlasového AI startupu Hume AI v licenční dohodě

Souhrn

Google DeepMind najímá CEO startupu Hume AI, Alana Cowena, a přibližně sedm špičkových inženýrů v rámci licenční dohody. Hume AI, firma zaměřená na vývoj emocionálně inteligentních hlasových rozhraní, bude nadále dodávat své technologie dalším AI laboratořím. Tento krok podtrhuje rostoucí význam hlasových interakcí s AI, které dokážou detekovat emoce a náladu uživatelů na základě hlasu.

Klíčové body

Alan Cowen s doktorátem z psychologie a sedm inženýrů přechází do Google DeepMind pro integraci hlasových a emočních funkcí do modelů.
Licenční dohoda s utajenými finančními detaily; Hume AI získalo dosud 74 milionů USD investic.
Očekávané příjmy 100 milionů USD v roce 2026 díky spolupráci s AI labory na ladění hlasových AI modelů.
Nový CEO Andrew Ettinger oznámil vydání nových modelů v příštích měsících.
Technologie Hume AI trénována na anotacích emočních signálů v reálných konverzacích od expertů.

Podrobnosti

Hume AI je startup specializující se na vývoj realistických hlasových rozhraní schopných detekovat emoce v hlase uživatelů. Firma investovala miliony dolarů do trénování AI modelů, při kterém experti ručně anotují emoční signály v reálných konverzacích. Tyto modely slouží k vylepšení interakcí mezi AI a lidmi, například v asistentích, kteří reagují na tón hlasu, stres nebo radost, což zvyšuje uživatelskou zkušenost. V licenční dohodě s Google DeepMind Cowen a inženýři pomohou integrovat tyto technologie do pokročilých modelů, jako jsou frontier models Google, které zpracovávají složité úlohy v AI.

Podle investorů, jako je John Beadle z AEGIS Ventures, který investoval do Hume AI, se očekává, že hlas se stane primárním rozhraním pro AI. Hume AI již spolupracuje s dalšími AI labory na ladění modelů pro efektivnější hlasové asistenty. Finanční detaily dohody nejsou známy, ale startup plánuje růst díky dodávkám technologie. Andrew Ettinger, zkušený investor a manažer, který přebírá roli CEO, zdůrazňuje, že hlasové AI bude klíčové pro budoucnost. Kriticky lze poznamenat, že detekce emocí v hlase není zatím plně spolehlivá – závisí na kvalitě dat a kulturních rozdílech v projevu emocí –, ale přínos pro personalizované AI interakce je zřejmý. Cowenův psychologický background zajistí lepší porozumění lidskému chování v těchto modelech.

Proč je to důležité

Tato dohoda posiluje pozici Google DeepMind v oblasti hlasových AI, kde konkuruje firmám jako OpenAI nebo Anthropic. Integrace emoční inteligence do modelů umožní pokročilejší aplikace, jako jsou terapeutické chatboti, zákaznická podpora nebo autonomní asistenti v autech, což ovlivní miliardy uživatelů. Pro průmysl znamená akvizici talentů urychlení vývoje multimodálních AI, kde hlas doplní textové a vizuální vstupy. V širším kontextu podtrhuje trend směrem k přirozenějším interakcím, ale vyvolává otázky soukromí – detekce emocí může vést k zneužití dat. Pro uživatele to přinese lepší AI asistenty, jako rozšířené verze Google Assistant, schopné reagovat na emoční stav.

Číst původní článek

Zdroj: 🔧 Wired