Souhrn
Apple provedl akvizici izraelské firmy Q.ai za přibližně 2 miliardy dolarů, což je jeho druhá největší nákup v historii. Firma Q.ai vyvinula technologie pro rozpoznávání hlasu bez zvukového výstupu pomocí optických senzorů, které detekují pohyby svalů a kůže na tváři. Tato technologie by mohla být integrována do sluchátek AirPods nebo chytrých brýlí a zlepšit interakci se Siri v hlučných prostředích nebo pro soukromé použití.
Klíčové body
- Akvizice za 2 miliardy dolarů, druhá největší v historii Apple po Beats za 3 miliardy.
- Q.ai se zaměřuje na machine learning pro audio a tzv. silent voice input pomocí optických senzorů na tváři a čelisti.
- Patentové žádosti popisují převod pohybů rtů do slov nebo příkazů pro Siri.
- Potenciální integrace do chytrých brýlí nebo sluchátek jako AirPods.
- Řešení problémů s hlasovými asistenty v hlučných nebo veřejných prostředích.
Podrobnosti
Apple často kupuje menší firmy, ale transakce za 2 miliardy dolarů patří k výjimečným. Podle redaktora 9to5Mac Chance Millera se Q.ai zabývá machine-learningovými technologiemi pro zpracování audia a rozpoznávání hlasu bez zvukového signálu. Webová stránka firmy nese slogan „V hlučném světě tvoříme nový druh ticha“, což naznačuje zaměření na diskrétní vstupy.
Izraelský technologický portál Geektime prozkoumal patentové žádosti Q.ai. Ty popisují systém, který nepoužívá mikrofony, ale optické senzory umístěné v headsetu nebo zařízení na tváři. Senzory zachycují mikroskopické pohyby svalů, kůže na tváři, rtou a čelisti. Tyto pohyby algoritmy machine learningu převádějí na textové příkazy nebo slova. Například uživatel by mohl „promluvit“ Siri pouze pohybem rtů, aniž by vydal hlasitý zvuk. Tato technologie slouží k ovládání hlasových asistentů v situacích, kde je hluk nepříznivý, jako v kancelářích, veřejná doprava nebo při schůzkách.
Apple Intelligence, nový balík AI funkcí v systémech iOS a macOS, by z toho mohl významně profitovat. Siri, která dosud spoléhá na tradiční hlasový vstup, by získala novou modalitu vstupu. Integrace do AirPods by umožnila detekci pohybů skrz senzory v sluchátkách, zatímco chytré brýle – například spekulované Apple Glasses – by mohly využít kamerové senzory na tváři. Nicméně mnoho detailů zůstává nejasných: není potvrzeno, zda Apple technologie okamžitě nasadí, jaká je přesnost systému nebo jestli vyžaduje speciální hardware.
Autor článku Ryan Christoffel zdůrazňuje, že jeho největší problém s AI chatboti jako ChatGPT spočívá v nutnosti hlasitého vstupu v reálném světě. Miliony uživatelů podobně zvyšují používání AI, ale hlasové asistenty selhávají v hlučných podmínkách. Q.ai by toto mohlo změnit tím, že umožní soukromou, tichou interakci.
Proč je to důležité
Tato akvizice spadá do kategorie průlomových kroků v AI, protože řeší klíčové limity hlasových rozhraní. V širším ekosystému AI, kde firmy jako Google a Meta investují do multimodálních vstupů (hlas, gesta, kamera), posiluje Apple svou pozici. Pro uživatele znamená lepší soukromí – žádné nahrávání hlasu – a univerzálnější použití Siri v Apple ekosystému. Průmysl očekává, že silent input urychlí adopci AR zařízení, kde tradiční mikrofony selžou. Nicméně úspěch závisí na kvalitě integrace: pokud senzory dosáhnou přesnosti nad 95 %, mohlo by to stanout standardem pro budoucí AI asistenty. V kontextu růstu AI trhu (odhadovaný na biliony dolarů do 2030) je tato akvizice strategickým tahem proti konkurentům jako OpenAI s jejich pokročilými modely.
Zdroj: 📰 9to5Mac