Souhrn
Startup Inception získal 50 milionů dolarů v seed investici na vývoj diffusion-based modelů pro generování kódu a textu jako alternativy k dnes dominantním auto-regresivním LLM. Firma tvrdí, že její přístup umožní výrazně snížit latenci a náklady na výpočetní výkon, což je zásadní pro praktické nasazení generativní AI ve vývoji softwaru.
Klíčové body
- Seed kolo ve výši 50 milionů dolarů vede Menlo Ventures, účastní se mimo jiné Microsoft M12, Snowflake Ventures, Databricks, Nvidia (NVentures), Andrew Ng a Andrej Karpathy.
- Inception vede Stefano Ermon, profesor ze Stanfordu specializovaný na diffusion modely, které se dosud prosadily hlavně v generování obrázků a videa.
- Firma představila model Mercury zaměřený na podporu vývoje softwaru; integrace probíhá v nástrojích jako ProxyAI, Buildglare a Kilo Code.
- Diffusion přístup má přinést nižší latenci a nižší náklady oproti klasickým auto-regresivním LLM (např. GPT, Gemini), které generují text token po tokenu.
- Pokud se technologie osvědčí v produkčním nasazení, může významně ovlivnit trh AI nástrojů pro programátory a tlak na efektivitu GPU infrastruktury.
Podrobnosti
Inception je nový AI startup zaměřený na využití diffusion modelů pro generování textu a kódu, tedy v oblastech, kde dnes dominují auto-regresivní LLM. V čele stojí Stefano Ermon ze Stanfordu, který dlouhodobě pracuje na diffusion architekturách stojících za nástroji jako Stable Diffusion, Midjourney nebo Sora. Tyto modely místo sekvenčního skládání textu po slovech pracují s iterativním zpřesňováním výstupu, což jim při vhodném návrhu může umožnit rychlejší a efektivnější inference.
Seed investice ve výši 50 milionů dolarů je na ranou fázi nezvykle vysoká a podílí se na ní strategičtí hráči infrastruktury dat a AI: Snowflake (cloudová datová platforma), Databricks (analytická a AI platforma nad datovými jezer) a Nvidia (klíčový dodavatel GPU). Zapojení Microsoft M12 naznačuje zájem velkých cloudových poskytovatelů o alternativní architektury k současným velkým LLM. Tato kombinace investorů ukazuje, že Inception není vnímán jako experiment na okraji, ale jako potenciální dodavatel technologie pro mainstreamové AI služby.
Společnost současně představila novou verzi modelu Mercury. Mercury je model určený primárně pro vývojáře softwaru: pomáhá generovat kód, doplňovat funkce, provádět refaktoring a analyzovat chyby. Integrace do nástrojů jako ProxyAI (AI asistent pro psaní kódu), Buildglare (nástroje pro automatizaci vývoje a nasazení) a Kilo Code (platforma pro urychlení programování) slouží jako praktický test nasazení diffusion modelů v reálných vývojářských workflow.
Klíčovým argumentem Inception je tvrzení, že jejich diffusion-based LLM mohou dosahovat nižší latence a nižších nákladů při srovnatelné kvalitě výstupu. Pokud se to potvrdí nejen v laboratorních benchmarcích, ale i v náročném produkčním provozu, může to snížit tlak na masivní škálování počtu GPU a nabídnout provozovatelům služeb levnější provoz generativní AI pro vývojáře.
Proč je to důležité
Tento krok je významný ze tří důvodů. Zaprvé, zpochybňuje implicitní předpoklad, že budoucnost generativní AI pro text a kód je výhradně v auto-regresivních LLM. Diffusion přístup, dosud dominantní v oblasti obrázků, se posouvá do textového a programátorského světa a může otevřít cestu k alternativním architekturám s lepším poměrem výkon/spotřeba.
Zadruhé, složení investorů ukazuje, že velcí hráči infrastruktury a cloudu hledají cesty, jak snížit nákladovost AI provozu. Pokud Inception doručí skutečně rychlejší a levnější inference, může se stát technologií integrovanou přímo do platforem jako datová jezera, vývojářské nástroje a firemní AI služby.
Zatřetí, pro vývojáře to může znamenat větší konkurenci k etablovaným nástrojům typu GitHub Copilot nebo proprietárním modelům velkých firem. Pokud diffusion modely zvládnou robustní generování kódu a analýzu bez dramatické spotřeby GPU, může to zpřístupnit kvalitní AI asistenty širšímu spektru firem, včetně těch, které si provoz velkých modelů dnes nemohou ekonomicky dovolit.
Zdroj: 🚀 TechCrunch
|