Souhrn
Cloudflare oznámil akvizici startupu Replicate, jehož platforma zjednodušuje nasazení AI modelů do produkčního prostředí. Replicate poskytuje katalog více než 50 000 kontejnerizovaných modelů a nástroj Cog pro automatizaci jejich přípravy. Cloudflare plánuje integraci této technologie do své nabídky Workers AI.
Klíčové body
- Replicate získal přes 23 milionů dolarů od investorů včetně Y Combinator a Sequoia Capital.
- Nabízí katalog kontejnerizovaných AI modelů, které jsou připravené k okamžitému nasazení.
- Využívá open-source nástroj Cog pro automatizaci balení modelů s jejich závislostmi.
- Platforma Replicate funguje na principu placení podle využití a eliminuje nutnost spravovat vlastní infrastrukturu.
- Cloudflare přesune Replicate na svou infrastrukturu a využije jeho technologii pro rozšíření Workers AI.
Podrobnosti
Nasazení velkých jazykových modelů (LLM) do produkčního provozu je technicky náročné. Vyžaduje správnou verzi Pythonu, knihovny jako CuDNN od Nvidie pro implementaci mechanismů pozornosti a další závislosti. Manuální konfigurace může trvat hodiny. Replicate tento proces zjednodušuje tím, že modely a jejich závislosti balí do kontejnerů – připravených jednotek, které lze nasadit jediným příkazem. K tomu využívá nástroj Cog, který v roce 2019 open-sourceoval. Platforma Replicate umožňuje vývojářům spouštět nejen předem připravené modely, ale i vlastní LLM, a to bez nutnosti spravovat serverovou infrastrukturu. Fakturace probíhá podle skutečného využití výpočetních zdrojů.
Cloudflare nyní přesune celou platformu Replicate na svou globální síť, což by mělo zvýšit její spolehlivost a výkon díky blízkosti uživatelů. Získaná technologie posílí Cloudflare Workers AI – službu pro spouštění AI modelů na okraji sítě (edge computing). To umožní nižší latenci a lepší škálovatelnost pro vývojáře, kteří chtějí integrovat AI do webových aplikací.
Proč je to důležité
Tato akvizice posiluje pozici Cloudflare v rychle rostoucím trhu s AI infrastrukturou. Zatímco velcí hráči jako AWS, Google nebo Microsoft nabízejí AI cloudové služby, Cloudflare se snaží vyniknout díky edge-first přístupu – spouštěním modelů co nejblíže koncovým uživatelům. Integrace Replicate zjednoduší vývojářům přístup k produkčním AI modelům a sníží bariéru pro jejich nasazení. V kontextu rostoucí poptávky po efektivním a levném provozu LLM může být tato kombinace klíčová pro širší adopci AI v běžných webových aplikacích.
Zdroj: 📰 SiliconANGLE News
|