Souhrn
Americký technologický gigant Meta, který v únoru 2023 vydal open-source modely rodiny Llama, nyní údajně bere inspiraci z čínského konkurenta. Podle zprávy Bloomberg z 20. listopadu 2024 využívá Meta model Qwen od Alibaba Cloud k trénování svého nového modelu Avocado. Tento vývoj obrací role v open-source ekosystému velkých jazykových modelů (LLM), kde dříve čínské firmy stavěly na americké technologii.
Klíčové body
- Meta vydalo Llama v únoru 2023 jako open-source, což bylo neobvyklé mezi vývojáři AI.
- První generace Qwen od Alibaba Cloud v září 2023 převzala tréninkový proces Llama a citovala výzkum Meta.
- Nyní Meta údajně trénuje model Avocado na bázi Qwen, podle anonymních zdrojů.
- Do roku 2024 byl Llama standardem pro čínské vývojáře AI, včetně firem jako 01.AI.
- Vývoj signalizuje posun, kdy čínské open-source modely získávají globální vliv.
Podrobnosti
Rodina modelů Llama od Meta představuje sadu velkých jazykových modelů určených pro open-source použití, což umožňuje vývojářům po celém světě stahovat, upravovat a trénovat je na vlastních datech pro aplikace jako chatboti, generování textu nebo analýza dat. V únoru 2023 byl tento krok výjimečný, protože většina konkurentů jako OpenAI držela modely uzavřené. Llama se rychle stal základem pro mnoho derivátů, včetně čínského Qwen od Alibaba Cloud, který byl oznámen v září téhož roku. Vývojáři Qwen explicitně přiznali vliv Llama, převzali jeho tréninkový postup a v technické zprávě označili Llama za „nejlepší open-source velký jazykový model“. Alibaba Cloud, divize Alibaba skupiny zabývající se cloudovými službami a AI infrastrukturou, tak vstoupila do závodů s pevným základem.
Během let 2023 a 2024 se Llama stal defaultní volbou pro čínské firmy usilující o dohnání amerického vedení v AI. Startupy jako 01.AI zakladatele Kai-Fu Lee, bývalého šéfa Google China a investora do AI, čelily kritice za nedostatečné zdůraznění závislosti na Llama. Nyní podle Bloomberg Meta obrací stůl: anonymní zdroje tvrdí, že společnost používá Qwen k vývoji Avocado, nového modelu, jehož specifikace nejsou známy. Nebylo specifikováno, která verze Qwen je použita – Alibaba má řadu Qwen1.5 a Qwen2 s velikostmi od 0,5 miliardy do 72 miliard parametrů, optimalizovaných pro multijazyčné úlohy včetně čínštiny. Tento krok není oficiálně potvrzen Meta ani Alibaba, což zvyšuje opatrnost při hodnocení – zprávy založené na “nepojmenovaných zdrojích” často slouží k testování trhu nebo strategickému tlaku.
Proč je to důležité
Tento údajný obrat podtrhuje rychlý vzestup čínských open-source modelů v globálním AI ekosystému. Zatímco USA vedly díky firmám jako Meta, OpenAI a Anthropic, Čína investuje masivně do domácích alternativ, aby překonala exportní restrikce na čipy NVIDIA a software. Qwen dosáhl výkonu srovnatelného s Llama 3 v benchmarkách jako MMLU nebo HumanEval, což ho činí atraktivním pro hybridní trénink – vývojáři mohou kombinovat silné stránky obou, například lepší zpracování asijských jazyků u Qwen. Pro průmysl to znamená větší diverzifikaci: méně závislosti na jednom modelu snižuje rizika, jako jsou licenční změny Meta (např. Llama 3.1 má restrikce pro trénink konkurenčních modelů). Uživatelé a vývojáři získají robustnější open-source ekosystém, ale zároveň roste tlak na bezpečnost – čínské modely často trénované na méně filtrovaných datech mohou nést rizika biasů nebo úniků dat. Dlouhodobě to urychluje globální konkurenci směrem k AGI, kde hranice mezi USA a Čínou se stírají.
Zdroj: 📰 Yahoo Entertainment