🚀 TechCrunch

Wikimedia Foundation oznámila nová partnerství s AI společnostmi Amazon, Meta, Microsoft, Perplexity a dalšími

Wikimedia Foundation oznámila nová partnerství s AI společnostmi Amazon, Meta, Microsoft, Perplexity a dalšími

Souhrn

Nadace Wikimedia Foundation při oslavě 25. výročí svého založení zveřejnila řadu nových partnerství s AI společnostmi, včetně Amazonu, Meta, Microsoftu, Mistral AI a Perplexity. Tyto firmy nyní platí za přístup k produktu Wikimedia Enterprise, který umožňuje velkovýrobní využití obsahu Wikipedie pro AI aplikace. Partnerství pomáhá financovat projekt a zajišťuje legální data pro AI modely.

Klíčové body

  • Nová partnerství: Amazon, Meta, Microsoft, Mistral AI, Perplexity, plus dříve zmíněné Ecosia, Pleias, ProRata, Nomic a Reef Media.
  • Wikimedia Enterprise: Komerční služba pro masivní stahování a distribuci obsahu Wikipedie, navržená pro potřeby AI firem.
  • Statistiky Wikipedie: Mezi 10 nejnavštěvovanějších webů světa, 65 milionů článků ve více než 300 jazycích, 15 miliard zobrazení měsíčně.
  • Cíl: Udržitelnost Wikipedie v éře AI, kde je obsah často scrapován pro trénink modelů.
  • Další aktivity: Spuštění kampaně k výročí.

Podrobnosti

Wikimedia Enterprise je komerční produkt vyvinutý nadací Wikimedia Foundation, který od roku 2022 umožňuje velkým technologickým firmám legálně a efektivně získávat obrovské objemy obsahu z Wikipedie a dalších projektů jako Wikimedia Commons nebo Wiktionary. Na rozdíl od veřejného API tento produkt nabízí vyšší rychlost, objem a spolehlivost dat, což je klíčové pro AI společnosti trénující velké jazykové modely (LLM) nebo vyvíjející vyhledávače na bázi AI. Například Perplexity, specializující se na AI-poháněný vyhledávač, může díky tomu rychle integrovat aktuální wikipedické články do svých odpovědí. Mistral AI, francouzský startup zaměřený na open-source LLM jako Mistral 7B nebo Mixtral, získává tak kvalitní tréninková data bez rizika právních sporů.

Kromě nově oznámených partnerství s Amazonem (pravděpodobně pro AWS služby jako Bedrock), Metou (pro Llama modely) a Microsoftem (pro Azure AI a Copilot) nadace potvrdila starší spolupráce s Googlom z roku 2022 a dalšími jako Ecosia (vyhledávač financující sází stromů), Pleias (AI firma zaměřená na francouzské modely), ProRata.ai (platforma pro AI analýzu dat), Nomic (vývojář open-source embedding modelů pro multimodální data) a Reef Media (pravděpodobně mediální AI služby). Tyto dohody nejsou jen o platbách – poskytují firmám data optimalizovaná pro strojové učení, včetně historických verzí stránek a metadat.

Podle blogového příspěvku nadace je Wikipedia součástí top 10 nejnavštěvovanějších webů, s 65 miliony článků ve 300+ jazycích a 15 miliardami měsíčních zobrazení. Selena Deckelmann, šéfka produktového vývoje a technologie (CPO/CTO), zdůraznila: „Wikipedia ukazuje, že znalosti jsou lidské a potřebují lidi. Zejména v éře AI potřebujeme lidsky vytvářené znalosti Wikipedie více než kdy dřív.“ K výročí spustila nadace kampaň na sbírání darů a zapojení dobrovolníků.

Proč je to důležité

Tato partnerství řeší klíčový problém AI průmyslu: nedostatek kvalitních, legálních dat pro trénink. Mnoho AI modelů jako GPT nebo Llama bylo v minulosti kritizováno za scrapování Wikipedie bez souhlasu, což vedlo k přesnostním chybám a etickým sporům. Wikimedia Enterprise zajišťuje čistá data, což zlepšuje kvalitu AI odpovědí a snižuje halucinace. Pro Wikipedii to znamená nový příjemový proud mimo dary, což je zásadní v době, kdy AI konkurují tradičním vyhledávačům. V širším kontextu posiluje to symbiózu mezi lidskou kurátorskou prací a AI, kde Wikipedia slouží jako faktická základna pro miliardy uživatelů AI služeb. Dlouhodobě to může ovlivnit standardy datového licenčnictví v AI ekosystému.


Číst původní článek

Zdroj: 🚀 TechCrunch

Číst původní článek
Původní název: Wikimedia Foundation announces new AI partnerships with Amazon, Meta, Microsoft, Perplexity and others | TechCrunch