Souhrn
Šéf Google DeepMind Demis Hassabis prohlásil, že škálování AI modelů, tedy zvyšování jejich velikosti a výpočetního výkonu, musí být intenzivně rozvíjeno, aby bylo dosaženo AGI. AGI představuje umělou obecné inteligenci, která by překonala současné úzce specializované systémy. Toto stanovisko odráží aktuální debatu v AI komunitě o budoucnosti vývoje modelů.
Klíčové body
- Škálování je podle Hassabise nezbytné pro přechod k AGI, které dokáže řešit širokou škálu úkolů jako člověk.
- DeepMind se zaměřuje na kombinaci škálování s pokročilými algoritmy pro lepší výsledky.
- Hassabis varuje před zpomalením investic do hardwaru a dat.
- Příkladem úspěchu je model Gemini, který využívá obrovské zdroje pro multimodální zpracování.
- Debata zahrnuje rizika jako vysokou spotřebu energie a nedostatek dat.
Podrobnosti
Demis Hassabis, spoluzakladatel a šéf Google DeepMind, divize Google zaměřené na výzkum pokročilé umělé inteligence, nedávno v rozhovoru pro Business Insider zdůraznil, že současný přístup k vývoji AI založený na škálování – tedy na zvětšování počtu parametrů modelů, objemu tréninkových dat a výpočetního výkonu – musí být agressive rozšířen. Škálování se opírá o empiricky ověřené zákony škálování (scaling laws), podle nichž výkon modelů roste předvídatelně s logaritmickým nárůstem zdrojů. Například modely jako GPT-4 od OpenAI nebo Gemini od Google dosahují lepších výsledků v úkolech jako generování textu, řešení matematických problémů či analýza obrázků právě díky miliardám parametrů a tréninku na petabytech dat.
DeepMind, který vyvinul systémy jako AlphaFold pro predikci proteinových struktur nebo AlphaGo pro hraní Go, nyní integruje škálování s technikami jako reinforcement learning a multimodální učení. Hassabis upozornil, že bez maximálního tlaku na škálování AGI zůstane v rovině teorie. AGI by umožnilo AI nejen vykonávat specifické úkoly, ale uvažovat abstraktně, plánovat dlouhodobě a adaptovat se na nové situace bez předchozího tréninku. Pro uživatele by to znamenalo nástroje schopné komplexního asistování v medicíně, výzkumu nebo inženýrství.
Nicméně Hassabisovo stanovisko nelze brát bez kritiky. Škálování vyžaduje obrovské investice do GPU clusterů, jako jsou ty od NVIDIA, a spotřebu energie odpovídající malým zemím. Současné modely již čelí omezením v kvalitě dat a výskytu halucinací, kdy AI generuje nesprávné informace. Alternativní přístupy, jako efektivnější architektury (např. sparse models) nebo neuro-symbolické systémy, by mohly být efektivnější než čisté škálování. DeepMind sám experimentuje s hybridními metodami v projektech jako Gato, multimodálním agentem.
Proč je to důležité
Toto prohlášení nastavuje směr pro Google v soutěži s OpenAI, Anthropic a xAI, kde miliardové investice do AI infrastruktury rozhodují o vedení. Pro průmysl znamená potvrzení, že AGI není blízko bez dalšího škálování, což ovlivní alokaci zdrojů – od datacenter po regulace spotřeby energie. Uživatelé mohou očekávat pokročilejší modely jako Gemini 2.0, ale s riziky jako rostoucí náklady na inference (spouštění modelů) a etické otázky kolem autonomie AI. V širším kontextu posiluje debatu o tom, zda scaling postačí, nebo je potřeba paradigmový posun, což ovlivní funding a vývoj v celém ekosystému AI.
Zdroj: 📰 Business Insider