Matematici tvrdí, že nástroje AI od Googlu zrychlují jejich výzkum

Souhrn

Matematici potvrzují, že AI systém AlphaEvolve od Google DeepMind výrazně urychluje výzkum v matematice. Nástroj dokáže nejen znovuobjevit známá řešení, ale i navrhovat vylepšené verze, které lze následně ověřit pomocí specializovaných AI systémů jako AlphaProof.

Klíčové body

AlphaEvolve kombinuje generování návrhů pomocí chatbotu Gemini s jejich vyhodnocením samostatným AI evaluátorem.
V testech na 67 matematických problémech systém překonal lidské výkony v rychlosti a často navrhoval lepší řešení než dosavadní.
Výsledky lze dále zpracovat v náročnějších AI systémech, například v AlphaProof, který získal zlatou medaili na Mezinárodní matematické olympiádě.
Systém umožňuje řešit problémy, které by tradičními metodami vyžadovaly roky vývoje specializovaných algoritmů.

Podrobnosti

AlphaEvolve je AI systém vyvinutý týmem Google DeepMind, který se zaměřuje na objevování nových algoritmů a matematických vzorců. Funguje tak, že nejprve generuje širokou škálu možných řešení pomocí modelu Gemini, poté je však filtrován samostatným AI evaluátorem, který odstraňuje nesmyslné nebo nekonzistentní návrhy. Tento dvoustupňový přístup minimalizuje typické chyby jazykových modelů, jako jsou halucinace nebo logické rozpory.

V květnu Google oznámil, že AlphaEvolve úspěšně znovuobjevil nejlepší známá řešení u 75 % z více než 50 testovaných otevřených matematických problémů. Nyní tým vedený Terencem Taem z UCLA rozšířil testování na 67 složitějších úloh a zjistil, že systém nejen reprodukuje existující výsledky, ale často navrhuje efektivnější algoritmy. Ty lze následně předat specializovaným nástrojům, jako je AlphaProof – systém schopný formálně ověřit matematické důkazy.

Tao zdůraznil, že tradiční přístup k řešení každého problému samostatným optimalizačním algoritmem by vyžadoval roky práce, zatímco AlphaEvolve umožňuje paralelní průzkum řešení v reálném čase.

Proč je to důležité

Tento pokrok ukazuje, že AI již není jen nástrojem pro asistenci, ale aktivním partnerem v teoretickém výzkumu. Schopnost kombinovat generativní modely s formálními verifikačními systémy otevírá cestu k hybridnímu výzkumu, kde AI navrhuje hypotézy a lidé je interpretují nebo rozšiřují. Pro matematiku a teoretickou informatiku to znamená potenciální zrychlení objevů v oblastech, kde lidská intuice narazila na limity. Zároveň to posiluje postavení Google DeepMind v oblasti AI pro vědecký výzkum, konkurenční vůči projektům jako OpenAI nebo Meta AI.

Číst původní článek

Zdroj: 📰 New Scientist