Souhrn
Model xAI Grok 4.20 od firmy xAI, založené Elonem Muskem, dosáhl v soutěži Alpha Arena nejlepšího výkonu při autonomním obchodování na Nasdaq. Nejlepší instance modelu pod strategii Situational Awareness proměnila 10 000 dolarů na 14 698 dolarů, což představuje 47% výnos za dva týdny. Soutěž zahrnovala 32 instancí různých LLM, které obchodovaly reálnými penězi bez lidského zásahu.
Klíčové body
- Grok 4.20 provedl 105 obchodů a dominoval žebříčku s nejvyšším výnosem +47 % v top instanci.
- Soutěž probíhala dva týdny na volatilních technologických akciích jako Tesla (TSLA), Nvidia (NVDA), Microsoft (MSFT), Palantir (PLTR) a Amazon (AMZN).
- Každá instance měla 10 000 dolarů, celkový kapitál 320 000 dolarů; modely generovaly nápady, určovaly velikost pozic, načasování vstupů a výstupů i řízení rizik pouze z dat trhu.
- Strategie zahrnovaly Situational Awareness, Monk Mode, Max Leverage a New Baseline; agregovaný výnos Groku byl kolem 12,11 %.
- Článek napsal Brian Wang, zakladatel blogu Nextbigfuture.com, který se zaměřuje na disruptivní technologie včetně AI a robotiky.
Podrobnosti
Soutěž Alpha Arena testovala schopnosti velkých jazykových modelů (LLM) v reálném autonomním obchodování na burze Nasdaq. xAI, firma Elona Muska zaměřená na vývoj pokročilých LLM jako alternativa k modelům od OpenAI, nasadila verzi Grok 4.20. Tento model, navržený pro složité úlohy zpracování dat a rozhodování, musel bez jakéhokoli lidského zásahu analyzovat tržní data, generovat obchodní nápady, stanovovat velikost pozic, načasovávat vstupy a výstupy a řídit rizika. Zaměření bylo na volatilní technologické akcie, které jsou citlivé na zprávy o AI, čipech a cloudu – například Nvidia díky poptávce po GPU pro trénink modelů, Tesla kvůli autonomním vozidlům nebo Palantir pro datovou analytiku.
Celkem 32 instancí různých LLM, včetně variant stejných modelů pod různými promptovacími strategiemi, dostalo každá 10 000 dolarů reálných peněz. Strategie jako Situational Awareness umožňovala modelu brát v úvahu širší kontext trhu, zatímco Monk Mode se soustředil na konzervativní přístup nebo Max Leverage na agresivní pákové obchody. Grok 4.20 vykonal 105 obchodů a jeho top instance dosáhla +47 % (z 10 000 na 14 698 dolarů). Agregovaný výnos napříč instancemi byl uváděn na 12,11 %, což může být průměr nebo vážený údaj. Jiné modely zaostávaly, což ukazuje na silu Groku v praktické aplikaci. Brian Wang, autor z Nextbigfuture.com – blogu s miliónem čtenářů měsíčně o technologiích jako AI, vesmír a nanotechnologie – zdůrazňuje, že jde o první takový test s reálnými penězi. Nicméně, dva týdny je krátké období a volatilita trhu (např. kvůli zprávám o AI čipech) mohla příznivě ovlivnit výsledky; dlouhodobá stabilita zůstává otazníkem.
Proč je to důležité
Tento výsledek demonstruje pokrok LLM v praktických finančních aplikacích, kde rozhodování vyžaduje integraci dat, predikce a rizikového managementu. Pro průmysl znamená potenciál pro autonomní tradingové systémy, které by mohly snížit náklady na lidské obchodníky a zpracovávat obrovské objemy dat rychleji než člověk. xAI tak posiluje pozici v soutěži s OpenAI, Anthropic nebo Google, kde se LLM posouvají od textové generace k agentickým systémům schopným akcí ve světě. Pro uživatele to otevírá dveře k AI nástrojům pro osobní finance, ale vyžaduje regulaci kvůli rizikům ztrát. V širším kontextu urychluje to integraci AI do financí, podobně jako kvantové počítače pro optimalizace portfolií, a může vést k novým partnerstvím mezi AI firmami a bankami. Nicméně, úspěch v jedné soutěži nezaručuje univerzální nadřazenost – potřebujeme replikace na delších horizontech a různých trzích.
Zdroj: 📰 Next Big Future
|