Souhrn
Společnost Omron Sinic X, strategické výzkumné centrum japonského technologického gigantu Omronu, představí dva výzkumné příspěvky na mezinárodní konferenci NeurIPS 2025, která se uskuteční v prosinci v San Diegu. Jeden z článků byl vybrán do prestižní kategorie Spotlight, což znamená, že patří mezi nejvýznamnější přijaté práce.
Klíčové body
- Omron Sinic X publikuje dva články na NeurIPS 2025, jednu z nejvlivnějších konferencí v oblasti AI a strojového učení.
- První práce se zabývá bezpečným učením s posilováním (reinforcement learning) v rámci omezených Markovových rozhodovacích procesů (Constrained MDPs) s teoretickou zárukou bezpečnosti na úrovni jednotlivých epizod.
- Druhý článek navrhuje metodu pro zlepšení kvality šumivých štítků generovaných velkými jazykovými modely (LLM) pomocí robustního učení bez štítků.
- Konference NeurIPS 2025 přijala 5 290 prací z celkem 21 575 podaných příspěvků (úspěšnost cca 24,5 %).
Podrobnosti
První výzkumný příspěvek řeší kritický problém v reálném nasazení algoritmů učení s posilováním: zajištění bezpečnosti během každé jednotlivé epizody, nikoli jen v průměru přes mnoho pokusů. V praxi to znamená, že systém – například autonomní robot nebo průmyslový automat – nebude porušovat bezpečnostní omezení ani při prvním spuštění. Tento přístup je zásadní pro aplikace v reálném světě, kde i jednorázové porušení omezení může vést k vážným následkům. Algoritmus využívá lineární aproximační funkce a poskytuje teoretické záruky efektivity i bezpečnosti.
Druhá práce se zaměřuje na aktuální trend v trénování LLM: generování trénovacích dat samotnými modely. Tento přístup sice snižuje náklady, ale zavádí riziko šíření chybných informací. Autoři navrhují metodu „Self Iterative Label Refinement“, která pomocí učení bez štítků identifikuje a opravuje nepřesné štítky, aniž by vyžadovala externí ověření. Tím se zvyšuje robustnost modelů trénovaných na syntetických datech.
Proč je to důležité
Oba příspěvky řeší praktické bariéry při nasazování AI v reálném prostředí – bezpečnost v dynamických systémech a spolehlivost synteticky generovaných dat. I když se nejedná o průlomové objevy, přinášejí cenné technické vylepšení s potenciálem pro průmyslové využití, zejména v oblastech jako průmyslová automatizace, robotika nebo spolehlivé LLM. Účast japonské společnosti na NeurIPS také ukazuje na rostoucí mezinárodní zapojení nezápadních firem do špičkového AI výzkumu.
Zdroj: 📰 Prtimes.jp
|