Souhrn
Jazykový model Gemini 3.0 Pro od Google pomohl výzkumníkům z projektu GDELT dekódovat čtyři malé kruhové poznámky v listu Norimberské kronice z roku 1493. Tyto ručně psané roundels s zkrácenou latinou a římskými číslicemi představovaly výpočty sladící biblické chronologie z Septuaginty a hebrejské Bible pro určení roku narození Abraháma. Model prokázal schopnost multimodálního uvažování napříč paleografií, chronologií a teologickou historií, i když udělal drobné číselné chyby.
Klíčové body
- Norimberská kronika je ilustrovaná kniha z roku 1493, považovaná za jeden z nejdůležitějších tisků raného novověku.
- Roundels nejsou dekorace, ale výpočty v systému Anno Mundi pro sladění dat z Septuaginty (řecký překlad Starého zákona) a hebrejské Bible.
- Gemini 3.0 Pro analyzoval vysocerozlišovací snímky, interpretoval tiskaný text i ručopis a spojil poznámky s dalšími pasážemi kroniky.
- Model dospěl k konzistentní interpretaci, která odpovídá středověkým metodám, přestože selhal v několika malých číselných hodnotách.
- Projekt GDELT, který se zaměřuje na monitorování a analýzu globálních médií pomocí AI, vedl tuto analýzu.
Podrobnosti
Norimberská kronika, známá také jako Schedel’sche Weltchronik, vyšla v roce 1493 v Norimberku a obsahuje 645 ilustrovaných listů popisujících světovou historii od stvoření po rok 1493. I když je tiskaný text dobře pochopený, ruční marginální poznámky v některých exemplářích zůstaly záhadou. Konkrétně v jednom dochovaném listu se nacházejí čtyři malé kruhové prvky (roundels) s abbreviovanou latinou a římskými číslicemi, které vědci roky nedokázali interpretovat.
Výzkumníci z GDELT Projectu, organizace specializující se na sběr a AI analýzu miliard mediálních zpráv denně, nahráli do modelu Gemini 3.0 Pro vysocerozlišovací snímky listu. Tento velký jazykový model, navržený pro zpracování textu, obrázků a kontextu, nebyl pouze rozpoznávačem znaků. Musel aplikovat znalosti paleografie (studium starých rukopisů), chronologie (srovnání časových linií) a teologické historie (biblické datování). Gemini identifikoval, že poznámky slouží k výpočtům v pre-křesťanském systému Anno Mundi (rok světa), kde autor snažil sladit rozporné data narození Abraháma: podle Septuaginty kolem 3312–3921 AM a podle hebrejské Bible kolem 1948 AM.
Model rozluštil zkratky jako odkazy na biblické pasáže, interpretoval římská číslice jako rozdíly v letech a propojil je s jinými částmi kroniky. Například spojil roundels s tabulkami chronologií v knize, což ukazuje na středověkou praxi harmonizace biblických tradic. Gemini 3.0 Pro tak prokázal pokročilé multimodální uvažování, kde současně analyzuje vizuální prvky, historický kontext a logické souvislosti. Nicméně, jako uvádí zpráva, model udělal drobné chyby v čtení některých čísel, například o jednotky nebo desítky nesprávně, což zdůrazňuje limity současných AI v přesné optické rozpoznávání starých rukopisů. Tato analýza byla provedena v lednu 2026 a potvrzuje, že Gemini 3.0 Pro je schopen aplikací v digitálních humanitních vědách, kde tradiční metody selhávají kvůli složitosti kontextu.
Proč je to důležité
Tento případ demonstruje pokrok v multimodálním uvažování velkých jazykových modelů jako Gemini 3.0 Pro, který zpracovává obrázky a text v komplexním historickém kontextu, což překračuje jednoduché rozpoznávání. Pro průmysl znamená rozšíření použití AI v archivech, muzeích a výzkumu, kde lze automatizovat analýzu tisíců historických dokumentů. Pro uživatele v akademickém prostředí to otevírá nástroje pro rychlejší dekódování rukopisů, i když vyžaduje lidskou verifikaci kvůli chybám. V širším ekosystému AI posiluje pozici Google v multimodalních modelech proti konkurentům jako GPT-4o nebo Claude 3.5, kde takové aplikace v humanitách mohou vést k novým objevům v historii a teologii. Celkově to ukazuje, jak AI zrychluje vědu, ale zároveň zdůrazňuje potřebu robustních validačních mechanismů.
Zdroj: 📰 SiliconANGLE News