🔬 Ars Technica

AI vyhledávače citují méně populární zdroje než tradiční Google

AI vyhledávače citují méně populární zdroje než tradiční Google

Souhrn

Nový výzkum z Ruhr University a Max Planck Institute quantifikoval rozdíly mezi tradičními vyhledávači a AI-poháněnými alternativami. Studie zjistila, že generativní vyhledávače jako Google AI Overviews, Gemini nebo GPT-4o citují výrazně méně populární weby, které by se v klasickém Google vyhledávání často ani neobjevily mezi prvními stovkou výsledků.

Klíčové body

  • Výzkumníci porovnávali tradiční Google výsledky s AI Overviews, Gemini-2.5-Flash, GPT-4o web search a GPT-4o with Search Tool
  • Testovací dotazy pocházely z datasetu WildChat, politických témat z AllSides a 100 nejhledanějších produktů na Amazonu
  • Zdroje citované AI vyhledávači byly měřitelně méně populární než ty v top 10 tradičního vyhledávání podle žebříčku Tranco
  • Gemini vykazoval největší tendenci citovat neznámé domény, s mediánem mimo top 1000 domén
  • Většina zdrojů z AI Overviews se neobjevuje ani v top 10 klasických Google výsledků pro stejný dotaz

Podrobnosti

Výzkumníci z německých institucí publikovali předběžnou studii s názvem “Characterizing Web Search in The Age of Generative AI”, která systematicky zkoumá rozdíly mezi klasickým a AI-poháněným vyhledáváním. Studie analyzovala několik variant AI vyhledávání - od Google AI Overviews, které se staly známými po loňském problematickém uvedení, přes Gemini-2.5-Flash až po různé implementace GPT-4o.

Zajímavé je zejména rozlišení mezi standardním web search módem GPT-4o a variantou “GPT-4o with Search Tool”, která využívá webové vyhledávání pouze tehdy, když velký jazykový model rozhodne, že potřebuje informace mimo svá předtrénovaná data. Toto rozlišení ukazuje na různé přístupy k integraci vyhledávání do AI systémů.

Popularitu zdrojů výzkumníci měřili pomocí služby Tranco, která sleduje návštěvnost domén. Výsledky ukázaly konzistentní vzorec - AI vyhledávače mají tendenci odkazovat na weby mimo top 1000, někdy dokonce mimo top milion nejnavštěvovanějších domén. Gemini v tomto ohledu vynikal nejvíce, s mediánem citovaných zdrojů ležícím mimo prvních tisíc nejpopulárnějších webů napříč všemi výsledky.

Nejpodstatnějším zjištěním je, že většina zdrojů citovaných v AI Overviews se vůbec neobjevuje v prvních deseti výsledcích klasického Google vyhledávání pro stejný dotaz. To naznačuje fundamentálně odlišný přístup k výběru a hodnocení relevance informací.

Proč je to důležité

Tato zjištění mají významné důsledky pro celý ekosystém webu. Pokud AI vyhledávače skutečně upřednostňují méně populární zdroje, může to zásadně změnit distribuci návštěvnosti a tím i ekonomiku webového obsahu. Menší weby by mohly získat větší viditelnost, zatímco etablované stránky, které dominují tradičním výsledkům, by mohly přijít o část návštěvnosti.

Zároveň to vyvolává otázky o kvalitě a důvěryhodnosti citovaných zdrojů. Popularita webu sice není zárukou kvality, ale méně navštěvované stránky mohou být také méně prověřené a potenciálně obsahovat nepřesné informace. To je obzvláště relevantní v kontextu loňských problémů s AI Overviews, které generovaly zavádějící nebo přímo nebezpečné rady.

Pro tvůrce obsahu a SEO specialisty to znamená nutnost přehodnotit strategie. Optimalizace pro AI vyhledávače zřejmě vyžaduje jiný přístup než tradiční SEO zaměřené na umístění v top 10 Google výsledků.


Číst původní článek

Zdroj: 🔬 Ars Technica

Číst původní článek
Původní název: AI-powered search engines rely on “less popular” sources, researchers find - Ars Technica