Voice Extensible Markup Language
VXML je značkovací jazyk založený na XML, standardizovaný konsorciem 3GPP, pro vytváření hlasem řízených aplikací (např. IVR) v IMS, který odděluje aplikační logiku od zpracování médií pro webově podobné nasazení.
Popis
Voice Extensible Markup Language (VXML), standardizovaný konsorciem W3C a přijatý konsorciem 3GPP ve specifikaci 23.333, je klíčovou technologií pro vývoj hlasových služeb v telekomunikačních sítích, zejména v rámci IP Multimedia Subsystem (IMS). Funguje jako aplikační protokol, který definuje průběh dialogu mezi uživatelem a hlasovou službou. Dokument (neboli skript) VXML je zpracováván speciálním interpretem nazývaným Hlasový prohlížeč (Voice Browser), který běží na mediálním serveru (např. Media Resource Function Processor, MRFP). Tento prohlížeč skript vykonává, řídí přehrávání zvuku (syntetizovaná řeč nebo předem nahrané audio), zpracovává vstup od uživatele (řeč nebo DTMF tóny) a rozhoduje o logice navigace během hovoru.
Architektura zahrnuje několik klíčových komponent. Architektura VXML Fóra, na kterou 3GPP odkazuje, zahrnuje Hlasový prohlížeč, který načítá VXML dokumenty z aplikačního serveru (AS) prostřednictvím HTTP. Aplikační server hostuje servisní logiku a obchodní pravidla a generuje dynamické VXML stránky. Mediální server poskytuje vlastní zdroje pro rozpoznávání řeči (ASR), syntézu řeči (TTS) a přehrávání audia. Skript VXML se skládá z řady dialogových stavů (jako