Spectral Band Replication
SBR je technika rozšíření šířky pásma při kódování audia, která rekonstruuje vysokofrekvenční složky zvuku z nízkofrekvenčního základního signálu za účelem zlepšení vnímané kvality audia při nízkých přenosových rychlostech.
Popis
Spectral Band Replication (SBR) je sofistikovaná technologie kódování audia standardizovaná 3GPP pro použití v kodecích, jako je kodek Enhanced Voice Services (EVS) a dříve Adaptive Multi-Rate Wideband (AMR-WB+). Klasifikuje se jako technika ‘rozšíření šířky pásma’. Základní princip SBR spočívá v efektivním přenosu vysokofrekvenčního obsahu audio signálu bez přímého kódování vysokofrekvenčních vzorků, které jsou náročné na přenosovou rychlost. Místo toho vysílač (enkodér) přenáší základní signál nízkého pásma (např. 0–6,4 kHz) na základní přenosové rychlosti pomocí tradičního základního kodeku (jako ACELP nebo MDCT) spolu s velmi kompaktní sadou řídicích parametrů, které popisují spektrální charakteristiky vysokého pásma (např. 6,4–16 kHz).
Z architektonického hlediska se kodek s podporou SBR skládá ze základního dekodéru a modulu SBR syntézy. Enkodér provádí komplexní analýzu. Rozdělí původní širokopásmový signál na nízké a vysoké pásmo. Nízké pásmo je zakódováno základním kodekem. Současně analyzuje vysoké pásmo, aby extrahoval parametry, jako je spektrální obálka (úrovně energie v různých kmitočtových oblastech) a časový šumový podklad. Tyto parametry SBR jsou kvantovány a odeslány do dekodéru jako vedlejší informace. Bitová náročnost těchto parametrů je mnohem nižší než plné kódování průběhu vysokého pásma.
Na straně dekodéru proces probíhá obráceně. Základní dekodér rekonstruuje signál nízkého pásma. Modul SBR syntézy poté vygeneruje signál vysokého pásma. Dělá to transpozicí nebo kopírováním kmitočtových složek z dekódovaného nízkého pásma do vysokofrekvenční oblasti. Tato zkopírovaná ‘surová’ vysokofrekvenční složka postrádá správný spektrální tvar. Dekodér následně použije přijaté parametry SBR – data o spektrální obálce a šumovém podkladu – k pečlivému tvarování a úpravě vygenerovaného signálu vysokého pásma tak, aby co nejvěrněji odpovídal charakteristikám originálu. Nakonec je syntetizované vysoké pásmo sloučeno s dekódovaným nízkým pásmem za vzniku plně šířkopásmového výstupu. Tato technika umožňuje kodeku poskytovat audio se širokopásmovou nebo super-širokopásmovou subjektivní kvalitou při přenosových rychlostech typicky spojovaných s úzkopásmovou řečí, což představuje významný skok v efektivitě kódování pro hlasové a audio služby.
K čemu slouží
Spectral Band Replication byl vytvořen, aby překonal základní kompromis mezi šířkou pásma audia (a tedy kvalitou) a přenosovou rychlostí v mobilních komunikacích. Tradiční kodeky pracující s průběhem signálu vyžadují téměř lineární nárůst přenosové rychlosti k reprezentaci vyšších kmitočtů. Jak se sítě vyvíjely, aby podporovaly vyšší kapacitu, poptávka uživatelů se posunula od pouhé srozumitelnosti k vysoce kvalitnímu, přirozeně znějícímu hlasu a hudbě. SBR to řešil oddělením šířky pásma od přenosové rychlosti psychoakusticky inteligentním způsobem.
Historický kontext spočívá ve vývoji od úzkopásmové (300–3400 Hz) telefonie k širokopásmovému (50–7000 Hz) hlasu, jak je vidět u AMR-WB. Pro dosažení ještě vyšší kvality (super-širokopásmový až 16 kHz) nebo stereofonní hudby při omezených přenosových rychlostech pro mobilní streamování byla potřeba efektivnější metoda. SBR to řeší využitím vlastností lidského sluchového systému: jemná struktura vysokých kmitočtů je pro vnímání méně kritická než celkový spektrální tvar a energie. Proto je replikace struktury z nízkého pásma a pouhé zasílání parametrů tvarování vysoce efektivní. To umožnilo kodekům 3GPP, jako je EVS, poskytovat kvalitu ‘HD Voice+’ při přenosových rychlostech podobných starším úzkopásmovým kodekům, což umožnilo vynikající kvalitu hlasu i na vytížených sítích a efektivní využití síťových zdrojů pro pokročilé komunikační služby.
Klíčové vlastnosti
- Umožňuje širokopásmovou nebo super-širokopásmovou kvalitu audia při nízkých až středních přenosových rychlostech
- Funguje jako doplňková technologie k základnímu audio kodeku (např. jádro EVS)
- Přenáší pouze kompaktní sadu parametrů spektrální obálky a šumu vysokého pásma
- Rekonstruuje vysoké kmitočty transpozicí a tvarováním dekódovaného signálu nízkého pásma
- Poskytuje významné úspory přenosové rychlosti pro daný cíl kvality audia
- Integrální součást kodeku 3GPP EVS pro rozšířené hlasové a audio služby
Související pojmy
Definující specifikace
- TS 26.117 (Rel-19) — 5G Media Streaming Speech/Audio Capabilities
- TS 26.140 (Rel-19) — MMS Media Formats and Codecs Specification
- TS 26.141 (Rel-19) — IMS Messaging & Presence Media Formats
- TS 26.234 (Rel-19) — 3GPP PSS Protocols and Codecs Specification
- TS 26.401 (Rel-19) — Enhanced aacPlus Audio Codec Mapping
- TS 26.402 (Rel-19) — Enhanced aacPlus Error Concealment & Processing
- TS 26.403 (Rel-19) — Enhanced aacPlus AAC Encoder Specification
- TS 26.404 (Rel-19) — Enhanced aacPlus SBR Encoder Specification
- TS 26.405 (Rel-19) — Parametric Stereo Encoder for Enhanced aacPlus
- TS 26.406 (Rel-19) — Enhanced aacPlus Audio Codec Conformance Testing
- TS 26.410 (Rel-19) — Enhanced aacPlus Floating-Point ANSI-C Code
- TS 26.411 (Rel-19) — Enhanced aacPlus Fixed-Point ANSI-C Code
📖 Anglický originál a plná specifikace: SBR na 3GPP Explorer