电视广播中的音频嵌入技术(3)
三、 音频嵌入技术
1、 辅助数据区
视频、音频信号的数字化,就是对视频、音频信号的取样、量化和编码的过程。可以说,取样是实现时间轴的离散化,而量化则是幅度轴上离散化,那么编码是实现把离散化后的值,用二进制数码表示。进而变为一系列的电脉冲。
我们清楚地知道,分量数字视频格式的有效行中,625/50制共有1728个取样字(525/60制为1716个取样字),其中对Y、Cb和Cr取样有1440个取样字(0~1439)。而对行消隐期间的取样可安排288个取样字(525/60制为276个取样字)。数据传送中,每行的消隐期间的数据是相同的,对于数字化来说就是所谓的“冗余”部分,在标准中用“SAV”和“EAV”,予以界定并作为接收端恢复的标志,就不再需要传送同步和色同步信息了。那么在“EAV”和“SAV”之间就可用来放置288个字(525/60制为276个),作为辅助数据(包括“EAV”和“SAV”的8个字)。因此,模拟视频中的行消隐期间,在数字视频中被称为行辅助数据区“HANC”(Horizontal Anicillary Data)。
同样,模拟视频中的场消隐期间,在数字视频中被称为场或帧辅助数据区,由EBU定义为“VANC”(Vertical Anicillary Data)。 我国广播电影电视行业标准GY/T160-2000《数字分量演播室接口中的附属数据信号格式》,是等效采用ITU-RBT1364建议书标准,规定了数字分量演播室应用的嵌入到视频数据信号中的辅助数据格式。
分量视频数据信号的辅助数据区,可用来传输数字音频等辅助数据信号。辅助数据信号以数据包的形式运载,每个包都带有自身的包头标识,在辅助数据区内,不可随意放置。依据标准规定,插入在数字视频的串行数据流中,可以同时发送多达16个通道,(8个AES/EBU数据流通道)20或24比特的声音信号。但必须紧接在EAV后面,不能有一个码字的空隙。误码检测信号EDH(SMPTE RP165定义)被放置在行辅助数据区的第5或315行(625/50制),但必须紧邻在“SAV”前面,同样不能有一个码字的空隙。行辅助数据区的剩余部分,可安排其它数据使用。
顺便提及,对场辅助数据区(VANC),也有特殊的规定,以625/50制为例,第5行留给EDH码,第6行留给SMPTE RP168标准场切换,第10行留给放置DVITC(Digital Vertical Interval Time Code)码。
对于分量数字视频格式的辅助数据包有具体的规范。附属数据标志ADF表征数据包的开始。ADF由三个字的序列组成,其数值为:oo,ohFF,chFF,ch。因此,如果该空间中的前三个字不是ADF(oo,ohFF,chFF,ch),则可以认为不存在附属数据包,整个区域可以用于插入附属数据包,但不是改写定时基准信号。 数据标识DID(Data ID)规定附属数据包中用户数据字所运载数据的内容和性质。
数据块序号DBN(Date Block Number),表明数据包号码,以区分带有共用数据标识的相继附属数据包(类型1)。接收机可根据包号码的连续性,来判别是否丢失数据。另一种(类型2)附属数据包没有数据块序号DBN,而将这一字节用来补充数据标识SDID,以增加数据标识范围。
数据计数DC(Data Count)表示附属数据包中用户数据字的数量。
用户数据字UDW(User Data Words),用来传送由DID标识的最多255个字的信息。需要商讨的是625/50制要有比525/60制多12个字的空间。数据包误码检验CS(Check Sum)用来确定自EAV至UDW的附属数据包的有效性。
2、 音频嵌入
目前辅助数据最大的用途是放置音频,然而被放置的音频称为嵌入音频。采用音频嵌入方案的电视系统,最大的好处是解决了电视信号在传输中的声画同步、协调的问题。由于嵌入音频后的视频信号可用一根电缆同时传送音视信号,还简化了设备系统。
被嵌入的音频信号是以块(或称段)为单位,打包传送的。一个块由192个连续帧组成,每个帧包含有相关的两个子帧,每个子帧(32比特)表示一个音频通道,放置一个音频取样字,因此一个数字音频码流可以作为立体声、双声道模式使用。
每个子帧定义为32比特,其中前置码占有4比特,音频数据为24比特,在数据位后的4比特,分别是有效标志位V(Validity),用户数据位U(User Data),通道状态位C(Channel Status Data)和子帧的奇偶校验位P(Parity)。帧的传输速率与源取样频率要严格对应。
如果音频取样频率为48KHz,一帧的取样时间为20.83μs,每一子帧的取样时间就是10.415μs。帧传输速率与源取样频率要严格对应。
在视频串行接口中可传输多达8个AES/EBU通道对(音频通道编号为1-16),分编到编号为1~4的音频组中。每个音频数据包传输1个音频组,每个音频组包含两个从各自的AES/EBU音频源中得到的数字音频通道对,即4个音频通道。即使在4个通道(CH1~CH4)中只有1个通道为有效通道时,也应该把4个通道的所有音频数据传输出去,此时要把所有无效通道的V、U、C和P比特置为零。
用户数据字(UDW)包括音频时钟相位数据(CLK)、两个AES/EBU音频通道对组成的音频组(4路音频通道)的音频数据(CHn)和纠错码(ECC)。
音频数据是AES/EBU数字音频子帧的全部比特,透明地变换成4个顺序的UDW字。包括与1个音频样值的24比特AES/EBU音频流前置码中得到的Z标志比特。对于AES/EBU通道对的两个通道,Z比特值是相同的。
按规范和使用经验,嵌入音频数据字是均匀地放置在各电视行中,这样最有利消除很敏感的伴音和画面口形的不一致,进而达到声画同步,协调一致。
在GY/T161-2000《数字电视附属数据空间内数字音频和辅助数据的传输规范》明确规定,数字音频和辅助数据的映射,应符合GY/T158-2000《演播室数字音频信号接口》的规定,即应为AES/EBU音频,用于串行视频附属数据空间的控制信息,应符合GB/T17953-2000《4∶2∶2数字分量图象信号的接口》和GY/T159-2000《4∶4∶4数字分量视频信号接口》标准的规定,信号格式还应符合GY/T160-2000《数字分量演播室接口中的附属数据信号格式》的规定。
在GY/T161-2000规范中还明确指出,48kHz取样且时钟锁定(同步)于视频信号的音频,是演播室应用的优选实施方法。也指出这个标准也支持取样频率为32~48kHz的同步或异步取样AES/EBU音频。
在GY/T161-2000规范中在配置一节指出,将从一个或多个AES/EBU帧及一个或两个通道对中得到的音频数据配置到音频数据包中,如图11所示。通常情况,一个通道对的两个通道是从同一AES/EBU音频源中得到的。一个音频数据包中包含的每个通道的样值数目取决于在视频场内数据分配。比如,某些电视行的附属数据空间可以运载3个样值,而另一些电视行中可以运载4个样值,或者还有其他数目。就是说对现有的某些设备可能传输其他数目(包括零个)样值,接收设备应能够正确处理从零到附属数据空间的极限数目的样值。
在GY/T161-2000规范中在应用级一节中规定,并不要求一种设备能够实现标准规定的全部功能,为指出一种设备对这些功能可以实现到何种程度,利用一个后缀字母来表示相应的应用级和支持的程度。
A:48KHz、20比特音频数据包上的同步音频,在电视行上样值要求均匀分配,以确保限定于A级运行的接收机的互操作。
B:48KHz的同步音频。与复合数字视频信号一起应用,样值分配允许有扩展数据包(要求接收机的运行带有大小为64个样值的缓存器),但实际无法使用这些数据包。
C:48KHz同步音频,含有音频数据包和扩展数据包。
D:异步音频(默认48KHz,采用其他频率时需指明)。
E:44.1KHz音频。
F:32KHz音频。
G:32~48KHz连续的取样频率范围。
H:音频帧序列,要求每帧都含有整数个样值,音频帧号从“1”开始,直到序列结束。
I:延时跟踪。
J:通道对中Z比特不一致的应用。
四、 展望
纵观当今科学技术的发展,速度之快、变化之大都是前所未有的。高新技术的发展也同样地冲击着广播电视领域,我们广播电视工作者对其在引进、开发和应用方面,进行了积极的探索和实践,取得了扎实的成果,并在许多方面都获得成功应用的经验。高新技术的进步给广播电视带来了严峻的挑战和激烈的竞争,同时又提供了巨大的发展机遇。天津电视台率先建立了全数字音频嵌入电视节目播出中心,就是一个具体例证。我们相信在新的世纪里,电视高新技术必将更广泛、更迅速地发展和普及,其中数字化进程会进一步加快,全面贯彻于电视节目的制作、播出、传输和储存的各个环节,直至千家万户。高清晰度电视(HDTV)、数字地面广播等新技术也将全面进入实用阶段,计算机技术与电视技术的融合将更加密切,电视传输网络将向宽频带、双方向、可交互、多功能方向发展,电视媒体将由于这些高新技术发展的带动,而迅速成为我国信息产业建设的重要组成部分。在信息时代里,我们要以积极创新、科学求实的姿态,与全国广播电视工作者一道,把握机遇,迎接挑战,将我国的广播电视事业继续推向新的高度。
根据科学进步的规律,嵌入音频的应用就更为重要。从电视节目的制作、播出、微波和光缆传输,卫星节目传送和数字电视广播等,都要有音频嵌入技术的结合,并已逐步地以行业标准的形式予以确认。例如我国参考ITU-R BT1365建议书制定了GY/T162-200《HDTV串行接口中作为附属数据信号的24比特数字音频格式》,就是确定音频嵌入技术应用的标准。因此采用音频嵌入技术势在必行,音频嵌入技术将成为电视发展,网络化普及的基础技术之一。(完)