面向移动应用的语音编解码开环基音搜索方法

2014-06-09 15:15:17 智能计算机与应用   点击量: 评论 (0)
摘要:基音周期搜索的准确性将直接影响到语音编码器的编码质量和效率。本文根据AMR-WB+标准中基音周期搜索算法会发生检测基音倍频和半频错误,提出了开环基音搜索算法。该算法以自相关函数为基础,利用基音周期的


(3)判断自相关函数序列中的最大值对应的基音周期候选值是否为当前最佳基音周期候选值的加倍,若是,保持当前的基音周期最佳候选值,否则设定自相关函数序列中最大值对应的基音周期候选值作为最佳基音周期候选值。
 
得到了最佳基音周期候选值后,要进行可靠的基音周期全局参考(global_pitch)确定。确定基音周期全局参考的算法为:
 
(1)若当前帧可以确定可靠的基音周期参考,即确定新的基音周期全局参考,否则,要在当前帧延续近期可靠的基音周期全局参考。若超过了额定的保持基音周期全局参考的帧数,则强制基音周期全局参考为0,意味着该语音片段并不是浊音,而且也不具备较好的基音周期连续性;
 
(2)对于可靠的基音周期参考,其确定方式为满足以下4个条件之一即可:
 
① 基音周期候选值序列中,自相关函数最大值并不是最佳基音周期候选对应的自相关函数值的加倍,并且最佳的基音周期候选值与当前的基音周期全局参考的差值的绝对值小于8 (延续前帧);
 
② 自相关函数序列中最大值与其它值的比值均大于1.7 (在这种情况下,前面遴选出的最佳基音周期候选值一定是自相关函数序列中最大值对应的基音周期候选值);
 
③ 基音周期候选值序列中存在基音周期候选值为最佳基音周期候选值的加倍;
 
④ 当前的基音周期全局参考(延续前帧)是当前最佳基音周期候选值的加倍,并且自相关函数的最大值要大于0.36这一门限。
 
满足这四个条件时,基本就可以断定该段语音信号为一个周期性比较强的浊音信号,因此利用这段语音信号可以确定一个基音周期的全局参考值,该全局参考值可以适用于当前帧以及后来帧。倘若不满足上述的条件,即不能确定可靠的基音周期,则要考虑是否沿用前面确定的可靠的基音周期全局参考,本文中设定基音周期参考轨迹可以保持三帧,首先判断是否保持了三帧,如果超过三帧,则强制当前帧的基音周期参考为0,失去参考的意义。否则,考察是否自相关函数最大值小于0.15这一门限,若小于该门限超过1帧,则仍强制该基音周期全局参考为0。
 
1.3基音周期确定
 
基音周期的确定可基于前面计算出来的自相关函数序列,以及其对应的基音周期候选序列来分别进行不同情况的基音周期判断。
 
在确定基音周期时,需分三种情况确定最终的基音周期:
 
(1)基音周期候选与基音周期全局参考的差值的绝对值小于5;
 
(2)最大自相关函数值小于门限值0.15;
 
(3)无法明显判断基音周期,基音周期确定参考值用来对最后的基音周期的确定起到参考的作用,确定该值的步骤如下:
 
① 若基音周期全局参考非零,基音周期确定参考值设定为基音周期的全局参考;
 
② 否则,基音周期确定参考值设定为上一个不为0的基音周期全局参考,若上一个不为0的基音周期全局参考保持超过3帧,则该值强制为0。
 
利用上述条件确定的基音周期确定参考值对整个基音周期候选序列进行搜索,找到基音周期候选值最接近基音周期确定参考值的一个值,将其对应的自相关函数加倍,并重新排序自相关函数值,随之移动对应的基音周期搜索候选值,同时找到自相关函数最大的基音周期候选值作为基音周期输出。
 
2实验分析
 
实验采用本文算法与AMR-WB+中的算法进行对比,以ACELP编码模式中的分段信噪比作为客观评价标准,测试数据采用MPEG标准的12个序列,实验结果如表1所示。其图示实验结果如图1所示。
 
3结束语
 
AVS P10标准采用最大化自相关函数值从而得到的基音周期候选值,该候选值与求原始信号以及延迟信号的误差的最小均方差标准求解得到的基音周期候选值一致,从统计意义上讲比较精确,并且与后面的闭环基音搜索中的整数基音搜索相一致。本文中使用归一化的自相关函数,以通过对自相关函数值的分类分析解决倍周期问题,并且对基音周期平滑性进行加权和判断语音的周期性强弱,进而最终确定基音周期。在判定过程中设定基音周期全局参考轨迹作为基音周期全局变化的量度,用于平滑基音周期,并采用分类的基音周期分析,针对信号自适应地最佳确定基音周期,解决了基音周期变化范围大的问题。AVS P10标准的算法运算复杂度和存储开销均小于AMR-WB+,而性能与AMR-WB+相当。
 
参考文献:
 
[1]GRIFFIN, DANIEL W, LIM, et al. New Pitch detection algorithm[C]//Proceedings of the International Conference on Digital Signal Processing, 1984: 395-399.
 
[2]JANER L. New pitch detection algorithm based on wavelet transform[C]//IEEE International Symposium on Signal Processing,1998: 165-168.
 
[3]楼红伟,赵建伟,胡光锐.一种小波加权的基音检测方法[J].上海交通大学学报,2003,37(3): 447-449.
 
[4]黄海,潘家强.基于Hilbert-Huang变换的基音周期提取方法[J].声学学报,2006,31(1):35-41.
 
[5]ZHAO Z D, HU X M, TIAN J F. An effective pitch detection method for speech signals with low signal-to-noise ratio[C]//IEEE International Conference on Machine Learning and Cybernetics[C]. 2008, 5: 2775-2778.
 
[6]BA H, YANG N, DEMIRKOL I, et al. BaNa: A hybrid approach for noise resilient pitch detection[C]// IEEE Statistical Signal Processing Workshop (SSP), 2012: 369-372.
 
[7]MAKINEN J, BESSETTE B, BRUHN S, et al. AMR-WB+: A new audio coding standard For 3rd generation mobile audio services[C]//IEEE International Conference on Acoustics, Speech and Signal Processing, 2005.

大云网官方微信售电那点事儿

责任编辑:叶雨田

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
分享到微博分享到微信
我要收藏
个赞
基音 开环 语音
评论
点击加载更多