新型几何谱减语音增强方法

2020-03-27 来源：步旅网

１４４　２０１０，４６（２３）　ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇ　ａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用　新型几何谱减语音增强方法　邬鑫锋，曾以成，刘伯权　ＷＵ　Ｘｉｎ—ｆｅｎｇ，ＺＥＮＧ　Ｙｉ—ｃｈｅｎｇ。ＬＩＵ　Ｂｏ－ｑｕａｎ　湘潭大学光电工程系，湖南湘潭４１１１０５　Ｄｅｐａｒｔｍｅｎｔ　ｏｆ　Ｐｈｏｔｏｅｌｅｃｔｒｉｃ　Ｅｎｇｉｎｅｅｒｉｎｇ，Ｘｉａｎｇｔａｎ　Ｕｎｉｖｅｒｓｉｔｙ，Ｘｉａｎｇｔａｎ，Ｈｕｎａｎ　４１１１０５Ｃｈｉｎａ　，Ｅ—ｍａｉｌ：ｘｉｎｆｅｎｇｗｕ＠１　２６．ｃｏｒｎ　ＷＵ　Ｘｉｎ・ｆｅｎｇ，ＺＥＮＧ　Ｙｉ‘ｃｈｅｎｇ，ＬＩＵ　Ｂｏ—ｑｕａｎ．Ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ　ｂａｓｅｄ　ｏｎ　ｎｅｗ　ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃｔｉｏｎ　ｏｆ　ｇｅｏｍｅｔｒｉｃ　ａｐ－　ｐｒｏａｅｈ．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ａｐｐｌｉｃａｔｉｏｎｓ．２０１０。４６（２３）：１４４．１４７．　Ａｂｓｔｒａｃｔ：Ｉｎ　ｏｒｄｅｒ　ｔｏ　ｇｅｔ　ａ　ｂｅｔｔｅｒ　ｐｅｒｆｏｒｍａｎｃｅ　ｉｎ　ｐｒｏｃｅｓｓｉｎｇ　ｔｈｅ　ｓｐｅｅｃｈ　ｗｈｉｃｈ　ｃｈａｎｇｅｓ　ｒａｐｉｄｌｙ，ａｎ　ｉｍｐｒｏｖｅｄ　ｓｐｅｅｃｈ　ｅｎｈａｎｃｅ．　ｍｅｎｔ　ａｌｇｏｒｉｔｈｍ　ｂａｓｅｄ　ｏｎ　ｓｅｌｆ－ａｄａｐｔｉｖｅ　ａｖｅｒａｇｉｎｇ　ｆａｃｔｏｒ　ｍｅｔｈｏｄ　ｉｓ　ｐｒｏｐｏｓｅｄ　ｉｎ　ｔｈｉｓ　ｐａｐｅｒ．Ｓｉｍｕｌａｔｉｏｎ　ｗｉｔｈ　Ｉｔａｋｕｒａ．．Ｓａｉｔｏ　ｄｉｓ．．　ｔａｎｃｅ，ｓｐｅｅｃｈ　ｗａｖｅ　ｐｉｅｒｒｅ，ｓｐｅｃｔｒａｌ　ｐｉｃｔｕｒｅ　Ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｄｅｍｏｎｓｔｒａｔｅ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ａｌｇｏｒｉｔｍ　ｈａｓ　ｂｅｔｈｔｅｒ　ｐｅｒｆｏｒ・　ｍａｎｃｅ　ｏｆ　ｓｐｅｅｃｈ　ａｒｔｉｃｕｌａｔｉｏｎ　ｗｉｔｈｏｕｔ　ａｎｙ　ｐｅｒｃｅｐｔｉｏｎａｌ　ｍｕｓｉｃａｌｉｔｙ，ｃｏｍｐａｒｅｄ　ｔｏ　ａｎｏｔｈｅｒ　ｍｏｄｉｆｉｅｄ　ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃｔｉｏｎ　ａｌｇｏ—　ｒｉｔｈｍｓ　ｕｎｄｅｒ　ｔｈｅ　ｓａｍｅ　ｌｅｖｅｌ　ｏｆ　ｎｏｉｓｅ　ｒｅｄｕｃｔｉｏｎ，ａｎｄ　ｔｈｉｓ　ｓｕｐｅｒｉｏｒｉｔｙ　ｉｓ　ｍｏｒｅ　ｓｉｇｎｉｉｃａｎｔｆ　ａｔ　ｖｅｒｙ　ｌｏｗ　ＳＮＲ．　Ｋｅｙ　ｗｏｒｄｓ：ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ；ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃｔｉｏｎ　ｏｆ　ｇｅｏｍｅｔｒｉｃ　ａｐｐｒｏａｃｈ；Ｍｉｎｉｍｕｍ　Ｍｅａｎ　Ｓｑｕａｒｅ　Ｅｒｒｏｒ（ＭＭＳＥ）；Ｉｔａｋｕ—　ｒａ．Ｓａｉｔｏ　ｄｊｓｔａｎｃｅ　摘要：针对几何谱减算法在处理快速变化的语音时产生语音畸变的缺点。提出一种基于最小均方误差算法估计每帧语音信号　的每一个频率分量上的平滑系数，产生自适应帧频率分量平滑系数代替固定值的平滑系数来估计先验信噪比，从而得到更加接　近于真实情况的先验信噪比。通过计算板仓．斋藤距离，及利用仿真波形图、语谱图对算法进行客观测试，结果表明新算法相对　其他谱减法在相同的去噪度下，语音畸变度最小且几乎察觉不到音乐噪声；特别是在低信噪比非平稳环境下，相对其他谱减法的　优势更加显著。　关键词：语音增强；几何谱减法；最小均方误差；板仓一斋藤距离　ＤＯＩ：１０．３７７８￣．ｉｓｓｎ．１００２．８３３１．２０１０．２３．０４１　文章编号：１００２．８３３１（２０１０）２３—０１４４—０４　文献标识码：Ａ　中图分类号：ＴＮ９１２　１　引言　语音增强的目的是从带噪语音中提取尽可能纯净的原始　时，增强效果并不是很好，而且会给结果带来音乐噪声，不仅　使听觉效果受影响，还影响后续处理，如语音识别等。为克服　传统谱减法的缺陷，出现了很多改进的算法如多频带谱减法ｕ”、　自适应双谱多窗口谱减法、基于人耳掩蔽效应谱减法　等，这　些改进算法在消除音乐噪声，背景噪声和减少语音失真方面　都有一定效果，但并不理想。ＥＶＩＮ教授根据带噪语音在几何　上的关系提出了几何谱减法　，此算法能有效地去除音乐噪　声，提高信噪比，但是增强后的语音畸变度较大。针对这个缺　点，提出用自适应帧频率分量平滑系数代替几何谱减法中固　定平滑系数来估计先验信噪比，即通过估计每帧频率分量平　语音，提高语音可懂度。常用的语音增强方法，大致可分为三　类：第一类是时域方法，例如基于参数和模型的方法　。　、子空　问的方法　等；第二类是频域方法，例如减谱法　、自适应滤　波法　以及基于马尔可夫模型滤波方法　等；第三类是其他方　法，例如小波变换法、听觉掩蔽法［１０１等。谱减法具有易于实现　和运算量小等优点，一直都是语音去噪的最主要的方法。它　是通过从含噪语音功率谱中减去噪声功率谱来估计纯净语音　的功率谱。因为人耳对语音的感知是通过响应语音信号中各　频谱分量的幅度获取的，而对各分量的相位不敏感，因此，就　可认为在语音增强过程中，语音信号的相位不变，在求得最佳　纯净语音幅度值后，加上原始带噪语音分离出来的相位即可。　在传统谱减算法中，假设噪声与语音相互独立，且是零均　值的高斯分布，从而纯净语音与噪音的相关项为零。但现实　中的噪声不一定是零均值高斯分布的，也可能是非零均值、非　滑系数，得到最佳先验信噪比，进而进行几何谱减法语音增强　处理，新算法能够有效去除背景噪声，且能在去除残留“音乐　噪声”度和语音畸变度之问做出很好的折中。　２几何谱减法　传统谱减法存在两个主要缺点：条件假设不合理与产生　高斯分布的；因而传统谱减算法在处理非零均值分布的噪声　音乐噪声，几何谱减法是为克服这些缺点而提出的，通过利用　基金项日：湖南省自然科学基金（ｔｈｅ　Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ　Ｆｏｕｎｄａｔｉｏｎ　ｏｆ　Ｈｕｎａｎ　Ｐｒｏｖｉｎｃｅ　ｏｆ　Ｃｈｉｎａ　ｕｎｄｅｒ　Ｇｒａｎｔ　Ｎｏ．０８ＪＪ５０３１）。　作者简介：邬鑫锋（１９８２一），男，硕士研究生，研究方向：语音信号处理；曾以成（１９６２一），男，博士，教授，博士生导师，研究方向：信号处理；刘伯权　（１９８５一），男，硕士研究生，研究方向：语音信号处理。　收稿日期：２００９．０ｌ一１５修回日期：２００９—０３—３０　邬鑫锋，曾以成，刘伯权：新型几何谱减语音增强方法　２０１０，４６（２３）　１４５　带噪语音的几何关系得出先验信噪比估计的语音增强算法。　设　，　，ａＤ｝、｛　，０　，　。｝分别是含噪语音、纯净语音、噪音的　幅值和相位，有：　。ｒ；，，＇　，、ａ　（＾一１，ｋ）　ａ　１　一　，　１　Ｋ　Ｊ　●●　Ｊ　（１０）　其中　，（　，　）表示语音信号第＾帧第　个频率分量上的帧频率分　（１）　ｄｙｅ　：口　ｅ　＋ａＤｅ　量先验信噪比即时值，上式的即时先验信噪比仅仅利用了过　去的谱信息。　由式（７）得：　由方程（１）可作出带噪语音的几何关系图，如图１所示。　＝ｙ＋１—２√ｙＣｙＤ　【１１）　可以利用上式中　和ｙ的关系以及当前帧获得的谱信息来　图１语音的几何关系图　直角三角形ＡＢＣ中体现了含噪语音、纯净语音和噪声三　者之间的关系，其中　Ｊ＿丽。可得：　ＡＢ＝ａｙ　ｓｉｎ（Ｏｏ—Ｏｒ）＝ａ　ｓｉｎ（Ｏ，９一Ｏｘ）＝＝＞　ｄ；（１一ｃ　２　Ｊ＝口２　（１一ｃ　）　（２）　其中ｃ　ｃｏｓ（　一ＯＤ）、ｃ肋　ｃｏｓ（　一ＯＤ），从以上方程可以得到　增益函数：　＝　＝　（３）　从而司得到纯净语音功率谱的估计：　ｌ　（∞　）　ｌ＝ＨＧＡ　（ｃｏ　）Ｉ】，（∞　）Ｉ２　（４）　当纯净语音和噪声的向量是正交时（即ｃ　＝Ｏ）两者不相　关，几何谱减法的增益函数和传统谱减法的增益函数是相同　的，用传统谱减法处理即可，而当遇到其他情况时，用传统谱　减法处理就有误差，此时纯净语音和噪声的相位关系对增强　效果是有影响的，不能把它们的相关项当零处理。　图１中进一步由三角函数定理可得以下关系：　ＣｙＤ：　～—ａｙ＋　　ａｏ－－ａｘ　（５）　㈦　分子分母同除以ａ　得：　ｃ　＝　（７）　ｃＸＤ：　。～—　（８）　其中变量　、ｙ　！　，分别表示先验信噪比和后验信噪比，从　ｄＤ　８Ｄ　而可以得到用先验和后验信噪比表示的增益函数：　，（ｙ＋１一　）　（　，ｙ）＝　４ｙ　（９）　，（ｙ一１一　）　４　基于当前帧的后验信噪比ｐ（　，七）可以通过噪声谱的估计　计算　２，　２获得，而基于当前帧的先验信噪比　（　，后）则需要使　用估计的方法得到，即可利用当前和过去的谱信息，更确切的　说，可以利用增强了的前一帧幅度谱估计先验信噪比　：　求得　的估计值：　因为一１≤ＣｙＤ　１，可由式（１１）得到　的范围｛√ｙ一１）≤　（　＋１）　，用它的下限作为估计值得：　（　，Ｊｉ｝）＝（√≯（　，ｊ｝）一１）　（１２）　其中≯（　，　）表示后验概率ｙ在　帧ｋ频率分量的估计值。综合基　于前一帧和当前Ｉ　的两种估计值，就可以得到以下估计方程：　（　，　）＝口．Ｉｈ（　２－ｘ１ａ。（１，七ｋ）　ｌ　＋（１一。［）．（厕　一１）（１３）　是平滑系数，取值介于Ｏ．９５～１．０之间，一般情况下取固定　值为０．９８。ａ　，　）是噪声谱的估计值，若增强后的语音幅值　很小就会导致整个结果的衰减，从而使得语音信号出现谱失　真情况，产生畸变。因此就需要在处理过程的最后加上一个平　滑系数，用以防止处理结果的语音信号出现谱失真的情况。　３几何谱减法的改进　为了准确估计出带噪语音信号的先验信噪比，公式（１３）　的估计方法计算当前帧的先验信噪比　（　，　）对于如何合适地　选取参数ａ又是十分关键的问题。平滑系数ａ的取值对去噪度　和语音畸变度影响很大。例如，在估计　（　，　）时平滑系数ａ是　在跟踪语音变化的准确度和　（　，　）的平滑度之间权衡，即在语　音畸变度和残留音乐噪声度之间折中；　（　，七）的标准方差　（　（　，．｝ｉ）的平滑度影响音乐噪声的大小）随　一１增大而增大，即　随着ｎ的增大，　（＾，　）越不平滑，带噪语音的变化程度称为“平　稳度”，平滑系数依据“平稳度”自适应变化。因此，选取一个　可靠的平稳度参数是至关重要的。其平滑系数是根据实验取　自固定的经验值。然而，实验表明先验信噪比估计中平滑系　数ａ较小时，语音畸变和噪声残留都较少，但残留的音乐噪声　显著；反之，ａ大时，语音畸变和噪声残留较多，但残留的音乐　噪声较少。所以，对于纯噪声帧和带噪语音帧的平滑系数取　值应该是不一样的，较好的解决办法是随语音出现的状态而　时变，带噪语音帧中平滑系数取较小值，纯噪声帧中平滑系数　取较大值。至于平滑系数时变的依据，可根据均方最小误差　算法估计最佳平滑系数。　在这里采用基于均方最小误差的估计方法估算各帧各个　频率分量上的平滑系数ａ　，以期得到每帧内各频率分量上的　先验信噪比估计值　，　），从而达到在去噪度、残留“音乐噪　声”和语音畸变度之间取得很好的均衡。由公式（１３）得出先　验信噪比的修正方程：　（　，　）＝６ｃ　・　，　　Ｉ（１一ａ　，　）・（√　一１）（１４）　其中前一帧各频率分量的先验信噪比为：　（　一１，七）＝ｌ￣ｈｘ（２　－１，ｋ西。（一１，．ｊ｝））＿１　（１５）　采用均方最小误差方法来估计第　帧第七个频率分量的平　１４６　２０１０，４６（２３）　ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇ　ａｎｄＡｐｐｌｉｃａｔｉｏｎｓ计算机工程与应用　映语音变化情况，在语音变化较为平缓的帧中（纯噪声帧），平　滑系数ｎ　的取值就接近于１；而在语音变化非常剧烈的帧中　（１６）　（带噪语音帧），平滑系数　估计值会变得比较小，以使得估　滑系数。ｃ　。　由均方最小误差，　＝Ｅ｛［　（五，　）一　（　，　）】　／４（ｚ－１，￣））　一将公式（１４）、（１５）代入公式（１６）可以推出　＝ａ　，　计的先验信噪比能够快速适应语音的变化。　４　３　３　２　ｌ，　）一　（　，　）】　＋１一ａ　）。　，　）＋１］　（１７）　１　４实验结果与分析　咖　然后令　ｌｏｓ　为零，就可算出基于均方最小误差估计的每　帧各频率分量上ａ　的最优解：　纯净语音取自标准语音库的一段男声：“１至１Ｏ”１０个阿拉　伯数字的标准汉语发音。噪声取自ＮｏｉｓｅＸ９２的白噪音、工厂　　（ｌ　，　１＋　ｌ１　ｌ　可用　（　，　）＝（　口　的最优估计值。　（Ｉ８）　噪声和Ｂａｂｂｌｅ噪声。将它们合成信噪比为．１０～５　ｄＢ的带噪语　音，经过１６　ｋＨｚ采样，５１２点分帧，帧移２５６点。分别采用传统　谱减、几何谱减及本文改进的几何谱减法进行增强实验。　图２所示分别是受０　ｄＢ　Ｂａｂｂｌｅ噪声污染的语音及经过三　种不同的方法处理后的波形图，从图中可以清晰地看出，经过　由于　（　，　）是未知量，故直接通过以上公式是无法求出　ａ　的，但又有以下近似的关系：　（　，　）｝　４（２，ｘ）。于是就　一１）　替代　（　，　），并代入公式（１８）求出　大为减少。虽然去噪效果没几何谱减法强，但是原始语音得　到了很好的恢复。图３所示是受０　ｄＢ白噪声污染的语音及经　过三种不同的方法处理后的语谱图，从语谱图中看出，处理后　本文方法处理后，语音含有的噪声量相比传统谱减法增强后　可见，利用均方最小误差估计平滑系数ａ　能较真实地反　４　３　３　２　ｌ●　【』　．。　ｉ　．　＾．　１．　．　－　．＿　．　。　姗咖　”　－　”　’■ｒ。　Ｐ＇　＿　’　Ｉ　ｒ　：　（ａ）Ｏ　ｄＢ含噪语音（Ｂａｂｂｌｅ噪音）　（ｂ）传统谱减法增强处理　：　ｌ　山　－．　．．　　ｊＬ　：－　１　ｒ　一一　：　１　ｒ　－＿　＿一　２　３　４　５　６　）　１　（ｃ）几何谱减增强处理　图２波形图实验　（ｄ）本文的方法增强处理　０．０８　０．１０　０．１２　０．１４　０．１６　０　１８　０．２Ｏ　０．２２　（ａ）０　ｄＢ含噪语音（白噪声）　（ｂ）传统谱减法增强处理　（ｃ）几何谱减增强处理　图３语谱图实验　（ｄ）本文的方法增强处理　邬鑫锋，曾以成，刘伯权：新型几何谱减语音增强方法　的语音中残存的白噪声量也减少了，图３（ｄ）中的语谱比前两　２０１０，４６（２３）　１４７　参考文献：　［Ｉ］Ｇａｎｎｏｔ　Ｓ，Ｂｕｒｓｈｔｅｉｎ　Ｄ，Ｗｅｉｎｓｔｅｉｎ　Ｅ．Ｉｔｅｒａｔｉｖｅ　ａｎｄ　ｓｅｑｕｅｎｔｉａｌ　Ｋａｌ－　ｍａｎ　ｆｉｌｔｅｒ－ｂａｓｅｄ　ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ　ａｌｇｏｒｉｔｈｍｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓ　Ｓｐｅｅｃｈ　ａｎｄ　Ａｕｄｉｏ　Ｐｒｏｃｅｓｉｎｇ，１９９８，６（４）：３７３－３８５．　［２】Ｋｉｎ　Ｊ　Ｂ，Ｌｅｅ　Ｋ　Ｙ，Ｌｅｅ　Ｃ　Ｗ．Ｏｎ　ｔｈｅ　ａｐｐｌｉｃａｔｉｏｎｓ　ｏｆ　ｔｈｅ　ｉｎｔｅｒａｃｔ－　ｉｎｇ　ｍｕｌｔｉｐｌｅ　ｍｏｄｅｌ　ａｌｇｏｒｉｔｈｍ　ｆｏｒ　ｅｎｈａｎｃｉｎｇ　ｎｏｉｓｙ　ｓｐｅｅｃｈ［Ｊ］．　ＩＥＥＥ　Ｔｒａｎｓ　Ｓｐｅｅｃｈ　ａｎｄ　Ａｕｄｉｏ　Ｐｒｏｃｅｓｓ，２０００，８（３）：３４９—３５２．　【３］Ｅｐｈｒａｉｍ　Ｙ，Ｔｒｅｅｓ　Ｈ　Ｌ　ＶＡ　ｓｉｇｎａｌ　ｓｕｂｓｐａｃｅ　ａｐｐｒｏａｃｈ　ｆｏｒ　ｓｐｅｅｃｈ　种方法处理得到的语谱更清晰，特别是发“１０”的语音得到很　好的恢复。　板仓．斋藤（Ｉｔａｋｕｒａ．Ｓａｉｔｏ（ＩＳ））距离可以作为衡量增强处　理后语音的畸变程度的指标。受不同信噪比工厂环境噪声污　染的语音在三种不同增强方法处理后与原始语音的板仓距离　如图４所示，很明显，在非平稳环境下，基于本文的语音增强算　法，有效地降低了板仓距离，语音最为逼近原始语音，即语音　畸变度最小。　ｅｎｈａｎｃｅｍｅｎｔ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓ　Ｓｐｅｅｃｈ　ａｎｄ　Ａｕｄｉｏ　Ｐｒｏｃｅｓｓｉｎｇ，１９９５，　３（７）：２５１－２６６．　［４］Ｊａｂｌｏｕｎ　Ｆ，Ｃｈａｍｐａｇｎｅ　Ｂ．Ａ　ｍｕｌｔｉ—ｍｉｃｒｏｐｈｏｎｅ　ｓｉｇｎａｌ　ｓｕｂｓｐａｃｅ，ｄｐ—　ｐｒｏａｃｈ　ｆｏｒ　ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ［Ｃ］／／Ｐｒｏｃ　ＩＥＥＥ　ＩＣＡＳＳＰ，２００１，９　（１）：２０５—２０８．　［５］Ｂｏｌｌ　ｓ．Ｓｕｐｐｒｅｓｓｉｏｎ　ｏｆ　ａｃｏｕｓｔｉｃ　ｎｏｉｓｅ　ｉｎ　ｓｐｅｅｃｈ　ｕｓｉｎｇ　ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃｔｉｏｎ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓ　ｏｎ　Ａｃｏｕｓｔｉｃ　Ｓｐｅｅｃｈ　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏ－　ｃｅｓｓｉｎｇ，１９７９．２７（２）：１１３—１２Ｏ．　［６］Ｆａｎ　Ｎｉｎｇｐｉｎｇ．Ｌｏｗ　ｄｉｓｔｏｒｔｉｏｎ　ｓｐｅｅｃｈ　ｄｅｎｏｉｓｉｎｇ　ｕｓｉｎｇ　ａｎ　ａｄａｐｔｉｖｅ　ｐａｒａｍｅｔｒｉｃ　Ｗｉｅｎｅｒ　ｆｉｌｔｅｒ［Ｃ］／／ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），２００４，５（１）：　１７　２１　［７］Ｅｐｈｒａｉｍ　Ｙ，Ｍａｌａｈ　Ｄ．Ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ　ｕｓｉｎｇ　ａ　ｍｉｎｉｍｕｍ　ｍｅａｎ　输入信噪比／ｄＢ　ｓｑｕａｒｅ　ｅｒｒｏｒ　ｓｈｏｒｔ　ｔｉｍｅ　ｓｐｅｃｔｒａｌ　ａｍｐｌｉｔｕｄｅ　ｅｓｔｉｍａｔｏｒ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ａｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ，１　９８４，　图４不同输入信噪比下语音增强处理后的Ｉ．ｓ距离　３２（６０）：１１０９—１１２１．　主观听觉实验中，本文方法和几何谱减法都感觉不到残　留“音乐噪声”和背景噪声，而本文的方法语音畸变度最小，耳　听舒适，在有效去除噪声的同时，在残留“音乐噪声”度和语音　畸变度之间能找到很好的折中。运算量上，本文方法相对几　何谱减法就多了一步均方最小误差计算，运算量增加不多。　５总结　在考虑基于几何谱减增强算法的基础上，自适应地调整　先验信噪比估计中的平滑系数，提出了在几何模型下的谱减　［８］高鹰，谢胜利．一种变步长ＬＭＳ自适应滤波算法及分析［Ｊ］电子学　报，２００１，２９（８）：１０９４—１０９７　［９］Ｊａｘ　Ｐ，Ｖａｒｙ　ＥＡｒｔｉｆｉｃｉａｌ　ｂａｎｄｗｉｄｔｈ　ｅｘｔｅｎｓｉｏｎ　ｏｆ　ｓｐｅｅｃｈ　ｓｉｎａｌｇｓ　ｕｓｉｎｇ　ＭＭＳＥ　ｅｓｔｉｍａｔｉｏｎ　ｂａｓｅｄ　ｏｎ　ａ　ｈｉｄｄｅｎ　Ｍａｒｋｏｖ　ｍｏｄｅｌ［Ｃ］／／ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄ　Ｓｉｎａｌｇ　Ｐｒｏ－　ｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），２００３，８（１）：６８０—６８３．　［１０］Ｖｉｒａｇ　Ｎ．Ｓｉｇｎａｌ　ｃｈａｎｎｅｌ　ｓｐｅｅｃｈ　ｅｎｈａｎｃｅｍｅｎｔ　ｂａｓｅｄ　ｏｎ　ｍａｓｋｉｎｇ　ｐｒｏｐｅｒｔｉｅｓ　ｏｆ　ｔｈｅ　ｈｕｍａｎ　ａｕｄｉｔｏｒｙ　ｓｙｓｔｅｍ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｓｐｅｅｃｈ　ａｎｄ　Ａｕｄｉｏ　Ｐｒｏｃｅｓｓｉｎｇ，１９９９，７（２）：１２６－１３７．　［１　１］Ｋａｍａｔｈ　Ｓ，Ｌｏｉｚｏｕ　Ｐ．Ａ　ｍｕｌｔｉ—ｂａｎｄ　ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃｔｉｏｎ　ｍｅｔｈｏｄ　算法的一种修正形式。实验表明，本文的白适应几何谱减算　法优于传统的几何谱减算法，能在有效去除噪声的同时，在残　ｏｒ　ｅｆｎｈａｎｃｉｎｇ　ｓｐｅｅｃｈ　ｃｏｒｒｕｐｔｅｄ　ｂｙ　ｃｏｌｏｒｅｄ　ｎｏｉｓｅ［Ｃ］／／ＩＥＥＥ　Ｔｒａｎｓ　Ａｃｏｕｓｔ，Ｓｐｅｅｃｈ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓ，２００２，８（４）：１６４－１６８．　留“音乐噪声”度和语音畸变度之间做出很好的平衡，这是因　为该算法能实时地自适应地跟踪语音的变化，从而使得几何　谱减法中的先验信噪比估计更符合假设的语音模型和人耳听　觉特性　［１２］Ｐｕ　Ｆ　Ｌ，Ｗａｎｇ　Ｗ　Ｍ，Ｄａｉ　Ｑ　Ｊ，ｅｔ　ａ１．Ｏｐｔｉｍｉｚｉｎｇ　ｓｐｅｅｃｈ　ｅｎｈａｎｃｅ－　ｍｅｎｔ　ｂａｓｅｄ　ｏｎ　ｎｏｉｓｅ　ｍａｒｋｅｄ　ｐｒｏｂａｂｉｌｉｔｙ［Ｊ］．Ｊｏｕｒｎａｌ　ｏｆ　Ｅｌｅｃｔｒｏｎ－　ｉｃｓ＆Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ，２００５，２７（５）：７５３—７５６．　［１　３］Ｌｕ　Ｙａｎｇ，Ｌｏｉｚｏｕ　Ｐ　Ｃ．Ａ　ｇｅｏｍｅｔｒｉｃ　ａｐｐｒｏａｃｈ　ｔＯ　ｓｐｅｃｔｒａｌ　ｓｕｂｔｒａｃ－　ｔｉｏｎ［Ｊ］．Ｓｐｅｅｃｈ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ，２００８，７（５０）：４５３—４６６．　（上接１４３页）　［３］熊忠阳，李智星，张玉芳，等．基于正交分解的文本分类模型［Ｊ］．计　算机工程，２００９，３５（１４）：２２７．２２９．　的运算转化为类别数的运算。改进后类中心分类法对高特征　维，大量文档分类是有效的。　［４］宋卫东衔几何［Ｍ］．北京：高等教育出版社，２００３：６９—１０７．　［５］刘丽珍．本分类中的特征选取［Ｊ］ｌ计算机工程，２００４（４）．　［６】刘健，张维明．基于互信息的文本特征选择方法研究于改进［Ｊ１．计　算机工程与应用，２００８，４４（１０）：１３５．１３７．　【７】吴春颖，王士同，蔡崇超．一种基于新词发现．Ｗｅｂ文本表示方法［Ｊ１　ｌ计算机应用，２００８（３）．　参考文献：　［１］焦玉英，宋晓晴．基于ＶＳＭ的文档信息检索改进［Ｊ］．情报理论与实　践，２００７，３０（１）：９７．１０４．　［２］陈治纲．于向量空间模型的文本分类系统研究与实现［Ｄ］．天津：天　津大学，２００５．　［８］罗杰，陈力，夏德麟，等．基于新的关键词提取方法的快速文本分类　系统［Ｊ］．计算机应用研究，２００６（４）：３２．３４．　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

新型几何谱减语音增强方法