The invention provides a nonlinear adaptive improved speech endpoint detection method, the method includes first through the microphone array collect signals and by time delay estimation and time delay compensation input signal synchronization, after the input signal is extended to high dimension function through Legendre nonlinear filter, then through the echo cancellation NLMS algorithm for noise reduction, the echo cancellation is segmented on the iteration step in NLMS algorithm, and then through the spectral subtraction speech enhancement, finally can entropy to detect the speech endpoint, compared with traditional method, this method improves the adaptability of the overall system can be well adapted to speech dialogue in different environment, at the same time improve the speech endpoint detection rate and stability.
【技術實現步驟摘要】
一種改進的非線性自適應語音端點檢測方法
本專利技術屬于電子、通訊、與信息工程領域,尤其涉及陣列信號處理、自適應濾波、語音信號識別與檢測鄰域,具體的是一種改進的非線性自適應語音端點檢測方法。
技術介紹
語音是人類相互交流和通信最便捷和高效的方式,如何有效地實現語音信號傳輸、存儲或與機器進行語音人機交互,是語音信號處理領域中的重要研究課題。語音信號端點檢測是語音分析、語音合成、語音編碼等語音信號處理方式的重要環節。在語音信號檢測過程中總會伴有背景噪音,如果信噪比較低,常用的語音端點檢測方式在語音信號端點檢測時識別率會降低。麥克風陣列自適應濾波與語音端點檢測相結合的方式能改善檢測效果,該檢測方式能夠提高語音端點檢測端輸入信號信噪比,從而提高語音端點識別率。而這種語音端點檢測方法使用的一般是線性自適應濾波,要實現高信噪比,濾波算法本身需要較高的樣本維度,才能更好地逼近理想值,但是由于實驗本身實現的成本和難度,很多都是止步在理論階段。為克服上述局限性,本專利技術實現了一種麥克風陣列非線性自適應濾波語音信號端點檢測方法。該專利技術方法在達到同樣的去噪效果的情況下使用的麥克風數量要少得多,檢測的正確率也得到大幅度提高。在麥克風陣列技術基礎上引入自適應濾波可靈活地控制波束方向,實時跟蹤目標語音信號。自適應濾波只需要很少的或根本不需要任何關于信號和噪聲統計特性的先驗知識,僅根據觀測信息就能實時估計信號和噪聲的統計特性。在自適應濾波算法中,最小均方算法(LMS)收斂速度慢于遞歸最小二乘法(RLS),但該算法簡單,便于實時實現。本專利技術使用歸一化最小均方算法(NLMS),不僅 ...
【技術保護點】
一種改進的非線性自適應語音端點檢測方法,其特征在于,所述方法包括首先通過麥克風陣收集收集信號以及通過時延估計和時延補償使輸入信號同步,之后通過Legendre非線性濾波器把輸入信號拓展為高維度函數,再通過回聲消除NLMS算法進行降噪處理,所述回聲消除NLMS算法中對迭代步長進行分段處理,再通過譜減法進行語音增強,最后通過能熵對語音端點檢測。
【技術特征摘要】
1.一種改進的非線性自適應語音端點檢測方法,其特征在于,所述方法包括首先通過麥克風陣收集收集信號以及通過時延估計和時延補償使輸入信號同步,之后通過Legendre非線性濾波器把輸入信號拓展為高維度函數,再通過回聲消除NLMS算法進行降噪處理,所述回聲消除NLMS算法中對迭代步長進行分段處理,再通過譜減法進行語音增強,最后通過能熵對語音端點檢測。2.根據權利要求1所述的改進的非線性自適應語音端點檢測方法,其特征在于,具體步驟如下:步驟一,對麥克風陣列接收到的帶噪語音信號X(n)=A(q)S(n)+N(n)進行時延估計和時延補償,使各個麥克風通道中的信號在時間上是一致的,對齊后的帶噪語音信號X(n)=[x1(n),x2(n)…xd(n)]T,其中,θ為目標信號的來波方向,A(θ)為目標信號的陣列流型,S(n)為目標語音信號,N(n)為方向性干擾噪聲或是隨機噪聲;步驟二,把輸入信號通過反正切激活函數tanh(·),使同步后的信號映射為(0,1)范圍內的單值函數,這樣能滿足Legendre非線性濾波器的收斂條件,通過此函數之后的信號為Z(n)=[z1(n),z2(n)…zd(n)]T=[tanh(x1(n)),tanh(x2(n))…tanh(xd(n))]T;步驟三,利用Legendre非線性濾波器對信號Z(n)進行擴展,輸入信號向量Z(n)經Legendre非線性濾波器非線性擴展為XM(n)=[L0(z1(n)),L0(z2(n))…L0(zd(n))…Li(z1(n)),Li(z2(n))…LM(z1(n))…LM(zd(n))]TLi(x)為第i階Legendre非線性濾波器;由于L0(x)=1,所有的0階擴展可合并為一個輸入量如下式XM(n)=[1…Li(z1(n)),Li(z2(n))…LM(z1(n))…LM(zd(n))]T濾波器輸出為式中權值矢量定義為B(n)=[b0(n),b11(n)…b1d(n),…bM1(n),…bMd(n)]Tbij(n)對應的是Legendre非線性濾波器Li(zj(n))的權值,i=1,2,…M,j=1,2,…d;步驟四,采用回聲消除NLMS算法對自適應濾波器權值進行更新,該算法中對迭代步長進行分段處理;式中mc是...
【專利技術屬性】
技術研發人員:趙益波,蔣祎,靳煒,徐進,
申請(專利權)人:南京信息工程大學,
類型:發明
國別省市:江蘇,32
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。