【技術實現步驟摘要】
本專利技術涉及語音處理,特別涉及一種麥克風語音增強方法及裝置。
技術介紹
隨著免提通話、會議系統、智能家居和智能家電的發展,高質量的遠距離語音拾音成為影響語音采集處理系統性能的關鍵因素之一。為了適應復雜的聲音環境,單麥克風技術已經很難勝任,具有多路語音采集設備的麥克風陣列則日益成為主流,其中最常用的就是各種波束形成技術、語音增強技術等。語音增強技術需要從語音采集設備所采集的原始語音信號中提取盡可能純凈的目標語音。波束形成技術通過調整參數提高傳聲器陣列對某個方向聲音的靈敏度,提高語音增強的效果。然而現有技術中大多數語音增強技術只能處理陣元少、間距小的語音采集設備陣列所采集的原始語音,因此傳統陣列語音增強技術往往性能非常有限。
技術實現思路
針對于此,本專利技術提供一種麥克風語音增強方法及裝置。所述方法及裝置能夠處理陣元較多、間距較大的語音采集設備陣列的原始語音。基于上述目的本專利技術提供的一種麥克風語音增強方法,包括如下步驟:獲取通過多路數字語音采集設備采集輸入的第一陣列語音信號;根據所述第一陣列語音信號的最小方差自適應波束優化模型,采用第一陣列語音信號計算第一陣列語音信號所合成的最優波束輸出信號;采用所述最優波束輸出信號的功率譜估計值進行單通道語音增強處理;所述第一陣列語音信號的最小方差自適應波束優化模型包括目標聲源到所述多路數字語音采集設備的空間導向矢量。可選的,獲取通過多路數字語音 ...
【技術保護點】
一種麥克風語音增強方法,其特征在于,包括如下步驟:獲取通過多路數字語音采集設備采集輸入的第一陣列語音信號;根據所述第一陣列語音信號的最小方差自適應波束優化模型,采用第一陣列語音信號計算第一陣列語音信號所合成的最優波束輸出信號;采用所述最優波束輸出信號的功率譜估計值進行單通道語音增強處理;所述第一陣列語音信號的最小方差自適應波束優化模型包括目標聲源到所述多路數字語音采集設備的空間導向矢量。
【技術特征摘要】
1.一種麥克風語音增強方法,其特征在于,包括如下步驟:
獲取通過多路數字語音采集設備采集輸入的第一陣列語音信號;
根據所述第一陣列語音信號的最小方差自適應波束優化模型,采用第一陣
列語音信號計算第一陣列語音信號所合成的最優波束輸出信號;
采用所述最優波束輸出信號的功率譜估計值進行單通道語音增強處理;
所述第一陣列語音信號的最小方差自適應波束優化模型包括目標聲源到
所述多路數字語音采集設備的空間導向矢量。
2.根據權利要求1所述的方法,其特征在于,獲取通過多路數字語音采
集設備采集輸入的第一陣列語音信號之前,還包括:
通過多路數字語音采集設備采集原始語音陣列信號y1(n),……yN(n);
對所述原始語音信號進行短時傅里葉變換得到所述原始語音陣列信號的
時頻表示信號y1(k,λ)……yN(k,λ);
采用最優超指向波束系數A(k)=[a1(k),......,aN(k)]T對所述時頻表示信號進
行頻域最優超指向波束處理,得到第一陣列語音信號i=1……N;
所述n為離散時間變量;N為陣元個數;k為頻點編號;λ為短時幀編號。
3.根據權利要求2所述的方法,其特征在于,所述最優超指向波束系數
根據所述多路數字語音采集設備的設置方式進行設定。
4.根據權利要求1所述的方法,其特征在于,根據所述第一陣列語音信
號的最小方差自適應波束優化模型,采用第一陣列語音信號計算第一陣列語音
信號所合成的最優波束輸出信號時,采用下述公式:
y‾(k,λ)=Σi=1Nwi*ai*yi(k,λ);]]>為根據噪聲信號列矢量和最優超指向
波束系數和目標聲源到各個數字語音采集設備的空間導向矢量計算的自適應
濾波器參數;為最優超指向波束系數A(k)=[a1(k),......,aN(k)]T中陣元ai的共軛
復數;yi(k,λ)為所述第一陣列語音信號。
5.根據權利要求3所述的方法,其特征在于,所述第一陣列語音信號的
\t最小方差自適應波束優化模型為:
w(k)=argminw(k)wH(k)Rv~(k)w(k),]]>且滿足wH(k)d~(k)=1;]]>其中,w(k)中的陣元與互為共軛復數;wH(k)為w(k)的共軛轉制矩陣;
為根據所述第一陣列語音信號估計的噪聲相干矩陣;為目標聲源到
所述數字語音采集設備的空間導向矢量。
6.權利要求5所述的方法,其特征在于,所述目標聲源到數字語音采集
設備的空間導向矢量根據下述公式計算:
d~(k)=[a1*exp(jkd1cos(θ)cfs),......,aN*exp(jkdNcos(θ)cfs)]T;]]>其中,d1……dN是第1到N個數字語音采集設備到數字語音采集設備陣列
中心的距離,c是聲速;fs是采樣頻率;θ為目標聲源到數字語音采集設備的
方位角;為最優超指向波束系數A(k)=[a1(k),......,aN(k)]T中陣元ai的共軛復數。
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
對所述多個通道的陣列語音輸入信號中的噪聲信號陣列進行語音活動檢
測VAD;
根據所述語音活動檢測VAD的結果對噪聲信號陣列進行噪聲功率譜估計;
根據所述最優波束輸出信號的最優功率譜估計值和所述噪聲功率譜估計
值對所述最優波束輸出信號進行第二次增強。
8.根據權利要求7所述的方法,其特征在于,根據所述語音活動檢測VAD
的結果對噪聲信號陣列進行噪聲功率譜估計的步驟包括:
計算有語音狀態、無語音狀態、語音開始狀態、語音結束狀態時的噪聲功
率譜;
對所述有語音狀態時的噪聲功率譜和無語音狀態時的噪聲功率譜進行折
中處理,得到噪聲功率譜估計值。
9.根據權利要求8所述的方法,其特征在于,計算有語音狀態、無語音
狀態、語音開始狀態、語音結束狀態時的噪聲功率譜的步驟具體包括:
當處于無語音狀態時,采用下述公式對噪聲信號陣列功率譜估計:
φv‾(k,λ)=a1φv‾(k,λ-1)+(1-a1)φy‾(k,λ);]]>當處于語音開始狀態和有語音狀態時,采用下述公式對噪聲信號陣列功率
\t譜進行估計:
φv‾(k,λ)=min(φ^v‾1(k,λ),2θv‾(k,λ));]]>處于語音結束狀態時,采用下述公式對噪聲信號陣列功率譜進行雙極點回
歸平滑估計:
φv‾(k,λ)=a0φv‾2(k,λ-1)+(1-a0)max(φ^v‾(k,λ),θv‾(k,λ));]]>上述公式中,θv‾(k,λ)=12L1+1Σm=k-L1k+L1φv‾(k,λ);]]>φ^v‾1(k,λ)=aaφ^v‾1(k,λ-1)+(1-aa)φy‾(k,λ),ifφy‾(k,λ)≥φ^v‾1(k,λ)φ^v‾1(k,λ)=adφ^v‾1(k,λ-1)+(1-ad)φy‾(k,λ),ifφy‾(k,λ)<φ^v‾1(k,λ);]]>其中,a1為噪聲譜更新參數;aa、ad分別為平滑系數。
10.根據權利要求1所述的方法,其特征在于,所述最優波束輸出信號的
功率譜估計值采用下述公式進行計算:
φy‾(k,λ)=a0φy‾(k,λ-1)+(1-a0)|y‾(k,λ)|2;]]>其中,為所述最優波束輸出信號的功率譜估計值;為所述最
優波束輸出信號;a0為噪聲譜更新參數。
11.一種麥克風語音增強裝置,其特征在于,包括:
第一獲取模塊:用于獲取通過多路數字語音采集設備采集輸入的第一陣列
語音信號;
最優波束輸出信號計算模塊:用于根據所述第一陣列語音信號的最小方差
自適應波束優化模型,采用第一陣列語音信號計算第一陣列語音信號所合成的
最優波束輸出信號;
第一增強模塊:用于采用所述最優波束輸出信號的功率譜估計值進行單通
道語音增強處理;
所述第一...
【專利技術屬性】
技術研發人員:范泛,付中華,黎家力,
申請(專利權)人:中興通訊股份有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。