【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及一種聲音信號(hào)處理技術(shù),尤其是,還涉及一種收音處理方法及聲音信號(hào)處理裝置。
技術(shù)介紹
1、為了讓行動(dòng)裝置有較好的錄音和通話質(zhì)量,提供許多降低噪音的信號(hào)處理應(yīng)用,其中波束成形(beamforming)算法是最為普及信號(hào)處理技術(shù)。市面上的波束成形技術(shù)可以消除環(huán)境周遭的噪聲,并只保留行動(dòng)裝置正前方的聲音信號(hào)。
2、然而,當(dāng)有干擾信號(hào)與用戶都在行動(dòng)裝置的正前方時(shí),目前的波束成形算法無法分清楚哪個(gè)聲音需要保留,并使得干擾信號(hào)影響使用者的聲音信號(hào)。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)是針對(duì)一種收音處理方法及聲音信號(hào)處理裝置,可區(qū)分聲音來源,并保留目標(biāo)來源的聲音信號(hào)。
2、根據(jù)本專利技術(shù)的實(shí)施例,收音處理方法包括(但不僅限于)下列步驟:通過麥克風(fēng)陣列接收多個(gè)輸入聲音信號(hào),其中麥克風(fēng)陣列包括分別接收那些輸入聲音信號(hào)的多個(gè)麥克風(fēng);基于波束成形(beamforming)將那些輸入聲音信號(hào)組合成主要聲音信號(hào),其中波束成形用于將麥克風(fēng)陣列形成對(duì)應(yīng)于多個(gè)聲音來源中的第一來源的輻射場型(pattern),且麥克風(fēng)陣列中的第一麥克風(fēng)相較于其他麥克風(fēng)還接近第一來源;分別自那些輸入聲音信號(hào)萃取出屬于主要聲音信號(hào)的多個(gè)初次萃取信號(hào),其中事先訓(xùn)練那些輸入聲音信號(hào)分別與主要聲音信號(hào)之間的多個(gè)第一聲音特征關(guān)聯(lián),且第一聲音特征關(guān)聯(lián)用于萃取屬于主要聲音信號(hào)的部分;通過盲信號(hào)分離(blind?signal?separation,bss)自那些初次萃取信號(hào)分離出那些聲音來源對(duì)應(yīng)的多個(gè)估測聲源信號(hào);分別
3、根據(jù)本專利技術(shù)的實(shí)施例,聲音信號(hào)處理裝置包括麥克風(fēng)陣列、存儲(chǔ)器及處理器。麥克風(fēng)陣列包括分別接收多個(gè)輸入聲音信號(hào)的多個(gè)麥克風(fēng)。存儲(chǔ)器用以存儲(chǔ)程序代碼。處理器耦接麥克風(fēng)陣列及存儲(chǔ)器。處理器用以加載程序代碼以執(zhí)行:基于波束成形將那些輸入聲音信號(hào)組合成主要聲音信號(hào),其中波束成形用于將麥克風(fēng)陣列形成對(duì)應(yīng)于多個(gè)聲音來源中的第一來源的輻射場型,且麥克風(fēng)陣列中的第一麥克風(fēng)相較于其他麥克風(fēng)還接近第一來源;分別自那些輸入聲音信號(hào)萃取出屬于主要聲音信號(hào)的多個(gè)初次萃取信號(hào),其中事先訓(xùn)練那些輸入聲音信號(hào)分別與主要聲音信號(hào)之間的多個(gè)第一聲音特征關(guān)聯(lián),且第一聲音特征關(guān)聯(lián)用于萃取屬于主要聲音信號(hào)的部分;通過盲信號(hào)分離自那些初次萃取信號(hào)分離出那些聲音來源對(duì)應(yīng)的多個(gè)估測聲源信號(hào);分別自那些初次萃取信號(hào)萃取出屬于那些估測聲源信號(hào)的多個(gè)再次萃取信號(hào),其中事先訓(xùn)練那些初次萃取信號(hào)分別與那些估測聲源信號(hào)之間的多個(gè)第二聲音特征關(guān)聯(lián),且那些第二聲音特征關(guān)聯(lián)分別用于萃取屬于那些估測聲源信號(hào)的部分;根據(jù)功率比值確定第一來源相對(duì)于麥克風(fēng)陣列的距離,其中功率比值為第一值與第二值的比值,第一值為對(duì)應(yīng)于第一來源及對(duì)應(yīng)于麥克風(fēng)陣列中不為第一麥克風(fēng)的其他麥克風(fēng)的那些再次萃取信號(hào)的功率的總和,第二值為對(duì)應(yīng)于第一來源及對(duì)應(yīng)于第一麥克風(fēng)的一再次萃取信號(hào)的功率,功率比值越小則第一來源相對(duì)于麥克風(fēng)陣列的距離越近,且功率比值越大則第一來源相對(duì)于麥克風(fēng)陣列的距離越遠(yuǎn);以及根據(jù)距離限制確定對(duì)應(yīng)于第一來源的估測聲源信號(hào),其中第一來源相對(duì)于麥克風(fēng)陣列的距離在距離限制內(nèi)。
4、基于上述,本專利技術(shù)實(shí)施例的收音處理方法及聲音信號(hào)處理裝置可通過波束成形、聲音萃取及盲信號(hào)分離區(qū)別聲源信號(hào),確定聲源信號(hào)對(duì)應(yīng)來源的相對(duì)距離,并據(jù)以確定特定來源的聲源信號(hào)。由此,可去除輻射場型涵蓋內(nèi)的其他使用者的聲音信號(hào),從而提升錄音和通話質(zhì)量。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種收音處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的收音處理方法,其中根據(jù)所述功率比值確定所述第一來源相對(duì)于所述麥克風(fēng)陣列的距離的步驟包括:
3.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
4.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
5.根據(jù)權(quán)利要求4所述的收音處理方法,其中所述機(jī)器學(xué)習(xí)算法為反向傳播的多層感知器,且訓(xùn)練所述第一聲音特征關(guān)聯(lián)的步驟包括:
6.一種聲音信號(hào)處理裝置,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的聲音信號(hào)處理裝置,其中所述處理器還經(jīng)配置用以:
8.根據(jù)權(quán)利要求6所述的聲音信號(hào)處理裝置,其中所述處理器還經(jīng)配置用以:
9.根據(jù)權(quán)利要求6所述的聲音信號(hào)處理裝置,其中所述處理器還經(jīng)配置用以:
10.根據(jù)權(quán)利要求9所述的聲音信號(hào)處理裝置,其中所述機(jī)器學(xué)習(xí)算法為反向傳播的多層感知器,且所述處理器還經(jīng)配置用以:
【技術(shù)特征摘要】
1.一種收音處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的收音處理方法,其中根據(jù)所述功率比值確定所述第一來源相對(duì)于所述麥克風(fēng)陣列的距離的步驟包括:
3.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
4.根據(jù)權(quán)利要求1所述的收音處理方法,還包括:
5.根據(jù)權(quán)利要求4所述的收音處理方法,其中所述機(jī)器學(xué)習(xí)算法為反向傳播的多層感知器,且訓(xùn)練所述第一聲音特征關(guān)聯(lián)的步驟包括:
<...【專利技術(shù)屬性】
技術(shù)研發(fā)人員:杜博仁,張嘉仁,曾凱盟,
申請(qǐng)(專利權(quán))人:宏碁股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。