Aiming at the problem of speech distance and background noise acquisition, imaging to determine the target speaker with a video camera, microphone array, so as to solve the simple use of camera, pointing to the existence of high target speaker microphone or microphone array is difficult to determine, mechanical rotary device, the invention provides a voice acquisition device with surveillance cameras and microphones array beam forming technology of ultrasonic combined to determine the target speaker localization, so as to improve the acquisition performance under ambient noise conditions of outdoor long distance speech enhancement.
【技術實現步驟摘要】
一種聲像聯合定位的遠距離語音采集裝置
本專利技術涉及一種語音采集裝置,尤其是涉及一種聲像聯合定位的遠距離語音采集裝置。
技術介紹
在安保、安防等領域,各類視頻監控系統已經得到廣泛應用。依托各類視頻監控系統,可以對遠距離視頻中相關人員進行確認、甄別。在利用視頻監控系統進行遠距離嫌疑人確認、甄別時如能通過遠距離語音采集利用語言、對話信息,將可大大影響了工作效率。但在實際環境背景噪聲條件下進行遠距離語音采集仍具有極高難度。由于環境噪聲的存在,遠距離語音采集時必須利用采集裝置的高指向性來保證采集的遠距離語音質量。目前的遠距離語音采集裝置主要采用干涉管結構的槍式麥克風形成高指向性。如中國專利ZL2010101269089公開一種拾音裝置,其包括:容置體、第一壓電元件、第二壓電元件及電路單元,該容置體具有拾音口,該第壓電元件設置于容置體內,以感測高頻聲波的振動而轉換輸出信號,該第二壓電元件設置于容置體內,以感測低頻聲波的振動而轉換輸出信號,該電路單元電連接于第一壓電元件及第二壓電元件,以接收第一壓電元件及第二壓電元件的信號,并進行處理產生聲音信號;因此,具有較好的感測靈敏度及較寬廣的音頻,可提升音質。中國專利ZL2010591158.2公開了一種視頻定位的長距離拾音裝置,通過在以攝像機為中心的圓周安裝2個內置指向麥克風的聲聚焦結構桶體形成高指向性,結合桶體側壁外安裝2個拾取環境噪聲的全向麥克風獲取參考噪聲,聲聚焦結構桶體隨攝像頭轉動,操作人員根據視頻圖像內容進行視頻定位后該裝置只獲取與攝像頭同方向的語音信號,并利用數字信號處理器進行自適應降噪處理。但由于上述形成高指向 ...
【技術保護點】
一種聲像聯合定位的遠距離語音采集裝置,其特征在于:包括以下模塊,監控攝像頭:用于采集遠距離視頻圖像;麥克風陣列:用于語音信號多通道采集、前置處理和模數轉換;波束掃描模塊,其輸入端連接麥克風陣列輸出端:用于進行波束掃描,獲取遠距離語音和噪聲的方向分布信息;聲像聯合處理模塊,其輸入端分別連接監控攝像頭與波束掃描模塊的輸出端:用于將監控攝像頭傳輸的圖像信息、波束掃描模塊獲取的語音和噪聲方向信息經坐標轉換后送入設有的聲像聯合監控顯示屏進行聲像聯合定位顯示;聲像聯合監控顯示屏,其輸入端連接聲像聯合處理模塊輸出端:用于接收聲像聯合成像處理模塊送來的聲像聯合信息并進行屏幕顯示;目標選定模塊:用于監控操作人員根據聲像聯合監控顯示屏上的圖像、聲音聯合信息選定目標說話人;波束對準模塊,其輸入端分別連接目標選定模塊與麥克風陣列的輸出端:根據目標選定模塊選定的目標說話人對于方向進行麥克風陣列波束對準;語音采集模塊,其輸入端連接波束對準模塊的輸出端:對波束對準模塊的語音信息進行采集。
【技術特征摘要】
1.一種聲像聯合定位的遠距離語音采集裝置,其特征在于:包括以下模塊,監控攝像頭:用于采集遠距離視頻圖像;麥克風陣列:用于語音信號多通道采集、前置處理和模數轉換;波束掃描模塊,其輸入端連接麥克風陣列輸出端:用于進行波束掃描,獲取遠距離語音和噪聲的方向分布信息;聲像聯合處理模塊,其輸入端分別連接監控攝像頭與波束掃描模塊的輸出端:用于將監控攝像頭傳輸的圖像信息、波束掃描模塊獲取的語音和噪聲方向信息經坐標轉換后送入設有的聲像聯合監控顯示屏進行聲像聯合定位顯示;聲像聯合監控顯示屏,其輸入端連接聲像聯合處理模塊輸出端:用于接收聲像聯合成像處理模塊送來的聲像聯合信息并進行屏幕顯示;目標選定模塊:用于監控操作人員根據聲像聯合監控顯示屏上的圖像、聲音聯合信息選定目標說話人;波束對準模塊,其輸入端分別連接目標選定模塊與麥克風陣列的輸出端:根據目標選定模塊選定的目標說話人對于方向進行麥克風陣列波束對準;語音采集模塊,其輸入端連接波束對準模塊的輸出端:對波束對準模塊的語音信息進行采集。2.根據權利要求1所述的一種聲像聯合定位的遠距離語音采集裝置,其特征在于:所述麥克風陣列包括增強模塊,所述麥克風陣列各通道語音信號輸出端經增強模塊分別連接波束掃描模塊與波束對準模塊,所述增強模塊用于增強麥克風陣列的語音信息。3.根據權利...
【專利技術屬性】
技術研發人員:朱沄杰,徐偉明,何颋,黃松岳,
申請(專利權)人:寧波桑德納電子科技有限公司,
類型:發明
國別省市:浙江,33
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。