• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種判斷說話人數目的方法及系統技術方案

    技術編號:12531036 閱讀:129 留言:0更新日期:2015-12-18 02:33
    本發明專利技術公開了一種判斷說話人數目的方法及系統,包括:接收語音信號;提取所述語音信號的語音信號特征;根據所述語音信號的語音信號特征對所述語音信號進行分割,得到分割信號段;將所述分割信號段聚類成指定個數的語音信號類;根據所述語音信號類中各分割信號段的語音信號特征對所述語音信號進行重分割;計算過程:根據重分割后語音信號類中各分割信號段的語音信號特征計算并比較不同語音信號類之間的相似度;計算過程結束后,根據計算結果確定說話人數目。本發明專利技術由于對語音信號進行重分割,可以消除現有技術中對語音信號進行分割時的步長限制的影響,并通過計算比較不同語音信號類之間的相似度,提高后續說話人數目判斷的準確度。

    【技術實現步驟摘要】

    本專利技術涉及語音信號處理領域,具體涉及一種判斷說話人數目的方法及系統
    技術介紹
    隨著語音信號處理技術的不斷發展,語音信號處理的對象由原來僅包括單說話人 場景,逐步開始包括雙說話人場景,例如電話記錄;甚至多說話人場景,例如會議記錄;此 外,目前的語音信號處理的數據由原來的時長為幾秒,幾十秒的短時音頻逐步擴展到幾十 分鐘,甚至幾小時的長時音頻。對于雙說話人場景或多說話人場景,尤其是長時音頻,語音 記錄的識別效果跟說話人分離的效果密切相關,而準確的判斷說話人數目,能夠幫助分析 語音記錄的場景,優化說話人分離的效果,從而制定相應的策略提升識別的效果,例如,針 對某個說話人的自適應識別策略。 現有的說話人數目判斷多是基于說話人變化點檢測,對語音信號進行分割,以達 到對說話人進行分割,再對分割后的各段語音信號基于貝葉斯信息準則進行聚類,最終確 定說話人數目。現有技術中判斷說話人數目結果的準確性完全依賴于說話人分割和聚類的 準確性,而說話人分割受到步長的影響,步長多是根據經驗確定,所以難免出現設定的步長 不合適的情況,從而影響說話人分割的準確性及后續聚類的準確性;此外,在聚類時貝葉斯 距離受語音時長的影響,主要表現為一般情況下語音時長越長其貝葉斯距離越大,因而在 對不同時長的語音進行說話人聚類時,難以用統一的閾值進行聚類停止條件的判斷,使得 說話人數目判斷存在較大誤差,最終影響語音識別效果。
    技術實現思路
    本專利技術實施例提供一種判斷說話人數目的方法及系統,解決對于雙說話人場景或 多說話人場景,尤其是長時音頻,通過現有技術判斷的說話人數目不準確的問題,以提高判 斷說話人數目的準確度。 為此,本專利技術實施例提供如下技術方案: 一種判斷說話人數目的方法,包括: 接收語音信號; 提取所述語音信號的語音信號特征; 根據所述語音信號的語音信號特征對所述語音信號進行分割,得到分割信號段; 將所述分割信號段聚類成指定個數的語音信號類; 根據所述語音信號類中各分割信號段的語音信號特征對所述語音信號進行重分 割; 計算過程:根據重分割后語音信號類中各分割信號段的語音信號特征計算并比較 不同語音信號類之間的相似度; 計算過程結束后,根據計算結果確定說話人數目。 優選地,所述根據所述語音信號類中各分割信號段的語音信號特征對所述語音信 號進行重分割包括: (1)利用所述語音信號的語音信號特征訓練一個總的高斯混合模型; (2)利用各語音信號類中各分割信號段的語音信號特征在該總的高斯混合模型上 進行最大后驗概率自適應,得到各類的高斯混合模型; (3)利用各類的高斯混合模型對所述語音信號進行重分割,并確定重分割后語音 信號類中各分割信號段; 重復上述步驟(2)至步驟(3)直至完成設定的重復次數。 優選地,所述計算過程包括: 利用總體變化因子模型提取當前各語音信號類的說話人因子向量; 根據所述說話人因子向量之間的距離計算不同語音信號類之間的相似度; 如果得到的最大相似度大于設定的第一閾值,則將最大相似度對應的兩個語音信 號類進行合并;然后重復計算過程; 否則,計算過程結束。 優選地,所述計算過程包括: 利用總體變化因子模型提取當前各語音信號類的說話人因子向量; 利用概率線性鑒別分析PLDA技術從所述說話人因子向量中提取信道無關的說話 人因子向量; 根據所述信道無關的說話人因子向量之間的距離計算不同語音信號類之間的相 似度; 如果得到的最大相似度大于設定的第二閾值,則將最大相似度對應的兩個語音信 號類進行合并;然后重復計算過程; 否則,計算過程結束。 優選地,所述計算過程包括: 利用總體變化因子模型提取當前各語音信號類的說話人因子向量; 利用大量離線數據訓練的PLDA模型來計算各語音信號類的說話人因子向量之間 與信道無關的PLDA得分; 如果得到的最大PLDA得分大于設定的第三閾值,則將最大PLDA得分對應的兩個 語音信號類進行合并;然后重復計算過程; 否則,計算過程結束。 優選地,所述根據計算結果確定說話人數目包括: 將當前語音信號類的數目作為說話人數目。 -種判斷說話人數目的系統,包括: 接收模塊,用于接收語音信號; 特征提取模塊,用于提取所述語音信號的語音信號特征; 分割模塊,用于根據所述語音信號的語音信號特征對所述語音信號進行分割,得 到分割信號段; 聚類模塊,用于將所述分割信號段聚類成指定個數的語音信號類; 重分割模塊,用于根據所述語音信號類中各分割信號段的語音信號特征對所述語 音信號進行重分割; 相似度獲取模塊,用于根據重分割后語音信號類中各分割信號段的語音信號特征 計算并比較不同語音信號類之間的相似度; 數目獲取模塊,用于根據不同語音信號類之間的相似度的比較結果確定說話人數 目。 優選地,所述重分割模塊包括: 第一模型訓練單元,用于利用所述語音信號的語音信號特征訓練一個總的高斯混 合模型; 第二模型訓練單元,用于利用各語音信號類中各分割信號段的語音信號特征在該 總的高斯混合模型上進行最大后驗概率自適應,得到各類的高斯混合模型; 重分割單元,用于利用各類的高斯混合模型對所述語音信號進行重分割,并確定 重分割后語音信號類中各分割信號段; 第一判斷單元,用于判斷重復重分割的次數是否達到設定的重復次數,如果未達 到,則觸發所述第二模型訓練單元和所述重分割單元繼續重復執行各自的操作過程。 優選地,所述相似度獲取模塊包括: 說話人因子向量提取單元,用于利用總體變化因子模型提取當前各語音信號類的 說話人因子向量; 第一計算單元,用于根據所述說話人因子向量之間的距離計算不同語音信號類之 間的相似度; 第一合并單元,用于在所述第一計算單元計算得到的最大相似度大于設定的第一 閾值時,將最大相似度對應的兩個語音信號類進行合并,然后觸發所述第一計算單元繼續 重復計算過程。 優選地,所述相似度獲取模塊包括: 說話人因子向量提取單元,用于利用總體變化因子模型提取當前各語音信號類的 說話人因子向量; 說話人因子分析單元,用于利用概率線性鑒別分析PLDA技術從所述說話人因子 向量中提取信道無關的說話人因子向量; 第二計算單元,用于根據所述信道無關的說話人因子向量之間的距離計算不同語 音信號類之間的相似度; 第二合并單元,用于在所述第二計算單元得到的最大相似度大于設定的第二閾值 時,將最大相似度對應的兩個語音信號類進行合并,然后觸發所述第二計算單元繼續重復 計算過程。 優選地,所述相似度獲取模塊包括: 說話人因子向量提取單元,用于利用總體變化因子模型提取當前各語音信號類的 說話人因子向量; 第三計算單元,用于利用大量離線數據訓練的PLDA模型來計算各語音信號類的 說話人因子向量之間與信道無關的PLDA得分; 第三合并單元,用于在所述第三計算單元得到的最大PLDA得分大于設定的第三 閾值時,將最大PLDA得分對應的兩個語音信號類進行合并,然后觸發所述第三計算單元繼 續重復計算過程。 優選地,所述數目獲取模塊具體用于將當前語音信號類的數目作為說話人數目。 本專利技術實施例提供的判斷說話人數目的方法及系統,通過提取接收的語音信號的 語音信號特征,然后通過現有技術,根據語音信號特征對語音信號進行分割,并將分割后得 到的分割信號段聚類成指定個數的語音信號類,本文檔來自技高網...

    【技術保護點】
    一種判斷說話人數目的方法,其特征在于,包括:接收語音信號;提取所述語音信號的語音信號特征;根據所述語音信號的語音信號特征對所述語音信號進行分割,得到分割信號段;將所述分割信號段聚類成指定個數的語音信號類;根據所述語音信號類中各分割信號段的語音信號特征對所述語音信號進行重分割;計算過程:根據重分割后語音信號類中各分割信號段的語音信號特征計算并比較不同語音信號類之間的相似度;計算過程結束后,根據計算結果確定說話人數目。

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:何山殷兵潘青華胡國平胡郁劉慶峰
    申請(專利權)人:科大訊飛股份有限公司
    類型:發明
    國別省市:安徽;34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲国产精品成人AV无码久久综合影院 | 亚洲爆乳少妇无码激情| 人妻中文字系列无码专区| 综合无码一区二区三区四区五区| 亚洲乱亚洲乱妇无码| 伊人久久无码中文字幕| 亚洲精品无码久久久久牙蜜区| 国产午夜鲁丝片AV无码| 久久精品亚洲中文字幕无码麻豆| 精品久久久久久久无码久中文字幕 | 久久久久亚洲AV无码专区体验| 无码国产精品一区二区高潮| 亚洲AV无码成人网站久久精品大| 国产精品无码免费播放| 久久亚洲精品无码VA大香大香| 韩国免费a级作爱片无码| 永久免费av无码不卡在线观看| 国产精品无码久久久久久| 日韩精品无码永久免费网站| 啊灬啊别停灬用力啊无码视频| 亚洲色无码专区在线观看| 亚洲?V无码成人精品区日韩 | 国产啪亚洲国产精品无码| 一区二区无码免费视频网站| 无码H肉动漫在线观看| 亚洲韩国精品无码一区二区三区| 亚洲人成无码网站久久99热国产| 乱人伦人妻中文字幕无码| AA区一区二区三无码精片| 免费看又黄又无码的网站 | 亚洲gv猛男gv无码男同短文| 国产成人无码免费看片软件| 五月婷婷无码观看| 日韩少妇无码一区二区三区| 国产精品无码一本二本三本色| 无码h黄肉3d动漫在线观看| 久久久g0g0午夜无码精品| 久久久国产精品无码一区二区三区 | 精品乱码一区内射人妻无码| 久久美利坚合众国AV无码| 无码人妻丰满熟妇区毛片18|