The invention discloses a recognition model updating method and system and intelligent terminal, which belongs to the field of speech recognition technology; method includes: obtaining the initial voice signal flow; according to the segmentation and clustering algorithm for speech signal initial voice signal flow respectively associated with each speaker flow; to determine all the speech signal stream can be used as the existence of speech signal recognition object flow and signal flow as the recognition output; the identification signal of each speaker flow are respectively matched with the initial recognition model of a pre formed, obtaining successful matching recognition signal flow; the identification signal is successful, the additional flow identification signal flow as the training samples, and on the basis of training on initial recognition the model is updated, and ultimately the formation of multiple recognition models, each corresponding to a speaker recognition model. The beneficial effects of the technical scheme is: taking into account the accuracy on the application of intelligent terminal in the form recognition model required better practicability and voiceprint recognition required.
【技術實現步驟摘要】
一種識別模型更新方法及系統以及智能終端
本專利技術涉及語音識別
,尤其涉及一種識別模型更新方法及系統以及智能終端。
技術介紹
聲紋識別是一種利用人的聲音實現的識別技術,由于人在講話時使用的發聲器官存在一定的差異性,任何兩個人聲音的聲紋圖譜都有差異,所以聲紋可以作為表征個體差異的生物特征,因此可以通過建立識別模型來表征不同的個體,進而利用該識別模型識別不同的個體。目前識別模型的應用存在一個兩難的選擇,主要體現在訓練語料的長度選取上。一般而言,聲紋訓練的語料越長,建立的特征模型越精確,識別準確率也就越高,但是這種模型建立的方式的實用性不強;相反地,聲紋訓練語料較短,能保證較好的實用性,但相對而言其訓練生成的模型的識別準確率不高。而在實際應用中,例如應用到一些智能設備中進行語音操作的聲紋識別時,既要求有較高的識別準確率,又要求訓練語料不能太長,從而保證較好的實用性,則以現有技術中的聲紋識別模型建立的技術方案難以實現上述目的。同樣地,現有技術中,需要由用戶手動多次錄入一定時長的訓練語料來輔助建立識別模型,因此會給用戶較差的體驗,不具備較高的實用性;同時,組合起來的訓練語料的長度仍然有限,不能生成較精確的特征模型,識別準確率無法進一步提升;語速語調的變化、情緒波動等也都會影響模型建立的精確度。所以,如何在保證較高的實用性前提下,提高識別模型精確度,進而提高識別準確率是急需解決的問題。
技術實現思路
根據現有技術中存在的上述問題,現提供一種識別模型更新方法及系統以及智能終端的技術方案,具體包括:一種識別模型更新方法,其中,所述方法包括:獲取包含至少一個說話人的初始語 ...
【技術保護點】
一種識別模型更新方法,其特征在于,所述方法包括:獲取包含至少一個說話人的初始語音信號流;根據預設的說話人分割算法和說話人聚類算法,獲取所述初始語音信號流中分別關聯于每一個所述說話人的所述語音信號流;判斷所有所述語音信號流中是否存在能夠作為識別對象的所述語音信號流,并將能夠作為識別對象的所述語音信號流作為識別信號流輸出;將每個所述說話人的所述識別信號流分別與一預先形成的初始識別模型進行匹配,獲取匹配成功的所述識別信號流;將匹配成功的所述識別信號流作為追加的識別信號流的訓練樣本,并依據所述訓練樣本對所述初始識別模型進行更新,最終形成多個識別模型,每個所述識別模型對應于一個所述說話人。
【技術特征摘要】
1.一種識別模型更新方法,其特征在于,所述方法包括:獲取包含至少一個說話人的初始語音信號流;根據預設的說話人分割算法和說話人聚類算法,獲取所述初始語音信號流中分別關聯于每一個所述說話人的所述語音信號流;判斷所有所述語音信號流中是否存在能夠作為識別對象的所述語音信號流,并將能夠作為識別對象的所述語音信號流作為識別信號流輸出;將每個所述說話人的所述識別信號流分別與一預先形成的初始識別模型進行匹配,獲取匹配成功的所述識別信號流;將匹配成功的所述識別信號流作為追加的識別信號流的訓練樣本,并依據所述訓練樣本對所述初始識別模型進行更新,最終形成多個識別模型,每個所述識別模型對應于一個所述說話人。2.如權利要求1所述的識別模型更新方法,其特征在于,所述方法在獲取包含至少一個說話人的初始語音信號流之前還包括:根據預設的所述訓練樣本建立初始識別模型。3.如權利要求1或2所述的識別模型更新方法,其特征在于,根據所述說話人分割算法與所述說話人聚類算法,分別獲取所述初始語音信號流中的關聯于每個所述說話人的所述語音信號流的方法具體包括:根據所述說話人分割算法,將所述初始語音信號流分割成多個語音分段,每個所述語音分段中僅包含同一個所述說話人的語音信息;根據所述說話人聚類算法,將關聯于同一個所述說話人的所述語音分段進行聚類,生成僅關聯于同一個所述說話人的所述語音信號流。4.如權利要求1或2所述的識別模型更新方法,其特征在于,分別將每個所述說話人的所述識別信號流與所述初始識別模型進行匹配,獲取匹配成功的所述識別信號流的方法具體包括:分別根據每個所述說話人的所述識別信號流與所述初始識別模型進行匹配,獲取所述每個所述識別信號流與所述初始識別模型的匹配度;選取大于預設的匹配閾值的多個所述匹配度中最高的所述匹配度所對應的所述識別信號流作為匹配成功的所述識別信號流。5.如權利要求3所述的識別模型更新方法,其特征在于,分別將每個所述說話人的所述識別信號流與所述初始識別模型進行匹配,獲取匹配成功的所述識別信號流的方法具體包括:分別根據每個所述說話人的所述識別信號流與所述初始識別模型進行匹配,獲取所述每個所述識別信號流與所述初始識別模型的匹配度;選取大于預設的匹配閾值的多個所述匹配度中最高的所述匹配度所對應的所述識別信號流作為匹配成功的所述識別信號流。6.如權利要求1,2和5中任意一項所述的識別模型更新方法,其特征在于,將匹配成功的所述識別信號流作為對所述初始識別模型進行更新的追加的所述識別信號流的所述訓練樣本,并對所述初始識別模型進行更新的方法具體包括:根據匹配成功的所述識別信號流以及預設的訓練樣本,生成修正識別模型,預設的所述訓練樣本為生成所述初始識別模型的所述識別信號流;以所述修正識別模型對所述初始識別模型進行更新。7.如權利要求3所述的識別模型更新方法,其特征在于,將匹配成功的所述識別信號流作為對所述初始識別模型進行更新的追加的所述識別信號流的所述訓練樣本,并對所述初始識別模型進行更新的方法具體包括:根據匹配成功的所述識別信號流以及預設的訓練樣本,生成修正識別模型,預設的所述訓練樣本為生成所述初始識別模型的所述識別信號流;以所述修正識別模型對所述初始識別模型進行更新。8.如權利要求4所述的識別模型更新方法,其特征在于,將匹配成功的所述識別信號流作為對所述初始識別模型進行更新的追加的所述識別信號流的所述訓練樣本,并對所述初始識別模型進行更新的方法具體包括:根據匹配成功的所述識別信號流以及預設的訓練樣本,生成修正識別模型,預設的所述訓練樣本為生成所述初始識別模型的所述識別信號流;以所述修正識別模型對所述初始識別模型進行更新。9.一種識別模型更新系統,其特征在于,包括:獲取單元、處理單元、匹配單元以及模型更新單元;獲取單元,用于獲取包含至少一個說話人的初始語音信號流并發送給與所述獲取單元連接的處理單元;所述處理單元用于接收所述獲取單元發送的所述初始語音信號流,并根據預設的說話人分割算法與說話人聚類算法,獲取所述初始語音信號流中分別關聯于每一個所述說話人的所述語音信號流,并分別將關聯于每一個所述說話...
【專利技術屬性】
技術研發人員:祝銘明,
申請(專利權)人:芋頭科技杭州有限公司,
類型:發明
國別省市:浙江,33
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。