本發(fā)明專利技術(shù)公開了一種基于語音識別字符索引的查找方法和系統(tǒng)。該方法包括如下步驟:用戶語音輸入基本字符,識別出用戶讀出的各個基本字符組合的語音,轉(zhuǎn)譯成基本字符組合文本索引,并進一步轉(zhuǎn)譯成標準的按鍵事件、觸屏事件或用戶識別的自定義事件,通過標準的事件傳遞函數(shù)傳遞給需要進行查找的應用場景或界面,實現(xiàn)語音識別字符索引的查找。該系統(tǒng)包括語音識別引擎服務裝置,用于識別用戶語音輸入的基本字符,以作為語音識別的字符索引;讀取轉(zhuǎn)譯裝置,轉(zhuǎn)譯識別裝置和匹配裝置。本發(fā)明專利技術(shù)實現(xiàn)了語音識別字符索引的快速查找功能。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及移動通信領(lǐng)域,尤其涉及一種基于語音識別字符索引的快速查找方法 及系統(tǒng)。
技術(shù)介紹
隨著移動通信領(lǐng)域技術(shù)的不斷發(fā)展和成熟,在日益普及的移動終端中,特別是智 能終端中軟件功能越來越豐富,用戶的個性化需求越來越多。但隨著移動操作系統(tǒng)和硬件 平臺的日趨統(tǒng)一,軟件功能的同質(zhì)化也日趨嚴重。不斷創(chuàng)新引入語音識別等新的交互方式 成為保持終端產(chǎn)品競爭力的重要途徑。語音識別作為一種新的、重要的用戶交互技術(shù)在移動終端中的應用越來越廣泛。 隨著語音識別技術(shù)的不斷發(fā)展和云端語音服務器的引入,語音識別率有了很大提升,但從 目前移動終端中已推出的語音產(chǎn)品的實際性能看,使用效果并不理想,技術(shù)還沒有完全成 熟。特別是存在因為用戶使用習慣、地域的不同,語言發(fā)音不用,國別不同等識別誤差范圍 較大,準確率不高的問題。同時,依靠云端語音服務器的自然語言解析方式,依賴于網(wǎng)絡(luò),需 要大量的數(shù)據(jù)交互操作,會引起用戶網(wǎng)絡(luò)流量的費用問題,而且當網(wǎng)絡(luò)狀態(tài)不好時,識別率 會很低,用戶使用場景受限。號碼查找功能是移動終端中的一項十分重要的,核心的功能。就目前已上市的產(chǎn) 品來說,號碼查找功能都是通過鍵盤或觸屏虛擬鍵盤輸入聯(lián)系人名稱或號碼相關(guān)信息進行 查找匹配,不支持通過語音識別進行字符索引快速查找的功能。因此,為了彌補上述技術(shù)的不足,本專利技術(shù)提出一種新的,基于語音識別字符索引的 快速查找方法及系統(tǒng)。
技術(shù)實現(xiàn)思路
為了克服現(xiàn)有技術(shù)中存在的缺陷或不足,本專利技術(shù)提供了一種基于語音識別字符索 引的查找方法及系統(tǒng)。為解決上述技術(shù)問題,本專利技術(shù)提供的技術(shù)方案為一種基于語音識別字符索引的 查找方法,該方法包括如下步驟用戶語音輸入基本字符,識別出用戶讀出的各個基本字符組合的語音,轉(zhuǎn)譯成基 本字符組合文本索引,并進一步轉(zhuǎn)譯成標準的按鍵事件、觸屏事件或用戶識別的自定義事 件,通過標準的事件傳遞函數(shù)傳遞給需要進行查找的應用場景或界面,實現(xiàn)語音識別字符 索引的查找。本專利技術(shù)還提供了一種基于語音識別字符索引的查找方法,該方法具體包括如下步 驟步驟11 :語音識別引擎服務啟動;步驟12 :用戶語音輸入基本字符,作為語音識別的字符索引;步驟13 :語音識別引擎服務接收到用戶語音后,讀取語音特征庫,遍歷,獲取與用戶語音輸入基本字符相匹配的語音特征文件,并將識別出的語音轉(zhuǎn)譯成文本字符;步驟14 :將上述文本字符轉(zhuǎn)移為標準的按鍵或觸屏事件或用戶識別的自定義事 件,調(diào)用標準的事件傳遞函數(shù),傳遞給當前的快速查找應用場景或應用;步驟15 :進行文本字符模糊匹配,將匹配的結(jié)果信息通過界面或其他形式反饋給 用戶,提示用戶當前的匹配狀態(tài);如果匹配結(jié)束或匹配結(jié)果為空,查找方法結(jié)束,執(zhí)行步驟 12;否則,轉(zhuǎn)到步驟16;步驟16 :用戶再次語音輸入基本字符,轉(zhuǎn)到步驟13。優(yōu)選的,語音識別引擎服務通過狀態(tài)欄圖標或者通知欄通知消息提示用戶語音識 別服務當前的狀態(tài),以此確認當前是否支持基于語音識別字符索引的快速查找功能。優(yōu)選的,步驟15中,如果匹配結(jié)束或匹配結(jié)果為空,查找方法結(jié)束后,執(zhí)行步驟12 前,還包括如下步驟一段時間內(nèi)沒有執(zhí)行步驟12,語音識別引擎服務休眠或關(guān)閉,該一段 時間的長度由用戶根據(jù)實際需求分等級設(shè)定。優(yōu)選的,語音識別的語音特征庫包含各個基本字符的語音特征文件字母A-Z,數(shù) 字O 9,特殊符號*#+。本專利技術(shù)還提供了一種基于語音識別字符索引的查找系統(tǒng),該系統(tǒng)包括語音識別引擎服務裝置,用于識別用戶語音輸入的基本字符,以作為語音識別的 字符索引; 讀取轉(zhuǎn)譯裝置,用于讀取語音特征庫,遍歷,獲取與語音識別弓I擎服務裝置識別的 語音輸入的基本字符匹配的語音特征文件,并將識別出的語音轉(zhuǎn)譯成文本字符;轉(zhuǎn)譯識別裝置,用于將上述文本字符轉(zhuǎn)譯為標準的按鍵或觸屏事件或用戶識別的 自定義事件,調(diào)用標準的事件傳遞函數(shù),傳遞給當前的快速查找應用場景或應用;匹配裝置,用于進行文本字符模糊匹配,將匹配的結(jié)果信息通過界面或其他形式 反饋給用戶,提示用戶當前的匹配狀態(tài)。優(yōu)選的,語音識別的語音特征庫包含各個基本字符的語音特征文件字母A-Z,數(shù) 字O 9,特殊符號*#+。本專利技術(shù)的有益效果在于1.本專利技術(shù)涉及的號碼查找算法是基于基本字符語音特征庫的,語音識別的計算量 較小,識別準確率高,速度快,設(shè)計實現(xiàn)更簡單,占用系統(tǒng)資源更少。2.本專利技術(shù)涉及的號碼查找算法通過將基本字符的語音轉(zhuǎn)譯成文本字符,并進一步 轉(zhuǎn)譯成標準按鍵或觸屏事件的方法,一方面引入了一種基于語音識別的新的號碼查找的交 互方式,另一方面該方法可以同按鍵和觸屏等傳統(tǒng)觸碰式交互方式一起工作,互不影響,優(yōu) 勢互補。3.本專利技術(shù)涉及的號碼查找算法基于語音識別,對于在比如高空作業(yè)、震動環(huán)境、有 操作障礙等對按鍵或觸屏等直接觸控不方便的應用場景更為方便。附圖說明圖1為本專利技術(shù)提供的語音識別字符索引查找轉(zhuǎn)譯流程示意圖。圖2為本專利技術(shù)提供的語音識別字符索引查找一個實施例的流程示意圖。圖3為本專利技術(shù)提供的語音識別字符索引字符匹配一個實施例的流程示意圖。具體實施方式下面結(jié)合附圖對本專利技術(shù)做進一步說明。本專利技術(shù)的核心思想是利用語音識別技術(shù)中對各個語言基本字符識別高效、準確、 多種語言通用化的特點,應用語音識別技術(shù)識別出用戶讀出的各個基本字符組合的語音, 轉(zhuǎn)譯成基本字符文本索引,并進一步轉(zhuǎn)譯成標準的按鍵事件、觸屏事件或用戶可以識別的 自定義事件,通過標準的事件傳遞函數(shù)傳遞給需要進行快速查找的應用場景或界面,實現(xiàn) 語音識別字符索引的快速查找功能。字符索引的引入,用戶可以根據(jù)實際需求自由組合基本字符作為字符索引,彌補 了直接命令式語音操作的可擴展性差的問題。直接命令式的語音操作要擴展操作命令必須 擴展直接命令語音庫,這樣會增加對用戶存儲空間和內(nèi)存的使用,同時由于語音庫的增加, 遍歷解析特定語音命令的響應時間會線性增加,會導致相應的語音操作越來越慢。字符索引的引入,使得語音庫只需要提供基本字符的語音特征文件,通過自由組 合,在不需要云端語音識別服務器的前提下,理論上可以高準確率實現(xiàn)幾乎所有可能的快 速查找命令。同時字符索引的響應時間不會因快速查找命令數(shù)量的增加而線性增加。可以 很好的滿足在云端語音識別服務無法獲取的情況下的語音識別的快速查找操作。因為是基本字符范圍的語音識別,所以語言的通用性相對較好,在沒有相應多語 言語音庫時也可以工作。比如在只有英文字母的語音庫時,同樣可以實現(xiàn)通過漢語中對拼 音的識別和使用。這對實現(xiàn)語音識別的查找或排序提供了便利。當然,可以必須看到字符索引方式不是用戶習慣的自然語言交互方式,需要依據(jù) 預設(shè)規(guī)則記憶命令集。所以語音識別字符索引不能太多太復雜,層級不能太深。基于語音識別字符索引的快速查找方法對于有操作障礙,提供了一種可以實現(xiàn)無 障礙溝通的方便有效的方法。本專利技術(shù)的一個優(yōu)先實例的技術(shù)方案為1.本專利技術(shù)的語音識別的詞匯表范圍包含各個基本字符集字母A-Z,數(shù)字O 9, 特殊符號*#+。基本字符集同當前選擇的語言相對應,由當前語言包含的基本字符集決定。 用戶可以根據(jù)實際需求配置裁剪。2.本專利技術(shù)的語音識別的語音庫包含各個基本字符的語音特征文件字母A-Z,數(shù) 字O 9,特殊符號*#+。3.本專利技術(shù)可以通過一定的預設(shè)規(guī)則建立基本字符組合和各個查找應用場景的映 關(guān)系。4.本專利技術(shù)組成字符索引的字符個數(shù)不受限制本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種基于語音識別字符索引的查找方法,其特征在于,該方法包括如下步驟:用戶語音輸入基本字符,識別出用戶讀出的各個基本字符組合的語音,轉(zhuǎn)譯成基本字符組合文本索引,并進一步轉(zhuǎn)譯成標準的按鍵事件、觸屏事件或用戶識別的自定義事件,通過標準的事件傳遞函數(shù)傳遞給需要進行查找的應用場景或界面,實現(xiàn)語音識別字符索引的查找。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:柏鳳佳,
申請(專利權(quán))人:深圳市中興移動通信有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。