【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及互聯(lián)網(wǎng)通信
,特別涉及一種可進(jìn)行語音識(shí)別處理的瀏覽器及瀏覽器中進(jìn)行語音識(shí)別處理的方法。
技術(shù)介紹
語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來10年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語音識(shí)別技術(shù)所涉及的領(lǐng)域包括信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。瀏覽器是指可以顯示網(wǎng)頁服務(wù)器或者文件系統(tǒng)的HTML (Hypertext MarkupLanguage,超文本標(biāo)記語言)文件內(nèi)容,并讓用戶與這些文件交互的一種軟件。網(wǎng)頁瀏覽器主要通過HTTP (Hypertexttransfer protocol,超文本傳遞協(xié)議)協(xié)議與網(wǎng)頁服務(wù)器交互并獲取網(wǎng)頁,這些網(wǎng)頁由URL (Uniform/Universal Resource Locator,統(tǒng)一資源定位符)指定,文件格式通常為 HTML,并由 MIME (Multipurposelnternet Mail Extensions,多功能互聯(lián)網(wǎng)郵件擴(kuò)充服務(wù))在HTTP協(xié)議中指明。現(xiàn)有的瀏覽器大多沒有集成語音識(shí)別功能,即是個(gè)別瀏覽器集成了語音識(shí)別功能,一般只基于本地語音識(shí)別引擎或只基于WEB (網(wǎng)絡(luò))語音識(shí)別引擎,識(shí)別效率低、準(zhǔn)確性差。
技術(shù)實(shí)現(xiàn)思路
鑒于上述問題,提出了本專利技術(shù)以便提供一種克服上述問題或者至少部分地解決上述問題的一種可進(jìn)行語音識(shí)別處理的瀏覽器及瀏覽器中進(jìn)行語音識(shí)別處理的方法。依據(jù)本專利技術(shù)的一個(gè)方面,提供了一種可進(jìn)行語音識(shí)別處理的瀏覽器,其包括處理器 ...
【技術(shù)保護(hù)點(diǎn)】
一種可進(jìn)行語音識(shí)別處理的瀏覽器,其包括:處理器,適于接收用戶輸入指令設(shè)置瀏覽器的聲控模式為命令輸入模式或者文本輸入模式;語音接收器,適于接收用戶的語音輸入,并轉(zhuǎn)換為語音數(shù)據(jù);本地識(shí)別單元,適于調(diào)用瀏覽器側(cè)本地語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收本地語音識(shí)別結(jié)果,如果識(shí)別成功,則依據(jù)本地語音識(shí)別結(jié)果在所述命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理;WEB識(shí)別單元,適于在所述本地識(shí)別單元識(shí)別失敗的情況下,調(diào)用WEB語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收來自WEB語音識(shí)別引擎的WEB語音識(shí)別結(jié)果,依據(jù)WEB語音識(shí)別結(jié)果在命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理。
【技術(shù)特征摘要】
1.一種可進(jìn)行語音識(shí)別處理的瀏覽器,其包括 處理器,適于接收用戶輸入指令設(shè)置瀏覽器的聲控模式為命令輸入模式或者文本輸入模式; 語音接收器,適于接收用戶的語音輸入,并轉(zhuǎn)換為語音數(shù)據(jù); 本地識(shí)別單元,適于調(diào)用瀏覽器側(cè)本地語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收本地語音識(shí)別結(jié)果,如果識(shí)別成功,則依據(jù)本地語音識(shí)別結(jié)果在所述命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理; WEB識(shí)別單元,適于在所述本地識(shí)別單元識(shí)別失敗的情況下,調(diào)用WEB語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收來自WEB語音識(shí)別引擎的WEB語音識(shí)別結(jié)果,依據(jù)WEB語音識(shí)別結(jié)果在命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理。2.如權(quán)利要求1所述的瀏覽器,其特征在于,所述本地識(shí)別單元包括 本地調(diào)用模塊,適于調(diào)用本地語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收本地語音識(shí)別結(jié)果; 本地判斷模塊,適于判斷所述本地語音識(shí)別結(jié)果是否為空,如果是,認(rèn)為識(shí)別失敗,向WEB識(shí)別單元發(fā)送啟動(dòng)通知;否則,判斷當(dāng)前聲控模式是否是文本輸入模式,如果是,認(rèn)為識(shí)別成功,在所述瀏覽器中輸入所述本地語音識(shí)別結(jié)果對(duì)應(yīng)的輸入文本,否則,向本地匹配模塊發(fā)送本地匹配指令; 所述本地匹配模塊,適于根據(jù)所述本地匹配指令,將所述本地語音識(shí)別結(jié)果與所述瀏覽器的命令集進(jìn)行匹配,如果匹配成功,按照所述本地語音識(shí)別結(jié)果執(zhí)行相應(yīng)的瀏覽器操作,否則,認(rèn)為識(shí)別失敗,向WEB識(shí)別單元發(fā)送啟動(dòng)通知。3.如權(quán)利要求2所述的瀏覽器,其特征在于,所述WEB識(shí)別單元包括 通知接收模塊,適于接收所述本地識(shí)別單元發(fā)送的啟動(dòng)通知; WEB調(diào)用模塊,適于調(diào)用WEB語音識(shí)別引擎對(duì)所述語音數(shù)據(jù)進(jìn)行識(shí)別,接收來自WEB語音識(shí)別引擎的WEB語音識(shí)別結(jié)果; WEB判斷模塊,適于判斷當(dāng)前聲控模式是否是文本輸入模式,如果是,在所述瀏覽器中輸入所述WEB語音識(shí)別結(jié)果對(duì)應(yīng)的輸入文本,否則,向WEB匹配模塊發(fā)送WEB匹配指令;WEB匹配模塊,適于根據(jù)所述WEB匹配指令將所述WEB語音識(shí)別結(jié)果與所述瀏覽器的命令集進(jìn)行匹配,并按照所述WEB語音識(shí)別結(jié)果執(zhí)行相應(yīng)的瀏覽器操作。4.如權(quán)利要求2或3所述的瀏覽器,其特征在于,所述命令集包括所述瀏覽器的操作命令。5.如權(quán)利要求4所述的瀏覽器,其特征在于,所述瀏覽器還包括訓(xùn)練語音識(shí)別單元; 所述訓(xùn)練語音識(shí)別單元包括 訓(xùn)練語音庫(kù)建立模塊,適于預(yù)先對(duì)用戶的語音數(shù)據(jù)進(jìn)行訓(xùn)練,生成包含訓(xùn)練語音及相應(yīng)的輸入文本或相應(yīng)的所述操作命令的訓(xùn)練語音庫(kù); 訓(xùn)練語音匹配模塊,適于將所述語音數(shù)據(jù)與所述訓(xùn)練語音庫(kù)中的訓(xùn)練語音相匹配,如果匹配成功,在文本輸入模式下,在所述瀏覽器中輸入相應(yīng)的輸入文本,或者,在命令輸入模式下,按照相應(yīng)的操作命令執(zhí)行相應(yīng)的瀏覽器操作。6.如權(quán)利要求5所述的瀏覽器,其特征在于,所述訓(xùn)練語音識(shí)別單元還包括提示模塊;所述提示模塊,適于提示用戶對(duì)常用操作命令、地址欄中常用地址和/或搜索欄中常用搜索關(guān)鍵字進(jìn)行語音訓(xùn)練。7.如權(quán)利要求6所述的瀏覽器,其特征在于,所述訓(xùn)練語音識(shí)別單元還包括建表模塊和查表模塊; 所述建表模塊,適于生成地址欄中輸入和推薦的常用地址的URL與相應(yīng)的網(wǎng)頁標(biāo)題的對(duì)應(yīng)關(guān)系表; 其中,所述網(wǎng)頁標(biāo)題還作為所述訓(xùn)練語音庫(kù)中的輸入文本與相應(yīng)的訓(xùn)練語音相對(duì)應(yīng); 所述訓(xùn)練語音匹配模塊,還適于當(dāng)用戶在地址欄中進(jìn)行語音輸入時(shí),將用戶輸入的語音與所述訓(xùn)練語音相匹配獲得對(duì)應(yīng)的網(wǎng)頁標(biāo)題; 所述查表模塊,適于根據(jù)匹配獲得的網(wǎng)頁標(biāo)題查詢所述對(duì)應(yīng)關(guān)系表獲得相應(yīng)的URL,并將獲得的URL輸入至所述瀏覽器的地址欄中。8.如權(quán)利要求5所述的瀏覽器,其特征在于,所述瀏覽器還包括歷史語音識(shí)別單元; 所述歷史語音識(shí)別單元包括 歷史語音庫(kù)建立模塊,適于將所述系統(tǒng)已經(jīng)識(shí)別的歷史語音及相應(yīng)的輸入文本或相應(yīng)的所述操作命令進(jìn)行存儲(chǔ)生成歷史語音庫(kù); 歷史語音匹配模塊,適于將所述語音數(shù)據(jù)與所述歷史語音庫(kù)中的歷史語音相匹配,如果匹配成功,在文本輸入模式下,在所述瀏覽器中輸入相應(yīng)的輸入文本,或者,在命令輸入模式下,按照相應(yīng)的操作命令執(zhí)行相應(yīng)的瀏覽器操作。9.如權(quán)利要求8所述的瀏覽器,其特征在于,所述訓(xùn)練語音庫(kù)和/或歷史語音庫(kù)與相應(yīng)的瀏覽器用戶綁定,并作為相應(yīng)的瀏覽器用戶的個(gè)人信息存儲(chǔ)在瀏覽器側(cè)或者網(wǎng)絡(luò)服務(wù)器側(cè)的數(shù)據(jù)庫(kù)中。10.如權(quán)利要求1所述的瀏覽器,其特征在于, 所述本地識(shí)別單元,還適于在對(duì)所述語音數(shù)據(jù)部分識(shí)別成功的情況下,將未成功識(shí)別的語音數(shù)據(jù)發(fā)送給所述WEB識(shí)別單元; 所述WEB識(shí)別單元,還適于調(diào)用WEB語音識(shí)別引擎對(duì)未成功識(shí)別的語音數(shù)據(jù)進(jìn)行識(shí)別,接收來自WEB語音識(shí)別引擎的WEB語音識(shí)別結(jié)果,整合本地語音識(shí)別結(jié)果和WEB語音識(shí)別結(jié)果得到最終識(shí)別結(jié)果,依據(jù)最終識(shí)別結(jié)果在命令輸入模式或者文本輸入模式下進(jìn)行相應(yīng)的瀏覽器側(cè)處理。11.一種瀏覽器中進(jìn)行語音識(shí)別處理的方法,其包括步驟 接收用戶輸入指令設(shè)置瀏覽器的聲控模式為命令輸入模式或者文本輸入模式; 接收用戶的語音輸入,并轉(zhuǎn)換為語音數(shù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:楊東,任寰,
申請(qǐng)(專利權(quán))人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。