本發(fā)明專利技術(shù)的目的是提供一種用于基于本地詞庫提供輸入候選詞條的方法與設(shè)備;獲取用戶輸入的輸入字符串;根據(jù)該輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,該本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新;根據(jù)該候選詞條中所包括的末節(jié)子詞條,在該本地詞庫中匹配查詢得到對應(yīng)的下文詞條;將該候選詞條與該下文詞條進行合并處理,得到輸入候選詞條并提供給該用戶。與現(xiàn)有技術(shù)相比,本發(fā)明專利技術(shù)準(zhǔn)確、有效地擴大了提供的輸入候選詞條的范圍,使得提供的輸入候選詞條更符合用戶的輸入需求,提升了用戶的輸入體驗。
【技術(shù)實現(xiàn)步驟摘要】
一種基于本地詞庫提供輸入候選詞條的方法與設(shè)備
本專利技術(shù)涉及輸入法
,尤其涉及一種用于基于本地詞庫提供輸入候選詞條的技術(shù)。
技術(shù)介紹
現(xiàn)有技術(shù)中,輸入法一般僅對用戶某次完整輸入的內(nèi)容進行學(xué)習(xí),但沒對分段上屏的上下文關(guān)系進行學(xué)習(xí)。例如用戶分別輸入輸入字符串a(chǎn)b,上屏ab對應(yīng)的輸入詞條al,緊接著該用戶輸入輸入字符串Cd,并上屏Cd對應(yīng)的輸入詞條a2,現(xiàn)有輸入法并不會對該兩個分段上屏的輸入詞條al、a2間的上下文關(guān)系進行學(xué)習(xí);僅當(dāng)該用戶一次輸入輸入字符串a(chǎn)bed,并上屏輸入詞條ala2時,現(xiàn)有輸入法才會對該輸入詞條ala2進行學(xué)習(xí)。顯然,現(xiàn)有技術(shù)的該種方式不利于本地詞庫的更新,使得匹配得到的輸入候選詞條受到了限制,影響了用戶的輸入體驗。并且,現(xiàn)有技術(shù)的輸入法不會基于用戶歷史分段上屏的輸入詞條記錄,給出預(yù)測的輸入候選詞條,進一步使得提供給用戶的輸入候選詞條受到了限制,影響了用戶的輸入體驗。因此,如何有效地基于本地詞庫提供輸入候選詞條,提升用戶的輸入體驗,成為本領(lǐng)域技術(shù)人員亟需解決的一個問題。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目的是提供一種用于基于本地詞庫提供輸入候選詞條的方法與設(shè)備。根據(jù)本專利技術(shù)的一個方面,提供了一種用于基于本地詞庫提供輸入候選詞條的方法,其中,該方法包括以下步驟:a獲取用戶輸入的輸入字符串;b根據(jù)所述輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,所述本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新;c對所述候選詞條中所包括的末節(jié)子詞條,在所述本地詞庫中進行匹配查詢,確定所述末節(jié)子詞條所對應(yīng)的下文詞條;d將所述候選詞條與所述下文詞條進行合并處理,以獲得待提供給所述用戶的輸入候選詞條;e將所述輸入候選詞條提供給所述用戶。根據(jù)本專利技術(shù)的另一方面,還提供了一種用于基于本地詞庫提供輸入候選詞條的用戶設(shè)備,其中,該設(shè)備包括:第一獲取裝置,用于獲取用戶輸入的輸入字符串;第一匹配裝置,用于根據(jù)所述輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,所述本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新;第二匹配裝置,用于對所述候選詞條中所包括的末節(jié)子詞條,在所述本地詞庫中進行匹配查詢,確定所述末節(jié)子詞條所對應(yīng)的下文詞條;合并裝置,用于將所述候選詞條與所述下文詞條進行合并處理,以獲得待提供給所述用戶的輸入候選詞條;提供裝置,用于將所述輸入候選詞條提供給所述用戶。與現(xiàn)有技術(shù)相比,本專利技術(shù)根據(jù)用戶輸入的輸入字符串,在根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新的本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,并進一步根據(jù)該候選詞條中所包括的末節(jié)子詞條,在該本地詞庫中匹配查詢得到對應(yīng)的下文詞條,將該候選詞條與該下文詞條進行合并處理,得到輸入候選詞條并提供給該用戶,準(zhǔn)確、有效地擴大了提供的輸入候選詞條的范圍,使得提供的輸入候選詞條更符合用戶的輸入需求,提升了用戶的輸入體驗。進一步地,本專利技術(shù)對用戶分段上屏的輸入詞條記錄進行學(xué)習(xí),利用輸入詞條記錄的上下文關(guān)系,可以根據(jù)用戶剛上屏的上文詞條和輸入歷史中兩個上屏詞條之間的關(guān)系權(quán)值來確定預(yù)測的輸入候選詞條,從而提高當(dāng)前輸入的召回率,提高對預(yù)測的召回率。進一步地,本專利技術(shù)還可對完整輸入的輸入詞條記錄拆分成細粒度或合并粒度進行學(xué)習(xí),即用戶如果上屏一個較長的輸入詞條記錄,本專利技術(shù)會對輸入詞條記錄進行合理的粒度切分,取到每個合理粒度的詞條粒度進行學(xué)習(xí),這樣就不會導(dǎo)致預(yù)測輸入候選詞條時預(yù)測出一個不合理長度的詞條。【附圖說明】通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本專利技術(shù)的其它特征、目的和優(yōu)點將會變得更明顯:圖1示出根據(jù)本專利技術(shù)一個方面的用于基于本地詞庫提供輸入候選詞條的設(shè)備示意圖;圖2示出根據(jù)本專利技術(shù)一個優(yōu)選實施例的用于基于本地詞庫提供輸入候選詞條的設(shè)備不意圖;圖3示出根據(jù)本專利技術(shù)另一個方面的用于基于本地詞庫提供輸入候選詞條的方法流程圖;圖4示出根據(jù)本專利技術(shù)一個優(yōu)選實施例的用于基于本地詞庫提供輸入候選詞條的方法流程圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。【具體實施方式】下面結(jié)合附圖對本專利技術(shù)作進一步詳細描述。圖1示出根據(jù)本專利技術(shù)一個方面的用于基于本地詞庫提供輸入候選詞條的設(shè)備示意圖。用戶設(shè)備I包括第一獲取裝置101、第一匹配裝置102、第二匹配裝置103、合并裝置104和提供裝置105。其中,該用戶設(shè)備I包括但不限于任何一種可與用戶通過鍵盤、鼠標(biāo)、遙控器、觸摸板、或手寫設(shè)備等方式進行人機交互的電子產(chǎn)品,例如計算機、手機、PDA、平板電腦、游戲機或IPTV等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述用戶設(shè)備僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶設(shè)備如可適用于本專利技術(shù),也應(yīng)包含在本專利技術(shù)保護范圍以內(nèi),并在此以引用方式包含于此。第一獲取裝置101獲取用戶輸入的輸入字符串。具體地,用戶通過與用戶設(shè)備I的交互,在用戶設(shè)備I中輸入輸入字符串,第一獲取裝置101通過一次或多次調(diào)用該用戶設(shè)備I所提供的應(yīng)用程序接口(API),獲取該用戶輸入的輸入字符串。本領(lǐng)域技術(shù)人員應(yīng)能理解上述輸入及獲取輸入字符串的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的輸入或獲取輸入字符串的方式如可適用于本專利技術(shù),也應(yīng)包含在本專利技術(shù)保護范圍以內(nèi),并在此以引用方式包含于此。第一匹配裝置102根據(jù)所述輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,所述本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新。具體地,第一匹配裝置102根據(jù)第一獲取裝置101所獲取的輸入字符串,在本地詞庫中進行匹配查詢,獲取與該輸入字符串對應(yīng)的候選詞條,如根據(jù)該本地詞庫中所存儲的讀音與詞條的映射關(guān)系,或通過遍歷該本地詞庫中以樹形結(jié)構(gòu)存放的詞條,匹配得到讀音與該輸入字符串匹配的候選詞條。例如,用戶通過與用戶設(shè)備I的交互,輸入輸入字符串a(chǎn)bcdef,其中,假設(shè)ab是al的讀音,Cd是a2的讀音,ef是a3的讀音,則第一獲取裝置101通過與用戶設(shè)備I的交互,獲取該輸入字符串a(chǎn)bcdef ;第一匹配裝置102根據(jù)該輸入字符串,在本地詞庫中進行匹配查找,直接找到與該輸入字符串讀音匹配的候選詞條ala2a3,;或者,第一匹配裝置102分別找到與ab讀音匹配的al、與cd讀音匹配的a2、與ef讀音匹配的a3,再將三者進行拼接,得到與該輸入字符串a(chǎn)bcdef讀音匹配的候選詞條ala2a3 ;或者,第一匹配裝置102根據(jù)al找到al的下文詞條a2,a2的讀音和輸入字符串a(chǎn)bcdef中的cd匹配,則把它拼接al,組成ala2,接著,再根據(jù)a2找到a2的下文詞條a3, a3的讀音和輸入字符串a(chǎn)bcdef中的ef匹配,則把它拼接ala2,組成ala2a3,作為與該輸入字符串匹配的候選詞條。在此,該本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新,該分段上屏的輸入詞條記錄為用戶接連上屏的輸入詞條。例如,用戶歷史輸入輸入字符串a(chǎn)b,并選擇了輸入詞條al上屏,緊接著,該用戶又輸入輸入字符串Cd,并選擇了輸入詞條a2上屏,則該輸入詞條al及a2即為分段上屏的輸入詞條記錄,該用戶設(shè)備I將該分段上屏的輸入詞條記錄存入該本地詞庫中,以實現(xiàn)對該本地詞庫的建立或更新。具體建立或更新的方式將在圖2對應(yīng)的實施例中詳細描述。本領(lǐng)域技術(shù)人員應(yīng)能理解上述本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種用于基于本地詞庫提供輸入候選詞條的方法,其中,該方法包括以下步驟:a獲取用戶輸入的輸入字符串;b根據(jù)所述輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,所述本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新;c對所述候選詞條中所包括的末節(jié)子詞條,在所述本地詞庫中進行匹配查詢,確定所述末節(jié)子詞條所對應(yīng)的下文詞條;d將所述候選詞條與所述下文詞條進行合并處理,以獲得待提供給所述用戶的輸入候選詞條;e將所述輸入候選詞條提供給所述用戶。
【技術(shù)特征摘要】
1.一種用于基于本地詞庫提供輸入候選詞條的方法,其中,該方法包括以下步驟: a獲取用戶輸入的輸入字符串; b根據(jù)所述輸入字符串,在本地詞庫中進行匹配查詢,獲取對應(yīng)的候選詞條,其中,所述本地詞庫根據(jù)用戶歷史分段上屏的輸入詞條記錄建立或更新; c對所述候選詞條中所包括的末節(jié)子詞條,在所述本地詞庫中進行匹配查詢,確定所述末節(jié)子詞條所對應(yīng)的下文詞條; d將所述候選詞條與所述下文詞條進行合并處理,以獲得待提供給所述用戶的輸入候選詞條; e將所述輸入候選詞條提供給所述用戶。2.根據(jù)權(quán)利要求1所述的方法,其中,所述本地詞庫以樹形結(jié)構(gòu)存放詞條;其中,所述步驟b和步驟c中的匹配查詢包括: -采用深度遍歷算法,遍歷所述本地詞庫中的所述樹形結(jié)構(gòu)。3.根據(jù)權(quán)利要求2所述的方法,其中,所述匹配查詢包括: -根據(jù)所述樹形結(jié)構(gòu)的節(jié)點中所存放的詞條的上下文關(guān)系,采用所述深度遍歷算法,遍歷所述本地詞庫中的所述樹形結(jié)構(gòu)。4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中,該方法還包括: X根據(jù)所述用戶的歷史輸入順序,確定所述輸入候選詞條的優(yōu)先級; 其中,所述步驟e包括: -按照所述優(yōu)先級,將所述輸入候選詞條提供給所述用戶。5.根據(jù)泉流要求4所述的方法,其中,所述步驟X包括: -根據(jù)所述用戶的歷史輸入順序,并結(jié)合所述輸入候選詞條的詞條屬性,確定所述輸入候選詞條的優(yōu)先級; 其中,所述詞條屬性包括以下至少任一項: -所述輸入候選詞條對應(yīng)所述本地詞庫的概率屬性; -所述用戶歷史輸入所述輸入候選詞條的次數(shù); -所述輸入候選詞條中所包括的子詞條間的轉(zhuǎn)移概率; -所述輸入候選詞條所對應(yīng)的預(yù)測長度。6.根據(jù)權(quán)利要求1至5中任一項所述的方法,其中,該方法還包括: -獲取所述用戶歷史分段上屏的輸入詞條記錄; r根據(jù)所述歷史分段上屏的輸入詞條記錄間的上下文關(guān)系,建立或更新所述本地詞庫。7.根據(jù)權(quán)利要求6所述的方法,其中,該方法還包括: -對所述輸入詞條記錄進行切詞處理,以獲得至少一個詞條粒度; 其中,所述步驟r包括: -根據(jù)所述至少一個詞條粒度間的上下文關(guān)系,建立或更新所述本地詞庫。8.根據(jù)權(quán)利要求7所述的方法,其中,所述步驟r包括: -判斷由至少兩個詞條粒度合并后所獲得的詞條是否為高頻詞條,其中,所述至少兩個詞條粒度具有上下文關(guān)系; -若所述詞條為高頻詞條,根據(jù)所述詞條,建立或更新所述本地詞庫。9.一種用于基于本地詞庫提供輸入候選詞條的用戶設(shè)備,其中,該設(shè)備包括:第一獲取裝置,用于獲取用戶輸入的輸...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:何明哲,吳闖,邵玉珊,
申請(專利權(quán))人:百度在線網(wǎng)絡(luò)技術(shù)北京有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。