• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    電子設(shè)備的文本輸入系統(tǒng)及文本輸入方法技術(shù)方案

    技術(shù)編號:8244090 閱讀:203 留言:0更新日期:2013-01-25 03:02
    本發(fā)明專利技術(shù)涉及一種文本預(yù)測重新排序的系統(tǒng)及方法。具體而言,涉及一種基于修正過的概率值為文本預(yù)測重新排序的系統(tǒng)及方法。其中,根據(jù)給定文本預(yù)測將要出現(xiàn)在用戶輸入文本中的可能性修正概率值。

    【技術(shù)實現(xiàn)步驟摘要】
    【國外來華專利技術(shù)】
    本專利技術(shù)涉及,特別是一種對供顯示和用戶選擇的文本預(yù)測進行自適應(yīng)重排序的系統(tǒng)和方法。重新排序文本預(yù)測,以便將更接近當前文本語境的文本預(yù)測置于列表頂部顯示并供用戶選擇,由此輔助用戶進行文本輸入。
    技術(shù)介紹
    目前,存在著許多電子設(shè)備使用的文本輸入技術(shù),例如,臺式電腦或筆記本電腦使用的標準鍵盤(QWERTY-style)文本輸入,個人數(shù)字助理(PDA)使用的手寫識別,移動電話設(shè)備使用9位數(shù)字鍵盤的字母符號輸入,標準電腦設(shè)備及移動電腦設(shè)備使用的語音識別文本輸入系統(tǒng),以及觸屏裝置。在移動電話
    中,已有多種文本輸入技術(shù)。其中比較有名的文本輸入技 術(shù)包括特捷通訊公司(Tegic Communications)的“T9”,摩托羅拉(Motorola)的“iTap”,Nuance 通訊公司的 “XT9”、“eZiType” 和 “eZiText”,黑莓的 “SureType”,KeyPoint 科技公司(KeyPoint Technology)的“AdapTxt”和上海漢翔信息技術(shù)有限公司(CooTek)的“TouchPal”。這些技術(shù)大多是基于字符的文本輸入技術(shù),并利用了一些文本預(yù)測(或歧義消除)技術(shù)。在不同的已知模型中,支持一本具有合法詞條的詞典(或多本詞典),并且賦予詞典特定的輸入序列。文本輸入系統(tǒng)從該詞典中選擇一條(或一組)合法的詞條,并將該詞條作為潛在填充的候選詞條呈現(xiàn)給用戶。可由用戶輸入新的詞條來擴充上述基礎(chǔ)詞典,這一擴充受限于設(shè)備的可用內(nèi)存容量。在這些文本輸入系統(tǒng)中,除了某些系統(tǒng)(諸如“eZiText”、“AdapTxt”、“TouchPal,,)中根據(jù)即時的詞匯語境,對潛在填充的候選詞條進行排序,其余系統(tǒng)根據(jù)使用頻率的統(tǒng)計,對潛在填充的候選詞條進行排序。
    技術(shù)實現(xiàn)思路
    本專利技術(shù)對這種僅以使用時間或頻率為依據(jù)進行文本預(yù)測排序的文本輸入系統(tǒng)進行了顯著的改進,并允許對會受到預(yù)測詞條或短語屬于當前文本語境(例如,由用戶輸入的當前文本序列)可能性影響的文本預(yù)測進行排序。本專利技術(shù)提供的文本輸入系統(tǒng)允許使用“非本地”語境(Nonlocal context)。由此,本專利技術(shù)提供了一種能夠?qū)ζ渥陨砩a(chǎn)的文本預(yù)測進行更為準確排序的系統(tǒng),用以減少用戶的文本輸入強度(因為,用戶很少不得不靠翻動預(yù)測詞條列表或輸入額外字符來找出他們需要的詞條)。本專利技術(shù)提供了一種利用矢量空間技術(shù)和隨機索引來評估給定詞條或短語屬于當前文本語境的可能性的文本輸入系統(tǒng)及方法。由此,該系統(tǒng)可基于詞條/短語屬于當前文本語境的可能性,為給定的預(yù)測詞條/短語生成一修正過的概率值。該系統(tǒng)使用這一修正過的概率值重新排序和/或選擇由文本預(yù)測引擎生成的文本預(yù)測。之后,顯示生成的文本預(yù)測,以供用戶選擇并輸入電子設(shè)備。利用文本預(yù)測輸入當前文本的可能性重新排序文本預(yù)測,可帶來如下有益效果將與當前文本語境更為相關(guān)的文本預(yù)測置于列表頂部顯示以供用戶選擇,由此輔助用戶輸入文本。這樣非常有益的是可將呈獻給用戶的預(yù)測文本空間限制在該文本預(yù)測的子集上。由此,本專利技術(shù)所提供的系統(tǒng)能夠根據(jù)用戶輸入的文本準確地預(yù)測出與用戶意圖最為接近的文本預(yù)測。參照下列附圖,詳細介紹本專利技術(shù)。附圖說明圖I為本專利技術(shù)系統(tǒng)的結(jié)構(gòu)示意圖;圖2為圖I示出的本專利技術(shù)系統(tǒng)結(jié)構(gòu)中矢量空間相似度模塊的細節(jié)示意圖;圖3為本專利技術(shù)方法的流程圖。 具體實施例方式本專利技術(shù)提供了一種基于語言模型的文本預(yù)測系統(tǒng),用于文本預(yù)測成分的自適應(yīng)重排序。該系統(tǒng)利用矢量空間技術(shù),優(yōu)選為隨機索引,基于文本預(yù)測屬于用戶輸入的文本片段的可能性修正分配給文本預(yù)測的概率值。隨機索引是一種用于生成表示矢量空間詞條的語境矢量的矢量空間技術(shù)。為給定信息段中的每個語境(例如,在這種情況下為每個文檔)分配一個唯一且隨機生成的所謂索引矢量。隨機索引是一種增量法,這意味著可使用語境矢量來進行相似度計算,即使是文本預(yù)測系統(tǒng)僅僅在體驗若干語境之后。在本系統(tǒng)中,為每個文檔分配一個唯一的索引矢量,而且每個詞條具有一個與索引矢量相關(guān)的語境矢量。語境矢量包含出現(xiàn)該詞條的所有文檔的索引矢量。由于潛在的隨機索引模型逐漸遞增,故在用戶創(chuàng)建新“文檔”時本系統(tǒng)允許即時更新。盡管用于生成語境矢量以及將一組文檔中的詞條映射入矢量空間的技術(shù)優(yōu)選為隨機索弓丨,但本專利技術(shù)并不僅限于使用隨機索引。作為非限制性實例,對于矢量空間/分布相似模型而言,可使用潛在語義分析(Latent Semantic Analysis)、概率語義分析(Probabilistic Semantic Analysis)、或潛在狄利克雷分配模型(Latent DirichletAllocation model)。在隨機索引中,詞條被映射入矢量空間。在該空間內(nèi),各點間距離(以距離度量或逆相似性度量估算)表示為這些點所代表的詞條間的某種關(guān)系。本系統(tǒng)根據(jù)一組訓(xùn)練該系統(tǒng)所基于的已存在的文檔,使用隨機索引評估兩條任意詞條出現(xiàn)在同一文檔中的可能性。文檔包括明顯的、具有清楚定義的首尾端點的文本段。作為非限制性實例,所述文檔可以是電子郵件消息、新聞報道、博客條目(blog entry)、短信息(SMS message)、雜志文章或?qū)W術(shù)論文。可以預(yù)見,如果兩個詞條恰好出現(xiàn)在一組訓(xùn)練數(shù)據(jù)中的同一組文檔中,則在矢量空間中這兩個詞條勢必距離很近。相反,如果這兩個詞條出現(xiàn)在互不相交組別的文檔中,則在矢量空間中這兩個詞條勢必距離很遠。在本專利技術(shù)中,所述系統(tǒng)使用隨機索引將一組文檔中的詞條映射入矢量空間。該系統(tǒng)用于確定矢量空間中表示預(yù)測詞條的矢量與表示用戶輸入電子設(shè)備的當前詞條的矢量之間的接近程度。該系統(tǒng)基于矢量空間中所述矢量之間的接近程度,生成對應(yīng)于各個預(yù)測詞條的修正過的概率值。由此,本系統(tǒng)生成預(yù)測詞條與用戶輸入至設(shè)備的詞條出現(xiàn)在同一用戶輸入文本段的可能性的評估。如上所述,本系統(tǒng)使用文本預(yù)測成分的修正過的概率對其根據(jù)用戶輸入文本生成的文本預(yù)測成分進行重新排序。因此,本系統(tǒng)可以(基于可能存在的本地語境、非本地語境以及當前詞條信息)將可能性最高的文本預(yù)測置于供顯示和用戶選擇的文本預(yù)測列表的頂部,由此輔助用戶選擇及文本輸入。本系統(tǒng)可應(yīng)用于多種電子設(shè)備中。作為非限制性實例,本系統(tǒng)可以用于移動電話的文本輸入、個人數(shù)字助理的文本輸入、或電腦的文本輸入(例如,在可使用擊鍵和滾輪機構(gòu)選擇相關(guān)文本預(yù)測的設(shè)備中使用,或者在使用觸屏技術(shù)的設(shè)備中使用)。圖I示出了本專利技術(shù)系統(tǒng)。下面,參照圖I詳細介紹本系統(tǒng)的組成部分。首先,本系統(tǒng)包括用于生成文本(或類似元素)預(yù)測的預(yù)測器I。預(yù)測器是一種根據(jù)某類文本語境(例如,當前文檔2)生成一組文本預(yù)測3的裝置。每個文本預(yù)測3由諸如·詞條或短語(表示為s_i)的文本字符串和表示為p_i的概率值構(gòu)成。由此,文本預(yù)測3的集合的表示形式可以為{(s_l,p_l), (s_2, p_2)…(s_n, p_n),},其中,在該集合中存在η個文本預(yù)測。如同本領(lǐng)域技術(shù)人員理解的那樣,在文本預(yù)測系統(tǒng)中可以使用任意類型預(yù)測器和任意個預(yù)測器來生成文本預(yù)測3。優(yōu)選地,預(yù)測器基于用戶輸入文本的語境生成文本預(yù)測,即預(yù)測器基于之前η-l個詞條的語境生成第η個詞條。此處的“語境”表示之前出現(xiàn)在文本序列中的詞條,以及該系統(tǒng)對于當前詞條的所有認識(即,以特定字符或字符串開頭,或者已表明為某一類主本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護點】

    【技術(shù)特征摘要】
    【國外來華專利技術(shù)】...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:本杰明·德洛克喬納森·雷諾茲
    申請(專利權(quán))人:觸摸式有限公司
    類型:
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码素人福利免费| 亚洲精品无码专区| 乱人伦人妻中文字幕无码久久网| 无码丰满熟妇一区二区| 无码熟妇αⅴ人妻又粗又大| 国产av无码专区亚洲国产精品| 人妻少妇精品无码专区二区| 亚洲av无码专区在线电影| 国产亚洲?V无码?V男人的天堂| 亚洲日韩国产二区无码| 一本之道高清无码视频| 中文字幕无码不卡一区二区三区 | 亚洲精品无码久久久| 国产乱人伦Av在线无码| 无码av天天av天天爽| 日韩精品人妻系列无码专区| 中文字幕无码久久人妻| 人妻丰满熟妇AV无码区免| 日韩精品真人荷官无码| 国产丝袜无码一区二区三区视频| 亚洲午夜无码久久久久软件| 亚洲欧洲自拍拍偷午夜色无码| 精品无码久久久久久久久| 精品久久无码中文字幕| 亚洲av永久无码精品漫画| 国产精品va无码二区| 亚洲av午夜精品无码专区| 亚洲熟妇无码另类久久久| 人妻无码精品久久亚瑟影视| 无码中文字幕人妻在线一区二区三区| 日韩人妻无码精品一专区| 国产精品视频一区二区三区无码| 国产精品无码素人福利免费| 亚洲性无码一区二区三区| 亚洲乱人伦中文字幕无码| 精品人妻系列无码一区二区三区| 无码专区狠狠躁躁天天躁| 亚洲2022国产成人精品无码区| 亚洲午夜福利AV一区二区无码| 国产产无码乱码精品久久鸭| 国内精品人妻无码久久久影院|