【技術實現步驟摘要】
本專利技術屬于計算機視覺
,更具體地,涉及。
技術介紹
在當今信息爆炸年代,運用計算機視覺技術從視覺信息(圖片、視頻等)中快速有效地分析和提取出有用信息變得越來越重要。文本檢測和識別就是判斷輸入的自然場景圖像中是否存在文本,如果存在,則標記其位置,然后對這些文本進行語意識別。自然圖像中的文本檢測和識別是計算機視覺
中重要研究課題之一,有著廣泛應用,例如機器人導航、圖像檢索、人機交互等。在過去的幾十年里,文本檢測和識別技術研究取得了長足進步,其主要有兩類一類是只進行文本檢測或只進行文本識別;一種是將兩者分開處理構成一個識別系統。但上述兩類方法基本都集中在水平方向文本的檢測和識別,其無法解決文本多樣性問題和復雜背景問題。
技術實現思路
針對現有技術的缺陷,本專利技術的目的在于提供,該方法將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結果精度,簡單高效。一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟(I)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高 ...
【技術保護點】
一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟:(1)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串;(5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串;(6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。
【技術特征摘要】
1.一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟: (O依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符; (2)濾除不滿足字符幾何特征統計規律的備選字符; (3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符; (4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串; (5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串; (6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。2.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(2)中的字符幾何特征統計規律具體為:字符c的寬度WV(C)變化范圍為[O,1],高寬比AR(C)變化范圍為,占空比OR(C)變化范圍為,其中,3.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(3)中基于字符旋轉和尺度不變性特征的字符級分類器構建方法具體為: (31)提取訓練樣本字符c的基本信息,包括重心0(c)、長軸L(C)、...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。