• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種結合字符級分類和字符串級分類的文本檢測和識別方法技術

    技術編號:8656163 閱讀:165 留言:0更新日期:2013-05-01 23:52
    本發明專利技術公開了一種結合字符級和字符串級分類的文本檢測和識別方法,在圖像中提取可能屬于同一字符的像素集形成備選字符;濾除不滿足字符幾何特征統計規律的備選字符;采用基于字符旋轉和尺度不變性特征的字符級分類器對備選字符分類,以確定備選字符為某字符的概率;將字符兩兩合并形成初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩字符串合并成新的字符串,直到沒有可再合并的字符串;采用基于字符串結構特征的字符串級分類器對字符串分類,以確認具有語意的字符串;利用待識別字符為某一字符的概率對字符串識別,得到語意文本。本發明專利技術將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結果精度,簡單高效。

    【技術實現步驟摘要】

    本專利技術屬于計算機視覺
    ,更具體地,涉及。
    技術介紹
    在當今信息爆炸年代,運用計算機視覺技術從視覺信息(圖片、視頻等)中快速有效地分析和提取出有用信息變得越來越重要。文本檢測和識別就是判斷輸入的自然場景圖像中是否存在文本,如果存在,則標記其位置,然后對這些文本進行語意識別。自然圖像中的文本檢測和識別是計算機視覺
    中重要研究課題之一,有著廣泛應用,例如機器人導航、圖像檢索、人機交互等。在過去的幾十年里,文本檢測和識別技術研究取得了長足進步,其主要有兩類一類是只進行文本檢測或只進行文本識別;一種是將兩者分開處理構成一個識別系統。但上述兩類方法基本都集中在水平方向文本的檢測和識別,其無法解決文本多樣性問題和復雜背景問題。
    技術實現思路
    針對現有技術的缺陷,本專利技術的目的在于提供,該方法將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結果精度,簡單高效。一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟(I)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串;(5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串;(6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。進一步地,所述步驟(2)中的字符幾何特征統計規律具體為字符c的寬度WV(C)變化范圍為[O, I],高寬比AR(C)變化范圍為,占空比OR(C)變化范圍為,其中,本文檔來自技高網...

    【技術保護點】
    一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟:(1)依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符;(2)濾除不滿足字符幾何特征統計規律的備選字符;(3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符;(4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串;(5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串;(6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。

    【技術特征摘要】
    1.一種結合字符級和字符串級分類的文本檢測和識別方法,包括以下步驟: (O依據字符的組成像素中相鄰像素的筆畫寬度相同或相近的規律,在輸入圖像中提取可能屬于同一字符的像素集形成備選字符; (2)濾除不滿足字符幾何特征統計規律的備選字符; (3)采用基于字符旋轉和尺度不變性特征的字符級分類器對步驟(2)保留的備選字符進行分類,以確定備選字符是否為字符以及為某字符的字符分布概率,記被確定為字符的備選字符為待識別字符; (4)在步驟(3)確定的待識別字符中,將字符筆畫寬度、尺度和顏色相同或相近以及間距小于兩字符尺度之和的兩字符進行合并,形成多個由兩字符構成的初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩個字符串合并成一個新的字符串,重新計算合并后存在的兩兩字符串間的相似度,以此類推,直到沒有可再合并的字符串,最終得到的字符串即為備選字符串; (5)采用基于字符串結構特征的字符串級分類器對備選字符串進行分類,以確認具有實際語意的備選字符串為待識別字符串; (6)利用步驟(3)得到的字符分布概率對待識別字符串進行識別,最終得到語意文本。2.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(2)中的字符幾何特征統計規律具體為:字符c的寬度WV(C)變化范圍為[O,1],高寬比AR(C)變化范圍為,占空比OR(C)變化范圍為,其中,3.根據權利要求1所述的文本檢測和識別方法,其特征在于,所述步驟(3)中基于字符旋轉和尺度不變性特征的字符級分類器構建方法具體為: (31)提取訓練樣本字符c的基本信息,包括重心0(c)、長軸L(C)、...

    【專利技術屬性】
    技術研發人員:白翔姚聰蔡超劉文予
    申請(專利權)人:華中科技大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国精品无码一区二区三区在线| 国产麻豆天美果冻无码视频| 性无码专区无码片| 蜜桃无码一区二区三区| 免费A级毛片无码A| 亚洲AV成人无码久久精品老人| 日韩人妻无码一区二区三区99| 国产精品无码av天天爽| 亚洲综合无码精品一区二区三区| 在人线av无码免费高潮喷水| 精品一区二区无码AV| 亚洲综合无码无在线观看| 亚洲综合无码精品一区二区三区| 好了av第四综合无码久久 | 国产成人无码精品一区不卡| 中国无码人妻丰满熟妇啪啪软件 | 特级无码a级毛片特黄| 秋霞无码一区二区| 国产白丝无码免费视频| 亚洲精品无码你懂的网站| 亚洲AV无码AV吞精久久| 日韩av无码中文字幕| 亚洲精品无码av人在线观看| 无码人妻精品一区二区蜜桃百度| 亚洲天堂2017无码中文| 亚洲中文无码a∨在线观看| 久久午夜无码免费| 无码中文字幕av免费放dvd| 国产色爽免费无码视频| 日韩少妇无码一区二区三区| 少妇无码AV无码专区线| 无码日韩精品一区二区免费| 亚洲精品无码久久久久久| 亚洲国产精品无码久久久| 日韩国产成人无码av毛片| 精品人妻无码区二区三区| 亚洲AV无码乱码在线观看代蜜桃 | 国产精品JIZZ在线观看无码| 无码精品前田一区二区| 国产精品一级毛片无码视频| 人妻丰满熟妇aⅴ无码|