• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>南開大學專利>正文

    異態漢字識別方法技術

    技術編號:10828672 閱讀:133 留言:0更新日期:2014-12-26 18:02
    本發明專利技術涉及一種異態漢字識別方法,其技術特點包括以下步驟:利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣柔化;利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響;將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。本發明專利技術設計合理,其采用稀疏編碼和梯度方向直方圖相結合的方式(SC-HOG方法)實現了復雜圖像中的異態漢字識別功能,對于漢字傾斜、光照不均、噪音干擾和邊緣柔化等異態情況有較強的魯棒性,解決了復雜圖像中漢字傾斜、光照不均、噪音干擾、邊緣柔化等多種異態情況下的漢字識別問題。

    【技術實現步驟摘要】

    本專利技術屬于文字識別
    ,尤其是一種。
    技術介紹
    圖像中的文字是圖像的一種重要語義信息,正確定位和識別這些文字,對基于內 容的圖像檢索及過濾應用有著重要意義。 待提取文字的圖像可分為文檔圖像、場景圖像和原生數字圖像這3大類。早期的 圖像文字提取研究集中在文檔圖像方面,其研究內容包括預處理(如二值化、傾斜校正、字 符分割等)、字符識別、版面分析、圖形符號識別。現有OCR軟件主要是處理文檔圖像,對于 場景圖像和原生數字圖像處理效果不佳。最近的研究則集中在復雜圖像文字提取方面(包 括場景圖像文字提取和原生數字圖像文字提取)上:(1)場景圖像是指用攝像頭所拍攝到 的圖像,場景中的文字(如路牌、廣告牌等)也會作為場景的一部分被拍攝到場景圖像中, 場景圖像中的文字可能夾雜在復雜的背景區域中,也可能存在文本傾斜、光照不均等情況; (2)原生數字圖像是指用計算機軟件生成并一直以數字形式保存的圖像,為了便于在網絡 傳輸,原生數字圖像具有低分辨率的特點,且通常存在壓縮損失和嚴重的邊緣柔化問題。 復雜圖像文字提取系統的框架如圖1所示,包括文本定位、文字分割和文字識別 模塊。作為復雜圖像文字提取的關鍵步驟之一,文字識別近年來已取得了一些研究成果,但 是,目前復雜圖像中的文字識別研究還主要集中在英文方面。在漢字識別領域,我國學者在 印刷體漢字識別、手寫體漢字識別(包括聯機和脫機)方面取得了豐碩的成果,例如清華 TH-OCR與漢王OCR在漢字識別方面也已達到很高的性能,能夠滿足實際應用需求,但是,復 雜圖像中的漢字識別研究工作還很少,尚處于起步階段。與傳統文檔圖像中的文字不同,復 雜圖像中的文字可能會存在傾斜、光照不均、噪音干擾、邊緣柔化等多種異態情況(如圖2 所示),現有的漢字識別方法均不能準確識別,難以提升復雜圖像漢字提取系統的性能。
    技術實現思路
    本專利技術的目的在于克服現有技術的不足,提供一種,解決復雜 圖像中漢字傾斜、光照不均、噪音干擾、邊緣柔化等多種異態情況下的漢字識別問題。 本專利技術解決現有的技術問題是采取以下技術方案實現的: -種,包括以下步驟: 步驟1、利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣 柔化; 步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和 光照的影響; 步驟3、將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。 而且,所述步驟1利用稀疏編碼得到基向量和稀疏系數是通過以下方法實現的: 在訓練階段,根據以下目標函數進行優化問題求解:本文檔來自技高網
    ...

    【技術保護點】
    一種異態漢字識別方法,其特征在于包括以下步驟:步驟1、利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣柔化;步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響;步驟3、將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。

    【技術特征摘要】
    1. 一種異態漢字識別方法,其特征在于包括以下步驟: 步驟1、利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣柔 化; 步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照 的影響; 步驟3、將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。2. 根據權利要求1所述的異態漢字識別方法,其特征在于:所述步驟1利用稀疏編碼 得到基向量和稀疏系數是通過以下方法實現的: 在訓練階段,根據以下目標函數進行優化問題求解:其中,X=(X1,x2, ^xm)eRkxm表示訓練集中的m幅漢字圖像減去各自的平均灰度值 后得到的m個k維向量集合,k為每幅圖像的像素數;B=O^b2,…,bn) ^浐?表示經稀 疏編碼計算得到的η個k維基向量;S=[\]nXmeRnxm表示稀疏系數矩陣,每一列Si = (Sil,si2,…,sin)為一幅圖像的η維稀疏系數向量;β是一個常量,用來平衡重構誤差與系 數的稀疏性;Φ(SiP表示非線性的稀疏懲罰函數,該懲罰函數表示為: 丄 彡(?. ) =(4+勺2 以上述目標函數為優化目標,基于整幅漢字圖像求取所有的基向量B和對應的稀疏系 數S。3. 根據權利要求2所述的異態漢字識別方法,其...

    【專利技術屬性】
    技術研發人員:王愷
    申請(專利權)人:南開大學
    類型:發明
    國別省市:天津;12

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV中文无码乱人伦在线视色| 少妇无码一区二区三区免费| 天天看高清无码一区二区三区| 深夜a级毛片免费无码| 亚洲v国产v天堂a无码久久| 国产日韩精品中文字无码| 69成人免费视频无码专区| 野花在线无码视频在线播放| 亚洲aⅴ无码专区在线观看| 亚洲av永久无码精品网站| 一本一道中文字幕无码东京热| 精品无码久久久久久午夜| 免费一区二区无码东京热| 国产精品无码亚洲精品2021 | 亚洲精品无码日韩国产不卡av| 久久青青草原亚洲av无码 | 亚洲一级特黄无码片| 无码中文在线二区免费| 久久无码人妻一区二区三区| 亚洲大尺度无码无码专区| 久久影院午夜理论片无码| 在线无码视频观看草草视频| 中字无码av电影在线观看网站| 日韩av无码一区二区三区 | 亚洲中文无码mv| 精品无码AV一区二区三区不卡 | 无码中文av有码中文a| 精品久久久无码21p发布| 无码国产午夜福利片在线观看| 亚洲日韩精品无码一区二区三区 | 丰满少妇人妻无码| 午夜无码人妻av大片色欲| 国产精品无码AV天天爽播放器| 亚洲6080yy久久无码产自国产 | 国产在线无码视频一区| 亚洲AV蜜桃永久无码精品| 国产精品无码久久av不卡| 国产精品毛片无码| 亚洲第一极品精品无码久久| 亚洲av永久无码精品漫画| 无码人妻一区二区三区在线 |