異態漢字識別方法技術

技術編號：10828672 閱讀：133 留言：0更新日期：2014-12-26 18:02

本發明專利技術涉及一種異態漢字識別方法，其技術特點包括以下步驟：利用稀疏編碼得到基向量和稀疏系數，通過重構圖像濾除噪音、處理邊緣柔化；利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響；將獲取的漢字邊緣梯度特征送入分類器，進行異態漢字的識別。本發明專利技術設計合理，其采用稀疏編碼和梯度方向直方圖相結合的方式(SC-HOG方法)實現了復雜圖像中的異態漢字識別功能，對于漢字傾斜、光照不均、噪音干擾和邊緣柔化等異態情況有較強的魯棒性，解決了復雜圖像中漢字傾斜、光照不均、噪音干擾、邊緣柔化等多種異態情況下的漢字識別問題。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術屬于文字識別
，尤其是一種。
技術介紹
圖像中的文字是圖像的一種重要語義信息，正確定位和識別這些文字，對基于內容的圖像檢索及過濾應用有著重要意義。待提取文字的圖像可分為文檔圖像、場景圖像和原生數字圖像這3大類。早期的圖像文字提取研究集中在文檔圖像方面，其研究內容包括預處理（如二值化、傾斜校正、字符分割等）、字符識別、版面分析、圖形符號識別。現有OCR軟件主要是處理文檔圖像，對于場景圖像和原生數字圖像處理效果不佳。最近的研究則集中在復雜圖像文字提取方面（包括場景圖像文字提取和原生數字圖像文字提取）上：（1)場景圖像是指用攝像頭所拍攝到的圖像，場景中的文字（如路牌、廣告牌等）也會作為場景的一部分被拍攝到場景圖像中，場景圖像中的文字可能夾雜在復雜的背景區域中，也可能存在文本傾斜、光照不均等情況； (2)原生數字圖像是指用計算機軟件生成并一直以數字形式保存的圖像，為了便于在網絡傳輸，原生數字圖像具有低分辨率的特點，且通常存在壓縮損失和嚴重的邊緣柔化問題。復雜圖像文字提取系統的框架如圖1所示，包括文本定位、文字分割和文字識別模塊。作為復雜圖像文字提取的關鍵步驟之一，文字識別近年來已取得了一些研究成果，但是，目前復雜圖像中的文字識別研究還主要集中在英文方面。在漢字識別領域，我國學者在印刷體漢字識別、手寫體漢字識別（包括聯機和脫機）方面取得了豐碩的成果，例如清華 TH-OCR與漢王OCR在漢字識別方面也已達到很高的性能，能夠滿足實際應用需求，但是，復雜圖像中的漢字識別研究工作還很少，尚...

【技術保護點】
一種異態漢字識別方法，其特征在于包括以下步驟：步驟1、利用稀疏編碼得到基向量和稀疏系數，通過重構圖像濾除噪音、處理邊緣柔化；步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響；步驟3、將獲取的漢字邊緣梯度特征送入分類器，進行異態漢字的識別。

【技術特征摘要】
1. 一種異態漢字識別方法，其特征在于包括以下步驟：步驟1、利用稀疏編碼得到基向量和稀疏系數，通過重構圖像濾除噪音、處理邊緣柔化；步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響；步驟3、將獲取的漢字邊緣梯度特征送入分類器，進行異態漢字的識別。2. 根據權利要求1所述的異態漢字識別方法，其特征在于：所述步驟1利用稀疏編碼得到基向量和稀疏系數是通過以下方法實現的：在訓練階段，根據以下目標函數進行優化問題求解：其中，X=(X1,x2, ^xm)eRkxm表示訓練集中的m幅漢字圖像減去各自的平均灰度值后得到的m個k維向量集合，k為每幅圖像的像素數；B=O^b2，…，bn) ^浐?表示經稀疏編碼計算得到的η個k維基向量；S=[\]nXmeRnxm表示稀疏系數矩陣，每一列Si = (Sil，si2，…，sin)為一幅圖像的η維稀疏系數向量；β是一個常量，用來平衡重構誤差與系數的稀疏性；Φ(SiP表示非線性的稀疏懲罰函數，該懲罰函數表示為：丄彡(?. ) =(4+勺2 以上述目標函數為優化目標，基于整幅漢字圖像求取所有的基向量B和對應的稀疏系數S。3. 根據權利要求2所述的異態漢字識別方法，其...

【專利技術屬性】
技術研發人員：王愷，
申請(專利權)人：南開大學，
類型：發明
國別省市：天津;12

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

模態參數識別方法技術

漢字筆順在線動態演示技術

漢字筆劃順序動態演示技術