【技術實現步驟摘要】
本專利技術屬于文字識別
,尤其是一種。
技術介紹
圖像中的文字是圖像的一種重要語義信息,正確定位和識別這些文字,對基于內 容的圖像檢索及過濾應用有著重要意義。 待提取文字的圖像可分為文檔圖像、場景圖像和原生數字圖像這3大類。早期的 圖像文字提取研究集中在文檔圖像方面,其研究內容包括預處理(如二值化、傾斜校正、字 符分割等)、字符識別、版面分析、圖形符號識別。現有OCR軟件主要是處理文檔圖像,對于 場景圖像和原生數字圖像處理效果不佳。最近的研究則集中在復雜圖像文字提取方面(包 括場景圖像文字提取和原生數字圖像文字提取)上:(1)場景圖像是指用攝像頭所拍攝到 的圖像,場景中的文字(如路牌、廣告牌等)也會作為場景的一部分被拍攝到場景圖像中, 場景圖像中的文字可能夾雜在復雜的背景區域中,也可能存在文本傾斜、光照不均等情況; (2)原生數字圖像是指用計算機軟件生成并一直以數字形式保存的圖像,為了便于在網絡 傳輸,原生數字圖像具有低分辨率的特點,且通常存在壓縮損失和嚴重的邊緣柔化問題。 復雜圖像文字提取系統的框架如圖1所示,包括文本定位、文字分割和文字識別 模塊。作為復雜圖像文字提取的關鍵步驟之一,文字識別近年來已取得了一些研究成果,但 是,目前復雜圖像中的文字識別研究還主要集中在英文方面。在漢字識別領域,我國學者在 印刷體漢字識別、手寫體漢字識別(包括聯機和脫機)方面取得了豐碩的成果,例如清華 TH-OCR與漢王OCR在漢字識別方面也已達到很高的性能,能夠滿足實際應用需求,但是,復 雜圖像中的漢字識別研究工作還很少,尚 ...
【技術保護點】
一種異態漢字識別方法,其特征在于包括以下步驟:步驟1、利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣柔化;步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照的影響;步驟3、將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。
【技術特征摘要】
1. 一種異態漢字識別方法,其特征在于包括以下步驟: 步驟1、利用稀疏編碼得到基向量和稀疏系數,通過重構圖像濾除噪音、處理邊緣柔 化; 步驟2、利用梯度方向直方圖抽取復原圖像的漢字邊緣梯度特征用以削弱傾斜和光照 的影響; 步驟3、將獲取的漢字邊緣梯度特征送入分類器,進行異態漢字的識別。2. 根據權利要求1所述的異態漢字識別方法,其特征在于:所述步驟1利用稀疏編碼 得到基向量和稀疏系數是通過以下方法實現的: 在訓練階段,根據以下目標函數進行優化問題求解:其中,X=(X1,x2, ^xm)eRkxm表示訓練集中的m幅漢字圖像減去各自的平均灰度值 后得到的m個k維向量集合,k為每幅圖像的像素數;B=O^b2,…,bn) ^浐?表示經稀 疏編碼計算得到的η個k維基向量;S=[\]nXmeRnxm表示稀疏系數矩陣,每一列Si = (Sil,si2,…,sin)為一幅圖像的η維稀疏系數向量;β是一個常量,用來平衡重構誤差與系 數的稀疏性;Φ(SiP表示非線性的稀疏懲罰函數,該懲罰函數表示為: 丄 彡(?. ) =(4+勺2 以上述目標函數為優化目標,基于整幅漢字圖像求取所有的基向量B和對應的稀疏系 數S。3. 根據權利要求2所述的異態漢字識別方法,其...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。