The invention discloses a handwritten numeral recognition method based on multiple feature fusion and depth learning network extraction. The method includes: reading handwritten digital image data preprocessing, vector data; using principal component analysis of the processed data (PCA) technology and the direction of the gradient histogram (HOG) technology for multi feature fusion, composite structure characteristics of shallow; the multi feature fusion data using sparse encoding from stack depth (SAE) the model of feature extraction for two times, to construct deep learning network, high-level, deep learning and processing of the composite characteristics of shallow layer; a Softmax classifier is used to test the effect of classification. The invention adopts the method of multi feature fusion, the fusion of PCA technology and HOG technology, constructs the composite characteristics of shallow layer, and then using the SAE model for the two feature extraction, construction of deep learning network, get more concise and efficient feature samples, finally Softmax classifier to test the effect of classification, recognition of handwritten digit accuracy can be increased to 99.2%.
【技術實現步驟摘要】
基于多特征融合和深度學習網絡提取的手寫數字識別方法
本專利技術涉及手寫數字識別
,具體涉及基于多特征融合和深度學習網絡提取的手寫數字識別方法。
技術介紹
手寫數字識別在學科上屬于模式識別和人工智能的范疇,是光學字符識別技術的一個分支,主要研究如何利用電子計算機自動辨認手寫的阿拉伯數字。隨著經濟的飛速發展,逐漸信息化的社會在各個方面都要與數字打交道,一個準確率高的手寫數字的識別方法在此時就顯得尤為重要。雖然手寫數字的類別只有10種,且其識別已經研究了很長時間,并取得很大的進展,但是如今的手寫數字的識別精度還有需進一步提高。
技術實現思路
本專利技術針對現有技術的不足,提供基于多特征融合和深度學習網絡提取的手寫數字識別方法,具體技術方案如下。基于多特征融合和深度學習網絡提取的手寫數字識別方法,其包括如下步驟:步驟1:讀入手寫數字的圖像數據,對數據進行向量化預處理;步驟2:對上一步驟的輸出數據采用主成分分析(PCA)技術和方向梯度直方圖(HOG)技術進行多特征融合,構造淺層復合特征;步驟3:對多特征融合后的數據采用深度棧式稀疏自編碼(SAE)的模型進行二次特征提取,構造深度學習網絡,對淺層復合特征進行高層、深度學習和加工;步驟4:采用Softmax分類器分類并將分類結果進行顯示,該過程即實現了對手寫數字的識別。進一步地,所述主成分分析的實現過程具體如下:(1)為使原數據A的均方誤差最小,向量的均值應為零,即數據應以原點作為中心,因此現將原數據A以平均值為中心移到原點得到數據X:(2)協方差用于衡量兩個變量的總體誤差,而方差是兩個變量相同的特殊情況下的協方差,計 ...
【技術保護點】
基于多特征融合和深度學習網絡提取的手寫數字識別方法,其特征在于包括如下步驟:步驟1:讀入手寫數字的圖像數據,對數據進行向量化預處理;步驟2:對上一步驟的輸出數據采用主成分分析(PCA)技術和方向梯度直方圖(HOG)技術進行多特征融合,構造淺層復合特征;步驟3:對多特征融合后的數據采用深度棧式稀疏自編碼(SAE)的模型進行二次特征提取,構造深度學習網絡,對淺層復合特征進行高層、深度學習和加工;步驟4:采用Softmax分類器分類并將分類結果進行顯示,該過程即實現了對手寫數字的識別。
【技術特征摘要】
1.基于多特征融合和深度學習網絡提取的手寫數字識別方法,其特征在于包括如下步驟:步驟1:讀入手寫數字的圖像數據,對數據進行向量化預處理;步驟2:對上一步驟的輸出數據采用主成分分析(PCA)技術和方向梯度直方圖(HOG)技術進行多特征融合,構造淺層復合特征;步驟3:對多特征融合后的數據采用深度棧式稀疏自編碼(SAE)的模型進行二次特征提取,構造深度學習網絡,對淺層復合特征進行高層、深度學習和加工;步驟4:采用Softmax分類器分類并將分類結果進行顯示,該過程即實現了對手寫數字的識別。2.根據權利要求1所述的基于多特征融合和深度學習網絡提取的手寫數字識別方法,其特征在于所述主成分分析的實現過程具體如下:(1)為使原數據A的均方誤差最小,向量的均值應為零,即數據應以原點作為中心,因此現將原數據A以平均值為中心移到原點得到數據X:(2)協方差用于衡量兩個變量的總體誤差,而方差是兩個變量相同的特殊情況下的協方差,計算X的協方差無偏估計矩陣Y:由于兩個變量相同,此Y也是方差無偏估計矩陣,n為手寫數字圖像的像素個數;(3)計算協方差矩陣Y的特征值D和單位正交特征向量V,再讓特征值D由大到小進行排序;(4)對應特征值的排序將特征向量排序后,即可得到變換矩陣v,令X乘以變化矩陣v即可得到已排序的投影數據Z,其中,第一個對應的就是第一主成分,第二個對應的就是次主成分,以此類推;(5)λi是協方差矩陣,也是方差矩陣的第i個主元的特征值;計算第i個主元的方差貢獻率:而R個主元的累計方差貢獻率為:求得累計方差貢獻率超過99%的主成分數目R,然后在已排序的投影數據Z中取前R維,并將結果記為矩陣B。3.根據權利要求1所述的基于多特征融合和深度學習網絡提取的手寫數字識別方法,其特征在于所述方向梯度直方圖(HOG)技術的實現過程具體如下:(1)將圖像灰度化;(2)采用Gamma校正法對輸入圖像進行顏色空間的歸一化,調節圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時抑制噪音的干擾;(3)將圖像劃分為單...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。