The invention discloses a face detection method and system of three levels based on convolutional neural network, the method has the following advantages: in the training process, by increasing the N level after training as a result of the level of input, makes up the insufficiency of training data, so as to improve the accuracy and recall rate of face detection and, to enhance the overall performance of the network. Join the facial feature points in the training samples, the facial feature points to face classification and location of the face of the rectangle frame precision can be improved and thus close to reach the network line, and further improve the face detection recall and accuracy; only by calculating the first (second) regression classification offset in image classification correction, thus ensuring that the correct classification is no longer part of the regression correction, so that the detection speed is improved, and the performance of the network to further tap. The system has the same beneficial effect as the detection method.
【技術(shù)實現(xiàn)步驟摘要】
一種基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法及系統(tǒng)
本專利技術(shù)涉及人臉檢測
,具體涉及一種基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法及系統(tǒng)。
技術(shù)介紹
進入二十一世紀以來,計算機技術(shù)蓬勃發(fā)展,被廣泛的運用于各大領(lǐng)域;隨著計算機技術(shù)的發(fā)展,人臉檢測技術(shù)應(yīng)運而生并且在不斷的迭代、更新中。人臉檢測是指對于任意圖像集合,采用一定的策略對其進行搜索以確定其中具有人臉的圖像。人臉檢測是自動人臉識別系統(tǒng)中的一個關(guān)鍵環(huán)節(jié)。早期的人臉識別研究主要針對具有較強約束條件的人臉圖象(如無背景的圖象),往往假設(shè)人臉位置一直或者容易獲得,因此人臉檢測問題并未受到重視。隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識別成為最有潛力的生物身份驗證手段,這種應(yīng)用背景要求自動人臉識別系統(tǒng)能夠?qū)σ话銏D象具有一定的識別能力,由此所面臨的一系列問題使得人臉檢測開始作為一個獨立的課題受到研究者的重視。今天,人臉檢測的應(yīng)用背景已經(jīng)遠遠超出了人臉識別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、視頻檢測、人臉建模以及人臉跟蹤等方面有著重要的應(yīng)用價值。人臉檢測技術(shù)一般采用的搜索策略為決策樹、邏輯回歸、樸素貝葉斯以及三級卷積神經(jīng)網(wǎng)絡(luò)等算法等,其中基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法/系統(tǒng)憑借檢測速度快,識別準確率高而迅速迭代、更新。現(xiàn)有技術(shù)中的基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法:1)通過多級性能逐級增強的網(wǎng)絡(luò)進行逐級訓(xùn)練,將前一級判斷為人臉的候選框傳遞給下一級作為訓(xùn)練樣本進行學習;2)每一級中通過人臉的分類和人臉框的回歸網(wǎng)絡(luò)進行判決;3)如果分類正確直接將修正過的數(shù)據(jù)全部后饋。現(xiàn)有技術(shù)的不足之處在于,由于前一級網(wǎng)絡(luò)性能較差,存在部分人 ...
【技術(shù)保護點】
一種基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法,其特征在于,包括以下步驟:獲取訓(xùn)練樣本和檢測圖片;所述訓(xùn)練樣本至少包括標注有人臉框和人臉特征點的人臉圖片;將所述訓(xùn)練樣本輸入三級卷積神經(jīng)網(wǎng)絡(luò)進行逐級訓(xùn)練,所述訓(xùn)練的過程為:根據(jù)所述訓(xùn)練樣本和前n級的訓(xùn)練結(jié)果進行預(yù)測后降維,得到對應(yīng)的二維特征向量,并據(jù)其計算獲得第一偏移量;通過所述第一偏移量對所述二維特征向量進行回歸校正,得到對應(yīng)的訓(xùn)練結(jié)果;將所述檢測圖片輸入訓(xùn)練后的三級卷積神經(jīng)網(wǎng)絡(luò)進行逐級人臉檢測,得到人臉矩形框。
【技術(shù)特征摘要】
1.一種基于三級卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法,其特征在于,包括以下步驟:獲取訓(xùn)練樣本和檢測圖片;所述訓(xùn)練樣本至少包括標注有人臉框和人臉特征點的人臉圖片;將所述訓(xùn)練樣本輸入三級卷積神經(jīng)網(wǎng)絡(luò)進行逐級訓(xùn)練,所述訓(xùn)練的過程為:根據(jù)所述訓(xùn)練樣本和前n級的訓(xùn)練結(jié)果進行預(yù)測后降維,得到對應(yīng)的二維特征向量,并據(jù)其計算獲得第一偏移量;通過所述第一偏移量對所述二維特征向量進行回歸校正,得到對應(yīng)的訓(xùn)練結(jié)果;將所述檢測圖片輸入訓(xùn)練后的三級卷積神經(jīng)網(wǎng)絡(luò)進行逐級人臉檢測,得到人臉矩形框。2.根據(jù)權(quán)利要求1所述的人臉檢測方法,其特征在于,所述訓(xùn)練樣本中的人臉圖片還含有圖片分類標簽。3.根據(jù)權(quán)利要求1所述的人臉檢測方法,其特征在于,所述二維特征向量的獲得包括以下步驟:根據(jù)所述訓(xùn)練樣本和前n級的訓(xùn)練結(jié)果獲得m維特征向量;通過全卷積層/全連接層對所述m維特征向量進行降維處理,獲得所述二維特征向量。4.根據(jù)權(quán)利要求1所述的人臉檢測方法,其特征在于,三級卷積神經(jīng)網(wǎng)絡(luò)包括一級網(wǎng)絡(luò)、二級網(wǎng)絡(luò)以及三級網(wǎng)絡(luò),所述三級網(wǎng)絡(luò)包括第一支路、第二支路和第三支路,所述二級網(wǎng)絡(luò)包括所述第一支路和所述第二支路,所述第一支路與所述一級網(wǎng)絡(luò)相同。5.根據(jù)權(quán)利要求3或4所述的人臉檢測方法,其特征在于,在三級網(wǎng)絡(luò)中,m維特征向量的獲得包括以下步驟:將所述訓(xùn)練樣本和上一級的訓(xùn)練結(jié)果輸入所述第一支路獲取第一特征向量,將其輸入所述第二支路獲取第二特征向量,將其輸入所述第三支路獲取第三特征向量;將所述第一特征向量、第二特征向量以及第三特征向量進行拼接,得到m維特征向量。6.根據(jù)權(quán)利要求1所述的人臉檢測方法,其特征在于,所述第一偏移量的獲取包括以下步驟:將所述二維特征向量輸入SoftmaxWithLoss層,計算獲得分類偏移量;將所述二維特征向量輸入EuclideanLoss層,計算獲得人臉框偏移量以及所述人臉特征點偏移量。7.根據(jù)權(quán)利要求6所述的人臉檢測方法,其特征在于,所述分類偏移量的計算包括以下步驟:對所述...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王魯許,白洪亮,董遠,
申請(專利權(quán))人:北京飛搜科技有限公司,
類型:發(fā)明
國別省市:北京,11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。