The invention discloses an auxiliary RGB D camera and face recognition method based on the visually impaired. The method includes: using face color image and the depth image acquired by D RGB tracking, and automatically give these face labels; the labels from the user input through a microphone, including but not limited to face the name, phone number and other personal information, people are positive; face image correction, can adapt to the identification different postures; the face image after correction were used for training the neural network model in face recognition; facial image to be identified is input into the trained model of face recognition, recognition of the output of the model through the 3D stereo transferred to the user; the 3D stereo can prompt information includes: the azimuth and distance of face in face users in depth image distance.
【技術實現步驟摘要】
一種基于RGB-D相機和人臉識別的視障人士輔助方法
本專利技術涉及模式分類,機器學習,人臉識別,視覺障礙人群輔助
,尤其涉及一種基于RGB-D相機和人臉識別的視障人士輔助方法。
技術介紹
根據世界衛生組織(WHO)的數據,全球有2.85億視障人士,其中有3900萬是盲人。視障人士的日常生活中,識別周圍人的身份是突出的需求。在沒有其他設備的輔助下,視障人士只能通過辨別聲音來判斷,這在很大程度上受限于視障人士與其周圍人的熟悉程度,距離,環境嘈雜度等因素。傳統的人臉識別方法,一般采用彩色相機拍攝人臉圖像,并且需要保證正面的人臉和均勻的光照,這就要求采集人臉樣本的過程中,人臉盡量靠近相機并且正面面向相機。因此,設計一種專門面向視障人士的人臉識別系統,并使用簡單自然的交互方式,將在很大程度上為視障人士提供方便。
技術實現思路
本專利技術的目的是利用RGB-D相機和人臉識別技術,解決視障人士的認人和識人方面存在的不便利性,旨在為視障人士提供一種簡單易用,交互方式人性化的輔助方法。本專利技術通過以下技術方案來實現:一種基于RGB-D相機和人臉識別的視障人士輔助方法,具體步驟如下:(1)人臉的錄入和人臉數據庫的建立;(2)人臉圖像的矯正;(3)神經網絡訓練;(4)識別人臉;(5)3D立體聲用于識別結果的交互。所述步驟(1)具體為:針對每一個識別對象,分別采集多幀連續的彩色圖像和深度圖像,進一步通過RGB-D中的彩色圖像通道檢出人臉圖像,以第一幀中檢出的人臉圖像作為人臉跟蹤的初始化起點。若在第n幀中出現人臉漏檢或檢測錯誤,則可以啟動人臉跟蹤模式,檢出人臉的區域。錄入所有識 ...
【技術保護點】
一種基于RGB?D相機和人臉識別的視障人士輔助方法,其特征在于,具體步驟如下:(1)人臉的錄入和人臉數據庫的建立;(2)人臉圖像的矯正;(3)神經網絡訓練;(4)識別人臉;(5)3D立體聲用于識別結果的交互。
【技術特征摘要】
1.一種基于RGB-D相機和人臉識別的視障人士輔助方法,其特征在于,具體步驟如下:(1)人臉的錄入和人臉數據庫的建立;(2)人臉圖像的矯正;(3)神經網絡訓練;(4)識別人臉;(5)3D立體聲用于識別結果的交互。2.根據權利要求1所述的方法,其特征在于,所述步驟(1)具體為:針對每一個識別對象,分別采集多幀連續的彩色圖像和深度圖像,進一步通過RGB-D中的彩色圖像通道檢出人臉圖像,以第一幀中檢出的人臉圖像作為人臉跟蹤的初始化起點。若在第n幀中出現人臉漏檢或檢測錯誤,則可以啟動人臉跟蹤模式,檢出人臉的區域。錄入所有識別對象的人臉圖像數據和對應的姓名,建立人臉數據庫。所述人臉跟蹤模式包括以下步驟:第一,在第n-1幀的人臉檢出情況下,分別計算彩色圖和深度圖中的人臉區域的直方圖。彩色直方圖的橫坐標為色度值,縱坐標為每個色度值對應的像素的個數;深度直方圖的橫坐標為深度值,縱坐標為每個深度值對應的像素的個數。第二,在第n幀中,計算彩色圖和深度圖的返向投影圖。彩色圖對應的返向投影圖是將彩色圖中的每個像素點的色度值替換為彩色直方圖中對應的縱坐標而獲得;深度圖對應的返向投影圖是將深度圖中的每個像素點的深度值替換為深度直方圖中對應的縱坐標而獲得。將兩個返向投影圖融合后,得到更符合實際情況的人臉區域預測。第三,在融合后的返向投影圖中,應用均值漂移算法(MeanShift),計算出第n幀人臉的區域。3.根據權利要求1所述的方法,其特征在于,所述步驟(2)具體為:第一,調整人臉圖像的格式為統一大小,即100像素*100像素。第二,檢出人臉區域的特征點,所述特征點包括臉頰輪廓、眼睛、眉毛、鼻子、...
【專利技術屬性】
技術研發人員:于紅雷,趙向東,楊愷倫,胡偉健,汪凱巍,
申請(專利權)人:杭州視氪科技有限公司,
類型:發明
國別省市:浙江,33
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。