本發(fā)明專利技術(shù)提出了一種視頻圖像提取及識(shí)別方法與系統(tǒng),包括數(shù)據(jù)庫,用于保存視頻圖像訓(xùn)練集;訓(xùn)練集處理模塊,用于從數(shù)據(jù)庫中獲取視頻圖像訓(xùn)練集,并將它們向量化,根據(jù)總體復(fù)散度矩陣,通過奇異值分解的方法求出一組正交的特征向量,并選取前100個(gè)最大的特征值及其對應(yīng)的特征向量;視頻圖像背景去除模塊,用于使用圖像背景去霧方式對視頻圖像中不相關(guān)的背景進(jìn)行處理,處理后的圖像保留需要識(shí)別的視頻圖像,記為第一待識(shí)別圖像,并將所述第一待識(shí)別圖像發(fā)送給視頻圖像檢測模塊;視頻圖像檢測模塊,對從視頻圖像背景去除模塊接收到的第一待識(shí)別圖像進(jìn)行處理,確定所述第一待識(shí)別圖像的變換空間投影特征值,并進(jìn)一步提取其特征;視頻識(shí)別模塊,采用歐氏距離的最近鄰分類器進(jìn)行視頻識(shí)別,并輸出識(shí)別結(jié)果。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及視頻領(lǐng)域,特別涉及一種采用計(jì)算機(jī)圖形圖像處理以及模式識(shí)別技術(shù)的視頻圖像提取及識(shí)別方法與系統(tǒng)。
技術(shù)介紹
視頻識(shí)別是基于視頻圖像特征信息進(jìn)行識(shí)別的一種識(shí)別技術(shù),近年來已經(jīng)在一些領(lǐng)域取得了應(yīng)用,例如視頻識(shí)別可以應(yīng)用于門禁系統(tǒng)、考勤系統(tǒng)、智能手機(jī)等等。在視頻識(shí)別技術(shù)中,主要有兩個(gè)步驟:從待識(shí)別視頻圖像中提取特征向量;將特征向量與數(shù)據(jù)庫中圖像的特征向量進(jìn)行對比獲得識(shí)別結(jié)果。其中,第一個(gè)步驟直接影響視頻識(shí)別結(jié)果的準(zhǔn)確性。在現(xiàn)有技術(shù)中,視頻識(shí)別算法很多,但都無法保證適應(yīng)于所有樣本,從而影響視頻識(shí)別的準(zhǔn)確性。局部二值模式(LocalBinaryPattern,LBP)由Ojala提出,在圖像局部鄰域內(nèi)度量像素值大小并提取紋理信息,對光照變化具有魯棒性。其計(jì)算簡便、抗光照干擾、判別能力強(qiáng),被廣泛應(yīng)用于光照變化下的人臉識(shí)別。但當(dāng)光照劇烈變化時(shí),LBP無法表示變化的劇烈程度,因此可靠性大幅下降,在此基礎(chǔ)上Tan等人又提出了局部三值模式(LocalTernaryPattern,LTP)。LTP算子對LBP算子進(jìn)行改進(jìn),采用三值編碼,以提高整個(gè)特征空間的分類能力。在一個(gè)3×3的窗口,自定義閾值t,將鄰域內(nèi)像素與中心像素進(jìn)行比較,像素差值被映射在gc量化為0、寬度為[-t,+t]的區(qū)域內(nèi),差值大于該區(qū)間編碼為+1,差值小于該區(qū)間編碼為-1,差值在區(qū)間范圍內(nèi)編碼為0。這樣,在鄰域內(nèi)可產(chǎn)生一個(gè)8位的二進(jìn)制有符號(hào)數(shù),再按其位置賦予不同權(quán)重,并對其求和即得到該窗口的局部三值模式(LTP)特征值,用這個(gè)數(shù)描述該區(qū)域的紋理信息。通過對LBP的研究與改進(jìn),LTP解決了光照劇烈變化下的識(shí)別問題,對劇烈變化的成像條件(如噪聲等)具有魯棒性。但LTP自身采用自定義閾值,需根據(jù)先驗(yàn)知識(shí)找尋、設(shè)定最佳閾值,時(shí)效性會(huì)受影響,同時(shí),閾值無法兼顧樣本間的差異,還存在普適性問題。因此,需要采用新的算子以提高對視頻圖像識(shí)別的識(shí)別率,閾值的優(yōu)化成為一個(gè)可取的方向。在政務(wù)、民生、環(huán)境、公共安全、城市服務(wù)、工商活動(dòng)、商場、銀行、海關(guān)、軍事禁區(qū)等場景中對于人物或者背景的動(dòng)態(tài)識(shí)別對于智能城市的建設(shè)存在著內(nèi)在的動(dòng)力需求。視頻識(shí)別技術(shù)是計(jì)算機(jī)圖像處理、圖形構(gòu)造、模式識(shí)別、計(jì)算機(jī)可視化和認(rèn)知科學(xué)等多個(gè)技術(shù)和領(lǐng)域的復(fù)合技術(shù)。視頻識(shí)別技術(shù)由于其數(shù)據(jù)的復(fù)雜性和采集、處理技術(shù)的困難,其還遠(yuǎn)遠(yuǎn)沒達(dá)到應(yīng)用的要求。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)的目的是通過以下技術(shù)方案實(shí)現(xiàn)的。本專利技術(shù)提出了一種視頻圖像提取及識(shí)別系統(tǒng),所述視頻圖像提取及識(shí)別系統(tǒng)包括如下組成部分:數(shù)據(jù)庫,用于保存視頻圖像訓(xùn)練集;訓(xùn)練集處理模塊,用于從數(shù)據(jù)庫中獲取視頻圖像訓(xùn)練集,并將它們向量化,根據(jù)總體復(fù)散度矩陣,通過奇異值分解的方法求出一組正交的特征向量,并選取前100個(gè)最大的特征值及其對應(yīng)的特征向量;視頻圖像背景去除模塊,用于使用圖像背景去霧方式對視頻圖像中不相關(guān)的背景進(jìn)行處理,處理后的圖像保留需要識(shí)別的視頻圖像,記為第一待識(shí)別圖像,并將所述第一待識(shí)別圖像發(fā)送給視頻圖像檢測模塊;視頻圖像檢測模塊,對從視頻圖像背景去除模塊接收到的第一待識(shí)別圖像進(jìn)行處理,確定所述第一待識(shí)別圖像的變換空間投影特征值,并進(jìn)一步提取其特征;視頻識(shí)別模塊,采用歐氏距離的最近鄰分類器進(jìn)行視頻識(shí)別,并輸出識(shí)別結(jié)果。根據(jù)本專利技術(shù)的一個(gè)方面,所述視頻圖像檢測模塊進(jìn)一步用于,對于第一待識(shí)別圖像It,通過式y(tǒng)k=ETIt,提取其特征。根據(jù)本專利技術(shù)的一個(gè)方面,所述視頻識(shí)別系統(tǒng)應(yīng)用于商場、銀行、海關(guān)、軍事禁區(qū)等場景中目標(biāo)物的識(shí)別。本專利技術(shù)還提出了一種采用上述的視頻圖像提取及識(shí)別系統(tǒng)進(jìn)行視頻識(shí)別的方法,包括如下步驟:步驟一、從數(shù)據(jù)庫中獲取視頻圖像訓(xùn)練集,并將它們向量化;步驟二、根據(jù)步驟一中確定的視頻圖像訓(xùn)練集的特征矩陣,根據(jù)總體復(fù)散度矩陣,通過奇異值分解的方法求出一組正交的特征向量;步驟三、選取前100個(gè)最大的特征值及其對應(yīng)的特征向量;步驟四:從高清攝像機(jī)實(shí)時(shí)拍攝的視頻圖像中獲取待識(shí)別視頻圖像,并獲取待識(shí)別視頻圖像中的變換空間投影特征值;步驟五、根據(jù)步驟四獲得的待識(shí)別視頻圖像It,通過式y(tǒng)k=ETIt,提取其特征;步驟六、采用歐氏距離的最近鄰分類器進(jìn)行視頻識(shí)別,如果識(shí)別的結(jié)果等于最小值,則待識(shí)別視頻圖像It與訓(xùn)練圖像Ir屬于同一類對象。根據(jù)本專利技術(shù)的一個(gè)方面,所述步驟五中,將圖像在高維空間的表示轉(zhuǎn)換為其在相應(yīng)低維空間的特征數(shù)據(jù),實(shí)現(xiàn)對圖像特征的提取。根據(jù)本專利技術(shù)的一個(gè)方面,所述視頻識(shí)別方法應(yīng)用于商場、銀行、海關(guān)、軍事禁區(qū)等場景中目標(biāo)物的識(shí)別。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本專利技術(shù)的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:附圖1示出了根據(jù)本專利技術(shù)實(shí)施方式的視頻圖像提取及識(shí)別系統(tǒng)示意圖。附圖2示出了根據(jù)本專利技術(shù)實(shí)施方式的視頻識(shí)別方法示意圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施方式。雖然附圖中顯示了本公開的示例性實(shí)施方式,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。視頻識(shí)別是一種利用視頻圖像的視覺特征信息進(jìn)行身份識(shí)別的生物特征識(shí)別技術(shù)。視頻識(shí)別與其他傳統(tǒng)生物識(shí)別技術(shù)相比,具有便于采集、方便快捷、交互友好等優(yōu)點(diǎn),已逐漸被大眾接受。視頻識(shí)別的幾種算法包括:1、模板匹配算法(Correlationalgorithm):通過獲取視頻圖像直接計(jì)算圖像位置的向量之間的距離來衡量視頻圖像是否相似。簡單的說就是獲取視頻最基本、直觀的特征(如耳朵,鼻子,臉型)來進(jìn)行相似度的比較,是視頻識(shí)別的基準(zhǔn)算法。此算法識(shí)別速度快,占用系統(tǒng)內(nèi)存小但是準(zhǔn)確率低,不適宜高識(shí)別要求的系統(tǒng)。2、特征臉?biāo)惴ǎ涸撍惴ㄓ苫谥鞒煞址治?PCA)方法,在特征臉?biāo)惴ǖ幕A(chǔ)上進(jìn)行優(yōu)化可以使算法更有效,是視頻圖像對比測試時(shí)的基準(zhǔn)識(shí)別算法。3、Fisher臉?biāo)惴ǎ壕€性鑒別分析方法是從高維空間中提取出最具有分類能力的低維特征,投影后的特征數(shù)據(jù),在低維空間里不同類別的樣本盡可能分得開些,同時(shí)希望每個(gè)類別的樣本盡可能密集,也就是說,樣本類間離散度越大越好,而類內(nèi)離散度越小越好。4、基于Gabor特征的算法:特征臉和Fisher臉?biāo)惴ú捎脠D像中灰度進(jìn)行特征分析。而基于Gabor特征的算法可以從多個(gè)角度來對圖像灰度進(jìn)行分析,模擬哺乳動(dòng)物皮質(zhì)細(xì)胞區(qū)域剖面,并且對于光照的適應(yīng)性比特征臉和Fisher臉?biāo)惴ê谩R曨l識(shí)別算法的選擇要考慮到視頻數(shù)據(jù)采集環(huán)境,采集設(shè)備條件,圖像數(shù)據(jù)處理優(yōu)化等客觀條件,并不是所有算法都適合所要建立的系統(tǒng)。為便于說明本專利技術(shù)實(shí)施例提供的視頻識(shí)別方法及裝置,先對本專利技術(shù)實(shí)施例中涉及到的視頻識(shí)別算法中的各種場景和技術(shù)儲(chǔ)備進(jìn)行簡單介紹。圖像采集可以采用攝像頭作為圖像傳感器,通過攝像頭抓取或者直接從硬盤上選取一章人臉圖像,然后將人臉圖像數(shù)據(jù)源存儲(chǔ)到數(shù)據(jù)庫中。圖像預(yù)處理可以包括灰度變換、二值變換、降噪處理,然后利用基于Adaboost的方法進(jìn)行視頻的檢測及定位,若檢測到有效視頻,則保存于數(shù)據(jù)庫之中。灰度變換用0~255表示每一點(diǎn)的灰色程度,0為黑色本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】
一種視頻圖像提取及識(shí)別系統(tǒng),其特征在于,所述視頻圖像提取及識(shí)別系統(tǒng)包括如下組成部分:數(shù)據(jù)庫,用于保存視頻圖像訓(xùn)練集;訓(xùn)練集處理模塊,用于從數(shù)據(jù)庫中獲取視頻圖像訓(xùn)練集,并將它們向量化,根據(jù)總體復(fù)散度矩陣,通過奇異值分解的方法求出一組正交的特征向量,并選取前100個(gè)最大的特征值及其對應(yīng)的特征向量;視頻圖像背景去除模塊,用于使用圖像背景去霧方式對視頻圖像中不相關(guān)的背景進(jìn)行處理,處理后的圖像保留需要識(shí)別的視頻圖像,記為第一待識(shí)別圖像,并將所述第一待識(shí)別圖像發(fā)送給視頻圖像檢測模塊;視頻圖像檢測模塊,對從視頻圖像背景去除模塊接收到的第一待識(shí)別圖像進(jìn)行處理,確定所述第一待識(shí)別圖像的變換空間投影特征值,并進(jìn)一步提取其特征;視頻識(shí)別模塊,采用歐氏距離的最近鄰分類器進(jìn)行視頻識(shí)別,并輸出識(shí)別結(jié)果。
【技術(shù)特征摘要】
1.一種視頻圖像提取及識(shí)別系統(tǒng),其特征在于,所述視頻圖像提取及識(shí)別系統(tǒng)包括如下組成部分:數(shù)據(jù)庫,用于保存視頻圖像訓(xùn)練集;訓(xùn)練集處理模塊,用于從數(shù)據(jù)庫中獲取視頻圖像訓(xùn)練集,并將它們向量化,根據(jù)總體復(fù)散度矩陣,通過奇異值分解的方法求出一組正交的特征向量,并選取前100個(gè)最大的特征值及其對應(yīng)的特征向量;視頻圖像背景去除模塊,用于使用圖像背景去霧方式對視頻圖像中不相關(guān)的背景進(jìn)行處理,處理后的圖像保留需要識(shí)別的視頻圖像,記為第一待識(shí)別圖像,并將所述第一待識(shí)別圖像發(fā)送給視頻圖像檢測模塊;視頻圖像檢測模塊,對從視頻圖像背景去除模塊接收到的第一待識(shí)別圖像進(jìn)行處理,確定所述第一待識(shí)別圖像的變換空間投影特征值,并進(jìn)一步提取其特征;視頻識(shí)別模塊,采用歐氏距離的最近鄰分類器進(jìn)行視頻識(shí)別,并輸出識(shí)別結(jié)果。2.如權(quán)利要求1所述的視頻識(shí)別系統(tǒng),其特征在于:所述視頻圖像檢測模塊進(jìn)一步用于,對于第一待識(shí)別圖像It,通過式y(tǒng)k=ETIt,提取其特征。3.如權(quán)利要求1所述的視頻識(shí)別系統(tǒng),其特征在于:所述視頻識(shí)別系統(tǒng)應(yīng)用于商場、銀行、海關(guān)、軍...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:袁真,李首峰,陳放,王亞博,孟欣欣,
申請(專利權(quán))人:國政通科技股份有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評(píng)論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。