The present invention relates to an image classification method and device. The method comprises the following steps: to be classified image input multiple different neural network model, the neural network model to specify multiple non input layer data output by generating a plurality of corresponding image features; a plurality of images for each input feature. The neural network model of the corresponding linear discriminant classifier to obtain the corresponding preset categories, the classification of the image contains preset categories object image probability value; image feature extraction based on the training by the neural network model of the corresponding phase of training should be obtained and the linear classifier is obtained; according to various probability value objects the classification of the image judging whether an image contains preset categories. The image classification method provided by the invention enables the image classification to be more accurate.
【技術實現步驟摘要】
圖像分類方法和裝置
本專利技術涉及計算機視覺
,特別是涉及一種圖像分類方法和裝置。
技術介紹
圖像分類方法是根據在圖像信息中所反映的不同特征,把不同類別的目標區分開來的圖像處理方法,具體利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區域劃歸為若干個類別中的某一種,以代替人的視覺判讀。對圖像進行分類后,便可以根據分類結果做進一步應用,比如圖像檢索、視頻監控以及涉及圖像的語義分析等各種應用。目前利用神經網絡模型可以實現較為準確的圖像分類,但隨著圖像分類應用的不斷擴展和細化,對圖像分類準確性的要求不斷提高,因此如何提高圖像分類的準確性成為目前需要解決的一個重要問題。
技術實現思路
基于此,有必要針對上述問題,提供一種可提高圖像分類準確性的圖像分類方法和裝置。一種圖像分類方法,所述方法包括:將待分類的圖像輸入多個不同的神經網絡模型,獲取各神經網絡模型的指定的多個非輸入層輸出的數據生成相應的多個圖像特征;將多個圖像特征分別輸入各神經網絡模型對應的用于判別預設類別的線性分類器,獲得相應的所述待分類的圖像包含預設類別的物體圖像的概率值;所述線性分類器是根據由相應的神經網絡模型提取的相應的訓練圖像的特征進行訓練得到的;根據獲得的各個概率值判別所述待分類的圖像是否包含預設類別的物體圖像。一種圖像分類裝置,所述裝置包括:圖像特征提取模塊,用于將待分類的圖像輸入多個不同的神經網絡模型,獲取各神經網絡模型的指定的多個非輸入層輸出的數據生成相應的多個圖像特征;線性分類器分類模塊,用于將多個圖像特征分別輸入各神經網絡模型對應的用于判別預設類別的線性分類器,獲得相應的所述待 ...
【技術保護點】
一種圖像分類方法,所述方法包括:將待分類的圖像輸入多個不同的神經網絡模型,獲取各神經網絡模型的指定的多個非輸入層輸出的數據生成相應的多個圖像特征;將多個圖像特征分別輸入各神經網絡模型對應的用于判別預設類別的線性分類器,獲得相應的所述待分類的圖像包含預設類別的物體圖像的概率值;所述線性分類器是根據由相應的神經網絡模型提取的相應的訓練圖像的特征進行訓練得到的;根據獲得的各個概率值判別所述待分類的圖像是否包含預設類別的物體圖像。
【技術特征摘要】
1.一種圖像分類方法,所述方法包括:將待分類的圖像輸入多個不同的神經網絡模型,獲取各神經網絡模型的指定的多個非輸入層輸出的數據生成相應的多個圖像特征;將多個圖像特征分別輸入各神經網絡模型對應的用于判別預設類別的線性分類器,獲得相應的所述待分類的圖像包含預設類別的物體圖像的概率值;所述線性分類器是根據由相應的神經網絡模型提取的相應的訓練圖像的特征進行訓練得到的;根據獲得的各個概率值判別所述待分類的圖像是否包含預設類別的物體圖像。2.根據權利要求1所述的方法,其特征在于,所述將待分類的圖像輸入多個不同的神經網絡模型,獲取各神經網絡模型的指定的多個非輸入層輸出的數據生成相應的多個圖像特征,包括:將待分類的圖像輸入每個神經網絡模型;獲取每個神經網絡模型的中間層和輸出層中指定的多個層輸出的向量;將每個神經網絡模型的不同層的向量拼接,獲得分別與每個神經網絡模型對應的多個圖像特征。3.根據權利要求2所述的方法,其特征在于,所述將待分類的圖像輸入每個神經網絡模型,包括:將待分類的圖像按照多個尺度分別輸入每個神經網絡模型;所述將每個神經網絡模型的不同層的向量拼接,獲得分別與每個神經網絡模型對應的多個圖像特征,包括:將每個神經網絡模型的相同尺度的圖像對應的不同層的向量拼接,并將不同尺度的圖像對應的向量求平均值,獲得分別與每個神經網絡模型對應的多個圖像特征。4.根據權利要求1至3中任意一項所述的方法,其特征在于,所述方法還包括:將采用一種訓練集訓練的原始的神經網絡模型的輸出層的系數清空,調整輸出層與另外的訓練集適配,并采用所述另外的訓練集重新訓練得到重新訓練的神經網絡模型。5.根據權利要求4所述的方法,其特征在于,所述根據獲得的各個概率值判別所述待分類的圖像是否包含預設類別的物體圖像,包括:采用窗口遍歷待分類的圖像以提取窗口圖像并縮放至相同尺寸;將各個窗口圖像輸入到重新訓練的神經網絡模型,并獲取非輸入層輸出的數據生成窗口圖像特征;將各個窗口圖像特征分別輸入重新訓練的神經網絡模型對應的用于判別預設類別的線性分類器,并根據相應的線性分類器輸出的結果獲得各個窗口圖像包含預設類別的物體圖像的概率值;從各個窗口圖像對應的概率值中選擇值最大的概率值;從選擇的概率值和原始的神經網絡模型對應的概率值中選取值最大的概率值;計算選取的概率值和重新訓練的神經網絡模型對應的概率值的加權平均值;根據所述加權平均值與預設類別對應的概率值閾值的大小關系判別所述待分類的圖像是否包含預設類別的物體圖像。6...
【專利技術屬性】
技術研發人員:徐昆,郭曉威,黃飛躍,張睿欣,王巨宏,胡事民,劉斌,
申請(專利權)人:清華大學,騰訊科技深圳有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。