【技術實現步驟摘要】
本申請實施例涉及圖像識別,尤其涉及一種視覺圖像檢測方法以及圖像測量模型的訓練方法。
技術介紹
1、圖像視覺測量具有非接觸、數字化和智能化等特點,廣泛應用于工業、交通、醫學、軍事等領域,是計算機視覺領域的一個重要研究方向。
2、計算機視覺主要包括單目視覺、雙目立體視覺、多目視覺、全景視覺和混合視覺等,單目視覺具有結構簡單、算法成熟和計算量小等優勢,是一種主流視覺解決方案。但是,單目視覺還存在如下的技術缺陷:
3、1)深度信息缺失:目前從二維圖像推斷出的深度估計值與真實值差距較大,難以準確獲取目標空間三維坐標和尺度信息;
4、2)泛化能力弱:現有視覺測量模型通常在特定的數據集上過擬合,難以順利地推廣到其它數據集,導致其應用場景有限。
技術實現思路
1、以下是對本文詳細描述的主題的概述。本概述并非是為了限制權利要求的保護范圍。
2、本公開實施例的主要目的在于提出一種視覺圖像檢測方法以及圖像測量模型的訓練方法,能夠提升單目數據測量的準確性。
3、為實現上述目的,本公開實施例的第一方面提出了一種視覺圖像檢測方法,所述視覺圖像檢測方法,包括以下步驟:
4、將單目多幀圖像輸入至預設的預訓練模型中,得到所述預訓練模型輸出每一幀的通用特征圖;
5、將所述通用特征圖輸入預設的測量模型,以使測量模型從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,并根
6、在一些實施例中,所述預訓練模型通過如下方式進行訓練:
7、所述測量模型包括第一參數測量網絡和第二參數測量網絡;所述從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,并根據所述單幀幾何測量結果和所述多幀幾何測量結果提取待測對象于單幀中不同深度的絕對幾何測量參數和待測對象于相鄰幀中的相對幾何測量參數,包括:
8、根據所述第一參數測量網絡從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果;
9、根據所述第二參數測量網絡的編碼器從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,將所述單幀幾何測量結果與所述多幀幾何測量結果拼接,得到拼接結果;
10、根據所述拼接結果構建立體匹配代價體;
11、將所述立體匹配代價體輸入所述第二參數測量網絡的解碼器中,得到所述解碼器從所述拼接結果中提取待測對象于單幀中不同深度的絕對幾何測量參數和待測對象于相鄰幀中的相對幾何測量參數。
12、在一些實施例中,所述測量模型還包括第三參數測量網絡;
13、在所述將所述單幀幾何測量結果和所述多幀幾何測量結果拼接之前,所述視覺圖像檢測方法還包括:
14、根據所述第三參數測量網絡從至少一組相鄰兩幀的通用特征圖之間提取用于采集所述單目多幀圖像的圖像采集設備的外參;
15、所述將所述單幀幾何測量結果和所述多幀幾何測量結果拼接,得到拼接結果,包括:
16、將所述單幀幾何測量結果、所述圖像采集設備的外參和所述多幀幾何測量結果拼接,得到拼接結果。
17、在一些實施例中,所述預訓練模型通過如下方式進行訓練:
18、獲取無對象幾何標簽的待訓練單目多幀圖像;
19、預設自監督學習模型;
20、根據所述無對象幾何標簽的待訓練單目多幀圖像訓練所述自監督學習模型,得到訓練完成的預訓練模型。
21、在一些實施例中,所述自監督學習模型包括卷積神經網絡和自監督學習網絡;所述根據所述無對象幾何標簽的待訓練單目多幀圖像訓練所述自監督學習模型,得到訓練完成的預訓練模型,包括:
22、將無對象幾何標簽的待訓練單目多幀圖像輸入至所述卷積神經網絡中,得到所述卷積神經網絡輸出圖像的深度特征;
23、通過圖像柵格計算從所述無對象幾何標簽的待訓練單目多幀圖像中提取圖像的像元特征;
24、融合所述圖像的深度特征和所述圖像的像元特征,得到融合后特征圖;
25、通過所述融合后特征圖訓練所述自監督學習網絡,得到訓練完成的預訓練模型。
26、在一些實施例中,所述視覺圖像檢測方法還包括:
27、根據所述相對幾何測量參數對所述絕對幾何測量參數進行修正,得到待測對象的幾何測量參數。
28、在一些實施例中,所述測量模型是基于訓練好的初始測量模型并通過如下步驟得到:
29、將有對象幾何標簽的待訓練單目多幀圖像輸入至所述初始測量模型中,得到所述初始測量模型輸出的第一幾何測量參數;
30、將有對象幾何標簽的待訓練單目多幀圖像輸入至預設的輕量化視覺測量小模型中,得到所述輕量化視覺測量小模型輸出的第二幾何測量參數;
31、根據所述第一幾何測量參數、所述第二幾何測量參數和所述對象幾何標簽,對所述初始測量模型進行調優,蒸餾得到測量模型。
32、為實現上述目的,本公開實施例的第二方面提出了一種圖像測量模型的訓練方法,所述圖像測量模型的訓練方法包括如下步驟:
33、根據測量模型從單目多幀圖像中提取待測對象的幾何測量參數;其中,所述測量模型是通過以下步驟訓練得到的:
34、通過將具有對象幾何標簽的待訓練單目多幀圖像輸入預設的預訓練模型中,得到所述預訓練模型輸出每一幀的通用特征圖;
35、預設一個初始測量模型,將多幀通用特征圖輸入至所述初始測量模型中,以根據所述初始測量模型從每一幀的通用特征圖中提取對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取對象的多幀幾何測量結果,并根據所述單幀幾何測量結果和所述多幀幾何測量結果提取對象于單幀中不同深度的絕對幾何測量參數和對象于相鄰幀中的相對幾何測量參數,根據所述絕對幾何測量參數、所述相對幾何測量參數和對象幾何標簽對所述初始測量模型進行調優,蒸餾得到測量模型對象幾何標簽。
36、為實現上述目的,本公開實施例的第三方面提出了一種視覺圖像檢測裝置,所述視覺圖像檢測裝置包括:
37、通用特征提取單元,用于將單目多幀圖像輸入至預設的預訓練模型中,得到所述預訓練模型輸出每一幀的通用特征圖;
38、模型調優單元,用于將所述通用特征圖輸入預設的測量模型,以使測量模型從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,并根據所述單幀幾何測量結果和所述多幀幾何測量結果提取待測對象于單幀中不同深度的絕對幾何測量參數和待測對象于相鄰幀中的相對幾何測量參數。
39、為實現上述目的,本公開實施例的第四方面提出了一種電子設備,包括至少一個存儲器;本文檔來自技高網...
【技術保護點】
1.一種視覺圖像檢測方法,其特征在于,所述視覺圖像檢測方法包括以下步驟:
2.根據權利要求1所述的視覺圖像檢測方法,其特征在于,所述測量模型包括第一參數測量網絡和第二參數測量網絡;所述從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,并根據所述單幀幾何測量結果和所述多幀幾何測量結果提取待測對象于單幀中不同深度的絕對幾何測量參數和待測對象于相鄰幀中的相對幾何測量參數,包括:
3.根據權利要求2所述的視覺圖像檢測方法,其特征在于,所述測量模型還包括第三參數測量網絡;
4.根據權利要求1所述的視覺圖像檢測方法,其特征在于,所述預訓練模型通過如下方式進行訓練:
5.根據權利要求4所述的視覺圖像檢測方法,其特征在于,所述自監督學習模型包括卷積神經網絡和自監督學習網絡;所述根據所述無對象幾何標簽的待訓練單目多幀圖像訓練所述自監督學習模型,得到訓練完成的預訓練模型,包括:
6.根據權利要求1所述的視覺圖像檢測方法,其特征在于,所述視覺圖像檢測方法還包括:
8.一種圖像測量模型的訓練方法,其特征在于,所述圖像測量模型的訓練方法包括如下步驟:
9.一種視覺圖像檢測裝置,其特征在于,所述視覺圖像檢測裝置包括:
10.一種電子設備,其特征在于,包括:
11.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令用于使計算機執行:
...【技術特征摘要】
1.一種視覺圖像檢測方法,其特征在于,所述視覺圖像檢測方法包括以下步驟:
2.根據權利要求1所述的視覺圖像檢測方法,其特征在于,所述測量模型包括第一參數測量網絡和第二參數測量網絡;所述從每一幀的通用特征圖中提取待測對象的單幀幾何測量結果,從至少一組相鄰兩幀的通用特征圖之間提取待測對象的多幀幾何測量結果,并根據所述單幀幾何測量結果和所述多幀幾何測量結果提取待測對象于單幀中不同深度的絕對幾何測量參數和待測對象于相鄰幀中的相對幾何測量參數,包括:
3.根據權利要求2所述的視覺圖像檢測方法,其特征在于,所述測量模型還包括第三參數測量網絡;
4.根據權利要求1所述的視覺圖像檢測方法,其特征在于,所述預訓練模型通過如下方式進行訓練:
5.根據權利要求4所述的視覺圖像檢測方法,其特征在于,所述自監督學...
【專利技術屬性】
技術研發人員:夏修理,張興,王偉,李鵬,陳宇,童超,高賀,郭勇,武心剛,
申請(專利權)人:華潤數字科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。