【技術實現步驟摘要】
本專利技術屬于邊緣設備的視覺slam(vslam)應用領域,涉及一種基于誤差優化的關鍵幀選擇方法和裝置。
技術介紹
0、技術背景
1、視覺slam(simultaneous?localization?and?mapping)是一種用于實現機器或機器人同時定位和地圖構建的技術。它通過從傳感器(通常是攝像頭)收集的信息,以及運動和環境感知算法的結合,實現在未知環境中同時確定設備的位置并創建地圖。視覺slam技術在許多領域都有廣泛應用,包括機器人導航、虛擬現實、增強現實、自動駕駛和工業自動化等。
2、邊緣設備在執行vslam局部地圖構建的同時,也需將高質量視頻傳輸至直播服務器,供用戶觀看。然而,邊緣設備有限的網絡資源難以同時滿足這兩項任務的要求。在網絡資源受限的情況下,通常會優先確保視頻直播的流暢性,因為這直接影響用戶的交互體驗;并限制了slam建圖可用的網絡資源。
3、面對網絡資源受限的問題,現有研究提出了一些關鍵幀選擇算法。關鍵幀選擇算法是在視頻壓縮、視頻摘要生成、視頻檢索,人機交互等應用中常用的技術,它能夠從視頻序列中選擇出一些關鍵幀,以代表整個視頻內容。這有助于降低存儲和傳輸成本,同時保留視頻的關鍵信息。現有研究提出一種基于時間間隔的策略來選擇關鍵幀,通過固定的時間間隔選擇一定數量的關鍵幀,例如每隔1秒選擇一幀,本質上其實是減少了關鍵幀。這種策略簡單直觀,適用于不需要考慮內容變化的情況。可以通過計算當前幀與前一幀之間的差異來度量內容變化程度,選擇差異較大的幀作為關鍵幀。但是由于關鍵幀的減少,
技術實現思路
1、為了克服在vslam執行地圖構建任務時,由于關鍵幀減少,導致地圖構建精度降低,進而引起較大誤差的問題,本專利技術提供了一種面向邊緣設備的視覺slam關鍵幀選擇方法和裝置。
2、該方法在設定關鍵幀上限的前提下,通過對地圖估計誤差的建模和量化,選取估計誤差最低的關鍵幀組合進行地圖構建,應用貪心算法尋找近似最優解。本專利技術的第一個方面涉及一種面向邊緣設備的視覺slam關鍵幀選擇方法,包括如下步驟:
3、步驟s1:對地圖估計誤差進行建模,建立一個誤差模型,用于描述邊緣設備在執行slam任務中相機位姿估計的誤差,該誤差模型能夠考慮邊緣設備的計算和存儲資源限制;
4、步驟s2:量化地圖估計誤差,并將關鍵幀選擇問題轉化為最小化測量噪聲的問題,將問題簡化為可解的形式;
5、步驟s3:將關鍵幀選擇問題轉化為近似子模問題,利用已有的優化算法來尋找最優解;
6、步驟s4:應用貪心算法尋找近似最優解,貪心算法通過每次選擇局部最優解來逐步構建全局最優解,從而在有限的計算資源下有效地解決關鍵幀選擇問題。
7、可選地,所述對地圖估計誤差進行建模,建立誤差模型其中pn表示地圖估計誤差,pn=(x,y,z,wx,wy,wz)表示一個相機在n點的位置與姿態,表示特征點pn的最大似然估計值,n∈k,k表示地圖跟蹤模塊生成的候選關鍵幀對應的相機點位集合。
8、可選地,所述量化地圖估計誤差,將求解任意兩點間估計誤差的最小值轉化為求解最小噪聲,計算方式為δe=pm-pn+xe,其中δe表示slam地圖中任意兩點n,m之間的相對噪聲,xe表示邊e=(m,n)上的測量誤差,借助馬氏距離(mahalanobis?distance)來求解地圖空間里任意兩點的測量噪聲之和的最小值,計算方式為其中表示邊測量噪聲的極大似然估計,ie表示邊e測量誤差的信息矩陣,是估計測量噪聲關于誤差信息矩陣ie的馬氏范數。
9、可選地,所述將關鍵幀選擇問題轉化為近似子模問題,用子模函數刻畫具有“邊際增益遞減的”問題,見公式其中γ為子模比率,當γ值為1時,即可求得最優解。
10、可選地,所述應用貪心算法尋找近似最優解,本文提出一種關鍵幀選擇算法,以θ表示最小化局部地圖估計誤差可能關鍵幀集的集合,λ表示一個可能的關鍵幀集,即λ∈θ。在集合θ中,只維護h個關鍵幀集以節省計算資源,在這些維護的關鍵幀中選擇前h(h<h)個得分最高的組合以最小化估計誤差err(θ∪{k,n}),其中n∈kg,device,kg,device表示被邊緣服務器優化后并回傳到端側設備的全局地圖。當|λ|增大時,只選擇得分最高的組合,不斷嘗試λ和n的不同組合來搜索每次迭代后最小化不確定性的組合。隨著|λ|的增長,子模比γ接近1,即可求得最優解。
11、一種面向邊緣設備的視覺slam關鍵幀選擇裝置,包括存儲器和一個或多個處理器,所述存儲器中存儲有可執行代碼,所述一個或多個處理器執行所述可執行代碼時,用于實現本專利技術的面向邊緣設備的視覺slam關鍵幀選擇方法。
12、一種計算機可讀存儲介質,其上存儲有程序,該程序被處理器執行時,實現本專利技術的面向邊緣設備的視覺slam關鍵幀選擇方法。
13、與現有技術相比,本專利技術的優點是:不僅保證了地圖構建的質量,同時有效減少了數據傳輸量和時間延遲,從而在保證實時交互質量的同時,優化了slam的性能。
本文檔來自技高網...【技術保護點】
1.一種面向邊緣設備的視覺SLAM關鍵幀選擇方法,其特征在于:包括如下步驟:
2.根據權利要求1所述一種面向邊緣設備的視覺SLAM關鍵幀選擇方法,其特征在于:步驟S1中所述對地圖估計誤差進行建模,包括:建立誤差模型其中pn表示地圖估計誤差,Pn=(x,y,z,wx,wy,wz)表示一個相機在n點的位置與姿態,表示特征點Pn的最大似然估計值,n∈K,K表示地圖跟蹤模塊生成的候選關鍵幀對應的相機點位集合。
3.根據權利要求1所述一種面向邊緣設備的視覺SLAM關鍵幀選擇方法,其特征在于:步驟S2中所述量化地圖估計誤差,將求解任意兩點間估計誤差的最小值轉化為求解最小噪聲,計算方式為Δe=Pm-Pn+xe,其中Δe表示SLAM地圖中任意兩點n,m之間的相對噪聲,Xe表示邊e=(m,n)上的測量誤差,借助馬氏距離(Mahalanobis?distance)來求解地圖空間里任意兩點的測量噪聲之和的最小值,計算方式為其中表示邊測量噪聲的極大似然估計,Ie表示邊e測量誤差的信息矩陣,是估計測量噪聲關于誤差信息矩陣Ie的馬氏范數。
4.根據權利要求1所述一種面向邊
5.根據權利要求1所述一種面向邊緣設備的視覺SLAM關鍵幀選擇方法,其特征在于:步驟S4中所述應用貪心算法尋找近似最優解,包括:一種關鍵幀選擇算法,以Θ表示最小化局部地圖估計誤差可能關鍵幀集的集合,Λ表示一個可能的關鍵幀集,即Λ∈Θ。在集合Θ中,只維護h個關鍵幀集以節省計算資源,在這些維護的關鍵幀中選擇前H(H<h)個得分最高的組合以最小化估計誤差Err(Θ∪{k,n}),其中n∈Kg,device,Kg,device表示被邊緣服務器優化后并回傳到端側設備的全局地圖。當|Λ|增大時,只選擇得分最高的組合,不斷嘗試Λ和n的不同組合來搜索每次迭代后最小化不確定性的組合。隨著|Λ|的增長,子模比γ接近1,即可求得最優解。
6.一種面向邊緣設備的視覺SLAM關鍵幀選擇裝置,其特征在于,包括存儲器和一個或多個處理器,所述存儲器中存儲有可執行代碼,所述一個或多個處理器執行所述可執行代碼時,用于實現權利要求1-5中任一項所述的面向邊緣設備的視覺SLAM關鍵幀選擇方法。
7.一種計算機可讀存儲介質,其特征在于,其上存儲有程序,該程序被處理器執行時,實現權利要求1-5中任一項所述的面向邊緣設備的視覺SLAM關鍵幀選擇方法。
...【技術特征摘要】
1.一種面向邊緣設備的視覺slam關鍵幀選擇方法,其特征在于:包括如下步驟:
2.根據權利要求1所述一種面向邊緣設備的視覺slam關鍵幀選擇方法,其特征在于:步驟s1中所述對地圖估計誤差進行建模,包括:建立誤差模型其中pn表示地圖估計誤差,pn=(x,y,z,wx,wy,wz)表示一個相機在n點的位置與姿態,表示特征點pn的最大似然估計值,n∈k,k表示地圖跟蹤模塊生成的候選關鍵幀對應的相機點位集合。
3.根據權利要求1所述一種面向邊緣設備的視覺slam關鍵幀選擇方法,其特征在于:步驟s2中所述量化地圖估計誤差,將求解任意兩點間估計誤差的最小值轉化為求解最小噪聲,計算方式為δe=pm-pn+xe,其中δe表示slam地圖中任意兩點n,m之間的相對噪聲,xe表示邊e=(m,n)上的測量誤差,借助馬氏距離(mahalanobis?distance)來求解地圖空間里任意兩點的測量噪聲之和的最小值,計算方式為其中表示邊測量噪聲的極大似然估計,ie表示邊e測量誤差的信息矩陣,是估計測量噪聲關于誤差信息矩陣ie的馬氏范數。
4.根據權利要求1所述一種面向邊緣設備的視覺slam關鍵幀選擇方法,其特征在于:步驟s3中所述將關鍵幀選擇問題轉化為近似子模問題,包括:用子模函數刻畫具有“邊際增益遞減...
【專利技術屬性】
技術研發人員:董瑋,高藝,王竟,段瑤光,
申請(專利權)人:杭州開物教育科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。