"/>
【技術實現步驟摘要】
一種基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法
[0001]本專利技術屬于圖像目標檢測領域,具體涉及一種基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法。
技術介紹
[0002]隨著深度學習技術的深入發展和日漸成熟,深度學習技術在人臉識別、語音識別、自然語言處理、無人駕駛等領域都作出了巨大的貢獻,極大地便利了人類的生活。餐飲行業也不例外的在深度學習技術的加持下實現菜品的自動識別、自動計價、營養分析等更加便利的功能,極大地減少了收銀員的工作負擔、提高收銀效率、較少了顧客排隊和等待的時長。深度學習方法與通過餐盤底部內嵌RFID射頻芯片等類似的借助硬件輔助而實現的菜品識別方法相比具有高效、經濟、易遷移的絕對優勢。從目前來看,使用深度學習方法實現菜品識別功能的技術主要包括兩類:One
?
Stage方法和Two
?
Stage方法。
[0003]One
?
Stage方法直接通過主干網絡提取特征來同時預測物體的位置和類別。常見的One
?
Stage算法有YOLO系列和SSD算法。Two
?
Stage方法將檢測分為兩步,主要思想是先通過卷積神經網絡生成一系列的目標區域候選區域,即區域建議,然后對這些目標候選區域進行分類和回歸,代表算法有R
?
CNN、Fast R
?
CNN等。
[0004]通過對餐飲行業的充分調研和分析后發現,某一個快餐 ...
【技術保護點】
【技術特征摘要】
1.一種基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法,其特征在于,包括:S1、獲取通過俯拍得到的快餐菜品圖像數據集,數據集中的每一張菜品圖像中包含餐盤以及放置于餐盤上通過碗碟盛放的至少一個菜品;對數據集中的每一張菜品圖像的四個邊界進行外擴填充,并對填充后的菜品圖像進行數據增強處理;S2、對經過S1中數據增強后的數據集中每張菜品圖像進行菜品邊界框的標注,將菜品邊界框的中心點、菜品邊界框的長度和寬度、菜品類型以及邊界框旋轉角度作為標注標簽;S3、利用帶有標注標簽的數據集訓練LR
?
CenterNet網絡模型,直至網絡收斂后,得到快餐菜品檢測模型;所述LR
?
CenterNet網絡模型以CenterNet網絡為基礎,將CenterNet網絡中提取特征的主干網絡替換為MobileNet
?
V3網絡,同時在CenterNet網絡原有的分別用于預測關鍵點熱力圖、預測框高度和寬度尺寸、預測框中心點偏置的三個回歸分支之外增加第四個回歸分支,通過第四個回歸分支輸出預測框旋轉角度;訓練LR
?
CenterNet網絡模型的總損失函數為CenterNet網絡原有的三個損失項與預測框旋轉角度損失的加權和,且預測框旋轉角度損失采用L1損失;S4、將待檢測的快餐菜品圖像輸入所述快餐菜品檢測模型中,輸出菜品邊界框的中心點、菜品邊界框的長度和寬度、菜品類型、以及邊界框旋轉角度,從而確定圖像中的菜品所在位置。2.如權利要求1所述的基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法,其特征在于,所述快餐菜品圖像通過高拍儀進行俯拍。3.如權利要求1所述的基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法,其特征在于,對數據集中的菜品圖像進行外擴填充時,菜品圖像的上下左右四個邊界分別向外填充的像素寬度應當保證斜向標注的菜品邊界框不會超出填充后的圖像范圍。4.如權利要求3所述的基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法,其特征在于,菜品圖像的上下左右四個邊界分別向外填充70~100像素。5.如權利要求1所述的基于LR
?
CenterNet的快餐菜品旋轉目標檢測方法,其特征在于,所述數...
【專利技術屬性】
技術研發人員:劉俊,張俊峰,李萬清,李棖,柳佳樂,陳超強,唐瑩,
申請(專利權)人:紹興數鴻科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。