• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    圖像引導的視頻語義對象分割方法及裝置制造方法及圖紙

    技術編號:15691999 閱讀:118 留言:0更新日期:2017-06-24 05:39
    本發明專利技術涉及一種圖像引導的視頻語義對象分割方法及裝置,根據給定語義類別,在樣本圖像中定位目標對象,得到對象樣例;對輸入視頻中每幀圖像進行候選區域的提取;根據對象樣例,將每幀中所提取的多個候選區域與對象樣例進行匹配,得到每個候選區域的相似度分數;對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;對選出的高分候選區域進行前景與背景的初始分割處理;基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解優化函數得到最優候選區域集合;將最優候選區域對應的初始前景分割傳播到整個視頻,得到輸入視頻的語義對象分割。

    Image guided video semantic object segmentation method and device

    The present invention relates to a method and apparatus for dividing a video semantic object image guidance, according to the semantic category, the target location in the sample image, get the object sample; extract candidate regions in each frame image of input video object; according to the sample, to match multiple candidate regions and objects extracted per sample in the frame, each candidate region similarity scores to rank; each candidate region in each frame similarity scores, which meets the preset number of candidate regions, the similarity scores from high to low score candidate regions; initial foreground and background of the selected high candidate region segmentation; consistency and prospect the background after the initial segmentation and ambiguity of the two constraint conditions based on the initial segmentation of the candidate region after construction optimization function, solving the optimization function The optimal candidate region set is obtained, and the initial foreground segmentation is propagated to the whole video, and then the semantic object segmentation of the input video is obtained.

    【技術實現步驟摘要】
    圖像引導的視頻語義對象分割方法及裝置
    本專利技術涉及計算機視覺與多媒體分析領域,尤其涉及一種圖像引導的視頻語義對象分割方法及裝置。
    技術介紹
    隨著計算機視覺、多媒體分析技術的發展,以直觀形象為特征的多媒體信息資源日益豐富且深受社會大眾的喜愛,如何高效地從視頻信息中定位并分割出需要的視頻資源亦成為了研究熱點。視頻語義對象分割是一種針對特定語義類別,從輸入視頻中定位并分割出屬于該類別對象的視頻像素的技術。該技術可應用于大規模互聯網分析,影視制作中的視頻編輯,以及基于視頻的三維建模等。目前的視頻語義對象分割方法主要為參數化方法,所謂參數化方法,就是在視頻中對對象的所處位置進行一一標注,并收集大量已經標注了對象位置或對象輪廓的圖像視頻,從中學習出一個統一的、由參數作為表達形式的視覺模型,并將該視覺模型應用于輸入的測試視頻,基于該學習得到的視覺模型對該測試視頻中的目標對象進行對象分割。例如,美國喬治亞理工大學的Kundu等人提出了基于特征空間優化的視頻語義對象分割方法,該參數化方法通過大量精確標注的視頻幀學習卷積神經網絡得到視覺模型。美國密西根大學的Lei等人于2016年提出了機器學習模型遞歸時域深度場(RecurrentTemporalDeepField),并應用于視頻語義對象分割。然而,這類參數化的方法存在以下問題:一方面,采用參數化方法需要對大量的圖像進行精確標注得到訓練樣本,因此訓練樣本的收集過程較為困難且耗時較長;另一方面,訓練得到的參數模型難以根據新增加的圖像進行高效地更新和迭代,因此對于視覺資源的動態增長的適應性不好。例如,若在已有的視覺系統中增加新的訓練樣本或者語義類別,采用參數化方法則需要重新訓練視覺模型,而該模型的訓練過程是耗時耗力的,對于現代的機器學習模型,可能需要數天甚至數周的時間。
    技術實現思路
    本專利技術提供一種圖像引導的視頻語義對象分割方法及裝置,該方法屬于非參數化的視頻語義對象分割方法,基于僅標注了語義類別標簽的樣本圖像集合得到對象樣例,并根據該對象樣例對輸入的視頻進行語義對象分割。相比現有技術中的參數化方法,本專利技術能夠充分利用互聯網上廣泛存在的弱標注圖像集,不需要像參數化方法那樣對訓練樣本進行精確標注;通過建立輸入視頻與圖像集的匹配,定位視頻語義對象,省略了對視覺模型的訓練過程,還能夠支持圖像集的動態增長,簡單且高效地實現對視頻的語義對象分割。本專利技術提供一種圖像引導的視頻語義對象分割方法,包括:根據給定的語義類別,在樣本圖像中定位出與所述語義類別對應的目標對象,得到對象樣例;對輸入視頻中的每幀圖像進行候選區域的提取;根據所述對象樣例,將每幀中所提取的多個候選區域與所述對象樣例進行匹配處理,得到每個候選區域的相似度分數;對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;對選出的所述高分候選區域進行前景與背景的初始分割處理;基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解所述優化函數得到最優的候選區域集合;將所述最優的候選區域對應的初始前景分割傳播到整個視頻,得到所述輸入視頻的語義對象分割。本專利技術還提供一種圖像引導的視頻語義對象分割裝置,包括:定位模塊,用于根據給定的語義類別,在樣本圖像中定位出與所述語義類別對應的目標對象,得到對象樣例;提取模塊,用于對輸入視頻中的每幀圖像進行候選區域的提取;匹配模塊,用于根據所述對象樣例,將每幀中所提取的多個候選區域與所述對象樣例進行匹配處理,得到每個候選區域的相似度分數;排序模塊,用于對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;處理模塊,用于對選出的所述高分候選區域進行前景與背景的初始分割處理;計算模塊,用于基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解所述優化函數得到最優的候選區域集合;傳播模塊,用于將所述最優的候選區域對應的初始前景分割傳播到整個視頻,得到所述輸入視頻的語義對象分割。本專利技術的圖像引導的視頻語義對象分割方法及裝置,通過根據給定的語義類別,在樣本圖像中定位出與所述語義類別對應的目標對象,得到對象樣例;對輸入視頻中的每幀圖像進行候選區域的提取;根據對象樣例,將每幀中所提取的多個候選區域與對象樣例進行匹配處理,得到每個候選區域的相似度分數;對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;對選出的高分候選區域進行前景與背景的初始分割處理;基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解優化函數得到最優的候選區域集合;將最優的候選區域對應的初始前景分割傳播到整個視頻,得到輸入視頻的語義對象分割。該方案無需訓練視覺模型,充分利用互聯網上廣泛存在的弱標注圖像代替以往方法所需的精確標注的訓練樣本,從而省略了模型的訓練過程,能較好地支持圖像集合的動態增長,高效且準確地得到視頻資源的語義對象分割結果。附圖說明圖1為本專利技術一示例性實施例示出的圖像引導的視頻語義對象分割方法的流程示意圖;圖2a、圖2b為圖1所示實施例的對象樣例的示意圖;圖3為圖1所示實施例的視頻幀的示意圖;圖4為本專利技術另一示例性實施例示出的圖像引導的視頻語義對象分割方法的流程示意圖;圖5為本專利技術一示例性實施例示出的圖像引導的視頻語義對象分割裝置的結構示意圖。具體實施方式為使本專利技術實施例的目的、技術方案和優點更加清楚,下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。圖1為本專利技術一示例性實施例示出的圖像引導的視頻語義對象分割方法的流程示意圖,如圖1所示,本實施例示出的圖像引導的視頻語義對象分割方法,包括:步驟101、根據給定的語義類別,在樣本圖像中定位出與語義類別對應的目標對象,得到對象樣例。具體的,根據事前給定的語義類別,在包含該語義類別對象的大量圖像中共定位出目標對象,從而構造得到對象樣例。如在圖2a、圖2b所示的圖像中,假定語義類別為“牛”,則根據語義類別“牛”在圖2a和圖2b的樣本圖像中分別對“牛”的目標對象進行定位,定位后的結果分別如圖2a和圖2b中的矩形框所示,需要注意的是,此處,定位得到的對象樣例雖然是根據語義類別“牛”進行的定位,但是有可能定位得到的結果是錯誤的,例如圖2b中,“牛”的圖像被錯誤定位到了“樹”的圖像。其中,定位目標圖像的方法可以采用現有技術中的共定位方法,如2015年法國國家信息與自動化研究所、巴黎高等工程學院與法國國家科學研究中心的聯合WILLOW實驗室的Cho等人所提出的“概率哈夫匹配”(ProbabilisticHoughMatching)共定位算法。該算法首先從每幅圖像中提取大量候選矩形區域,然后計算每個矩形區域的“共顯著性”(Co-Saliency),并在每幅圖像中選取共顯著性最高的區域作為對象樣例。該過程是完全自動的,因此存在對本文檔來自技高網
    ...
    圖像引導的視頻語義對象分割方法及裝置

    【技術保護點】
    一種圖像引導的視頻語義對象分割方法,其特征在于,包括:根據給定的語義類別,在樣本圖像中定位出與所述語義類別對應的目標對象,得到對象樣例;對輸入視頻中的每幀圖像進行候選區域的提取;根據所述對象樣例,將每幀中所提取的多個候選區域與所述對象樣例進行匹配處理,得到每個候選區域的相似度分數;對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;對選出的所述高分候選區域進行前景與背景的初始分割處理;基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解所述優化函數得到最優的候選區域集合;將所述最優的候選區域對應的初始前景分割傳播到整個視頻,得到所述輸入視頻的語義對象分割。

    【技術特征摘要】
    1.一種圖像引導的視頻語義對象分割方法,其特征在于,包括:根據給定的語義類別,在樣本圖像中定位出與所述語義類別對應的目標對象,得到對象樣例;對輸入視頻中的每幀圖像進行候選區域的提取;根據所述對象樣例,將每幀中所提取的多個候選區域與所述對象樣例進行匹配處理,得到每個候選區域的相似度分數;對每幀中各個候選區域的相似度分數進行排序,選出滿足預設候選區域個數的、相似度分數由高到低的高分候選區域;對選出的所述高分候選區域進行前景與背景的初始分割處理;基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解所述優化函數得到最優的候選區域集合;將所述最優的候選區域對應的初始前景分割傳播到整個視頻,得到所述輸入視頻的語義對象分割。2.根據權利要求1所述的方法,其特征在于,所述根據所述對象樣例,將每幀中所提取的多個候選區域與所述對象樣例進行匹配處理,得到每個候選區域的相似度分數,包括:在所述對象樣例中,確定與每幀中的每個候選區域外觀相似的圖像區域;確定所述圖像區域在所述對象樣例的樣本圖像中的相對坐標和尺寸參數;保持所述相對坐標和尺寸參數,在所述輸入視頻的對應幀中構造一個新的對象區域;根據構造的所述新的對象區域為每一個所述候選區域評分,得到每個候選區域的相似度分數。3.根據權利要求1所述的方法,其特征在于,所述對選出的所述高分候選區域進行前景與背景的初始分割處理,包括:對所述高分候選區域內的每個超像素的前景與背景的概率值進行計算,得到所有超像素的前景概率所構成的初始前景分割向量以及背景概率所構成的初始背景分割向量。4.根據權利要求3所述的方法,其特征在于,所述基于初始分割后前景與背景的一致性和無二義性約束條件,對初始分割處理后的候選區域構建優化函數,求解所述優化函數得到最優的候選區域集合,包括:對所述輸入視頻構建第一超像素圖,將所述初始前景分割向量與所述初始背景分割向量沿著所述第一超像素圖傳播至整個所述輸入視頻,得到傳播后的前景和背景分割向量;根據所述傳播后的前景和背景分割向量,構造分割的一致性約束項和無二義性約束項,形成所述優化函數;基于貪婪算法,對所述優化函數進行求解,得到最優的候選區域集合。5.根據權利要求1所述的方法,其特征在于,所述將所述最優的候選區域對應的初始前景分割傳播到整個視頻,得到所述輸入視頻的語義對象分割,包括:根據給定的視頻幀數,給定的每幀上的所述高分候選區域的個數,在所述高分候選區域中選取候選區域,得到精選候選區域集合;其中,所述精選候選區域集合中包含有所述給定的視頻幀數與所述給定的每幀上的所述高分候選區域的個數的乘積個高分候選區域;對選取的所述精選候選區域集合建立第二超像素圖,采用隨機游走算法將所述精選候選區域集合中候選區域對應的初始前景分割沿所述第二超像素圖傳播,得到傳播后的前景概率分布;以所述傳播后的前景概率分布作為初始分布,在所述輸入視頻的所述第一超像素圖上基于所述隨機游走算法進行二次傳播,得到最終的超像素前景...

    【專利技術屬性】
    技術研發人員:陳小武張宇李甲滕煒宋昊坤趙沁平
    申請(專利權)人:北京航空航天大學
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕乱码人妻无码久久 | 日韩精品无码区免费专区| 成人毛片无码一区二区| 狠狠躁夜夜躁无码中文字幕| 一夲道无码人妻精品一区二区| 99精品国产在热久久无码| 国产精品成人无码免费| 免费A级毛片无码视频| 亚洲人成无码www久久久| 亚洲成无码人在线观看| 亚洲AV无码乱码在线观看牲色| 人妻精品久久无码专区精东影业| 亚洲av无码国产精品色在线看不卡| 日韩精品人妻系列无码专区| 免费a级毛片无码a∨性按摩| 中文字幕无码高清晰| 国产亚洲精品无码成人| 精品久久久无码中文字幕天天| 97免费人妻无码视频| 久久久久亚洲AV无码专区首| 国产成人无码a区在线观看视频免费 | 午夜无码国产理论在线| 国产精品无码免费专区午夜| 亚洲av无码成人精品国产| 无码人妻久久一区二区三区免费| 国产成人无码区免费A∨视频网站 国产成人无码午夜视频在线观看 国产成人无码精品一区不卡 | 影音先锋中文无码一区| 国产成人无码18禁午夜福利p | 成人免费无码H在线观看不卡| 亚洲AV无码之国产精品| 日日摸夜夜添无码AVA片| 日韩精品无码专区免费播放| 国产色综合久久无码有码| 国产成人无码av在线播放不卡| 亚洲大尺度无码无码专线一区| 91精品无码久久久久久五月天| 人妻无码αv中文字幕久久 | 中文字幕无码无码专区| 亚洲中文字幕无码专区| 在线精品自拍无码| 韩日美无码精品无码|