The present invention provides a video segmentation method, including segmentation of the target video stream, recognition of facial features the existence of face image and / or face each video scene, the video contains scenes in the face image set and the set of face images corresponding to the clothing images respectively; the face image sets and the set of garment image clustering analysis, clustering analysis results obtained when the threshold is less than a preset time, determine the video scene segmentation points for the target video stream, according to each video scene segmentation as the segmentation of the target point of the video stream. The method of direct judgment every scene segmentation of the target video is the target video segmentation, video scene will meet the conditions as the dividing point of the target video stream segmentation, does not need to set up a sample database, avoiding the need for regular updates of the sample feature database announcer the sound or video in.
【技術實現步驟摘要】
本專利技術涉及視頻處理領域,尤其涉及一種視頻分割方法和系統。
技術介紹
如今,伴隨著互聯網技術和信息技術飛速發展,為了滿足用戶多樣化的獲取新聞資訊需求,新聞視頻以其直觀,形象、生動的播放特點,收到了越來越多的用戶的歡迎。但新聞視頻中通常穿插有播音員的鏡頭,會降低用戶獲取信息的速度。專利技術人經過研究發現,現有技術中,為了獲取新聞視頻中的新聞信息,對新聞視頻中播音員鏡頭的處理方式為播音員的聲音或者播音員的圖像建立一個樣本庫,通過將新聞視頻中的每一幀視頻圖像的音頻或者影響與樣本庫比對,將匹配成功的視頻圖像作為新聞視頻的分割點,進行分割,上述的方法是基于播音員音頻或者影像的樣本庫來實現的,因此,需要定期的更新播音員的聲音或者圖像的樣本特征。
技術實現思路
有鑒于此,本專利技術提供了一種視頻分割方法,用以解決現有技術中的視頻分割方法需要定期的更新播音員的聲音或者圖像的樣本特征的問題。具體方案如下:一種視頻分割方法,其特征在于,包括:當接收到用戶對目標視頻流的分割請求時,獲取組成所述目標視頻流的每一幀視頻圖像;將所述每一幀視頻圖像轉換為預定格式的視頻圖片;按所述目標視頻流的播放順序,依次對存在相鄰關系的前后兩幀視頻圖片進行場景識別,識別出所述目標視頻流中包含的至少兩個視頻場景;按預設的識別規則,識別每一個視頻場景中是否存在人臉圖像和/或人臉的五官特征;對于任意一個存在人臉圖像和/或人臉的五官特征的視頻場景,獲取該視頻場景中包含的人臉圖片集及所述人臉圖片集對應的服裝圖片集;分別對所述人臉圖片集及所述服裝圖片集進行聚類分析,獲得聚類分析結果;并在所述聚類分析結果對應的聚類 ...
【技術保護點】
一種視頻分割方法,其特征在于,包括:當接收到用戶對目標視頻流的分割請求時,獲取組成所述目標視頻流的每一幀視頻圖像;將所述每一幀視頻圖像轉換為預定格式的視頻圖片;按所述目標視頻流的播放順序,依次對存在相鄰關系的前后兩幀視頻圖片進行場景識別,識別出所述目標視頻流中包含的至少兩個視頻場景;按預設的識別規則,識別每一個視頻場景中是否存在人臉圖像和/或人臉的五官特征;對于任意一個存在人臉圖像和/或人臉的五官特征的視頻場景,獲取該視頻場景中包含的人臉圖片集及所述人臉圖片集對應的服裝圖片集;分別對所述人臉圖片集及所述服裝圖片集進行聚類分析,獲得聚類分析結果;并在所述聚類分析結果對應的聚類值小于預設閾值時,按預設的判定規則,判定該視頻場景為所述目標視頻流的分割點;依據各個作為分割點的視頻場景對所述目標視頻流進行分割。
【技術特征摘要】
1.一種視頻分割方法,其特征在于,包括:當接收到用戶對目標視頻流的分割請求時,獲取組成所述目標視頻流的每一幀視頻圖像;將所述每一幀視頻圖像轉換為預定格式的視頻圖片;按所述目標視頻流的播放順序,依次對存在相鄰關系的前后兩幀視頻圖片進行場景識別,識別出所述目標視頻流中包含的至少兩個視頻場景;按預設的識別規則,識別每一個視頻場景中是否存在人臉圖像和/或人臉的五官特征;對于任意一個存在人臉圖像和/或人臉的五官特征的視頻場景,獲取該視頻場景中包含的人臉圖片集及所述人臉圖片集對應的服裝圖片集;分別對所述人臉圖片集及所述服裝圖片集進行聚類分析,獲得聚類分析結果;并在所述聚類分析結果對應的聚類值小于預設閾值時,按預設的判定規則,判定該視頻場景為所述目標視頻流的分割點;依據各個作為分割點的視頻場景對所述目標視頻流進行分割。2.根據權利要求1所述的方法,其特征在于,按所述目標視頻流的播放順序,依次對存在相鄰關系的前后兩幀視頻圖片進行場景識別包括:將存在相鄰關系的前后兩幀視頻圖片中的每一幀視頻圖片按預設的比例去除,得到第一圖片和第二圖片;分別將所述第一圖片和所述第二圖片均分為左右兩部分,得到第一圖片的左側部分和右側部分和第二圖片的左側部分和右側部分;分別對所述第一圖片和所述第二圖片的左側部分及所述第一圖片和所述第二圖片的右側部分進行卡方計算,得到第一卡方距離和第二卡方距離,若所述第一卡方距離和所述第二卡方距離同時滿足預設值,對所述存在相鄰關系的前后兩幀視頻圖片進行場景分割。3.根據權利要求1所述的方法,其特征在于,對于任意一個存在人臉圖像和/或人臉的五官特征的視頻場景,獲取該視頻場景中包含的人臉圖片集包括:獲取所述視頻場景中的各個人臉圖片,按預設的高度區間對所述各個人臉圖片進行分類,得到所述各個人臉圖片的分類集;依據預設的裁剪系數設定方法,確定每一個分類對應的裁剪系數;依據所述裁剪系數,對所述每一個分類中的每一張人臉圖片進行裁剪,得到所述視頻場景中包含的人臉圖片集。4.根據權利要求1所述的方法,其特征在于,對于任意一個存在人臉圖像和/或人臉的五官特征的視頻場景,獲取與所述人臉圖片集對應的服裝圖片集包括:獲取所述人臉圖片集中每一張人臉圖片的位置坐標;依據預設的優化公式,將所述位置坐標轉化為與所述每一張人臉圖片對應的服裝圖片的坐標,依據所述服裝圖片的坐標,確定所述每一張人臉圖片對應的服裝圖片,獲得與所述人臉圖片集對應的服裝圖片集。5.根據權利要求1所述的方法,其特征在于,分別對所述人臉圖片集及所述服裝圖片集進行聚類分析,獲得聚類分析結果,并在所述聚類分析結果對應的聚類值小于預設閾值時,按預設的判定規則,判定該視頻場景為所述目標視頻流的分割點包括:獲取所述人臉圖片集中任意兩張人臉圖片對應的像素矩陣,對所述像素矩陣進行聚類分析,獲得所述人臉圖片集的聚類值;將所述服裝圖片集中的任意兩張服裝圖片的張量直方圖進行聚類分析,獲得所述服裝圖片集的聚類值;當所述人臉圖片集的聚類值和所述服裝圖片集的聚類值均小于預設閾值時,按預設的判...
【專利技術屬性】
技術研發人員:徐佳宏,李益永,蘭志才,曾勇,韓濤,
申請(專利權)人:深圳市茁壯網絡股份有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。