提供一種用于識別媒體內容中的對象的方法。捕獲管理器確定在裝置處檢測內容流中的一個或多個對象。下面,捕獲管理器確定捕獲所述內容流中的一個或多個對象的一個或多個表征。接著,捕獲管理器將所述一個或多個表征與所述內容流的一個或多個實例關聯。
【技術實現步驟摘要】
【國外來華專利技術】用于識別媒體內容中的對象的方法和裝置
技術介紹
服務提供商和設備制造者(例如無線、蜂窩等)不斷面臨著挑戰以例如通過提供有競爭力的網絡服務向消費者提供價值和便利。開發的一個領域是使用用于自動化識別媒體內容中的臉部、人物和其他對象或特征(例如,識別表情,例如面部表情、體態、移動、話音、聲音等),所述媒體內容例如圖像、視頻流以及音頻流。例如,許多現代化通信設備(例如,智能電話、手機等)通常配置有照相機和其他傳感器(例如,麥克風),使得設備在捕獲的內容上執行此類的識別(例如,面部、話音、表情識別等)。然而,這些設備通常使用用于面部和/或對象識別的常規方法,這些常規方法傳統上致力于在某些條件下(例如,噪聲、變化的表情、壞的角度、差的照明、低分辨率圖像或聲音等)準確地執行。相應地,服務提供商和設備制造商面臨改進面部和/或對象識別的準確性的顯著技術挑戰。一些示例實施例因此,需要一種方式來有效地和高效地識別媒體內容中的面部、對象和其他特征。根據一個實施例,一種方法包括:確定在裝置處檢測內容流中的一個或多個對象。該方法還包括確定捕獲所述內容流中的一個或多個對象的一個或多個表征。該方法進一步包括將所述一個或多個表征與所述內容流的一個或多個實例關聯。根據另一實施例,一種設備包括:至少一個處理器;以及包括計算機程序代碼的至少一個存儲器,該至少一個存儲器和該計算機程序代碼配置成使用該至少一個處理器,至少部分地促使該設備確定在裝置處檢測內容流中的一個或多個對象。還促使該設備確定捕獲所述內容流中的一個或多個對象的一個或多個表征。進一步促使該設備將所述一個或多個表征與所述內容流的一個或多個實例關聯。根據另一實施例,一種計算機可讀存儲介質,其承載一個或多個指令的一個或多個序列,當由一個或多個處理器執行時,該一個或多個指令至少部分地促使設備確定在裝置處檢測內容流中的一個或多個對象。該設備還被促使確定捕獲所述內容流中的一個或多個對象的一個或多個表征。該設備進一步被促使將所述一個或多個表征與所述內容流的一個或多個實例關聯。根據另一實施例,一種設備包括:用于確定在裝置處檢測內容流中的一個或多個對象的裝置。該設備還包括用于確定捕獲所述內容流中的一個或多個對象的一個或多個表征的裝置。該設備進一步包括用于將所述一個或多個表征與所述內容流的一個或多個實例關聯的裝置。簡單地通過說明包括針對實施本專利技術所設想的最佳方式的很多特定實施例和實現,從下面的詳細描述將容易顯見本專利技術的其他方面、特征和優點。本專利技術還能夠具有其他或不同實施例,且其若干細節可以在各個明顯方面進行修改,所有這些都不偏離本專利技術的精神和范圍。因此,附圖和說明本質上是說明性而非限制性的。附圖說明通過示例而非限制性方式說明本專利技術的實施例,在附圖的各圖中:圖1是根據一個實施例的能夠識別媒體內容中的對象的系統的視圖;圖2是根據一個實施例的捕獲管理器的組件的視圖;圖3是根據一個實施例的用于識別媒體內容中的對象的過程的流程圖;圖4是根據一個實施例的用于將識別信息與內容流的多個實例關聯的過程的流程圖;圖5是根據一個實施例的用于將最佳面部表征與內容流的圖像實例關聯的過程的流程圖;圖6是根據一個實施例的用于將識別信息與圖像實例/面部表征對關聯的過程的流程圖;圖7是根據一個實施例的用于將識別信息與數據庫中的圖像實例/面部表征對關聯的過程的流程圖;圖8A-8B是根據各種實施例的在圖3的過程中捕獲的內容流的實例中的對象的表征的視圖;圖9A-9B是根據各種實施例的在圖3的過程中從不同角度捕獲的內容流的實例中的對象的表征的視圖;圖10是根據一個實施例的用于使用圖4、6和7的過程的用戶接口的視圖;圖11是可以用于實施本專利技術的一個實施例的硬件的視圖;圖12是可以用于實施本專利技術的一個實施例的芯片組的視圖;以及圖13是可以用于實施本專利技術的一個實施例的移動終端(例如手機)的視圖。具體實施方式公開了用于識別媒體內容中的對象的方法、設備和計算機程序的示例。在下面的描述中,出于解釋目的,提出了各種特定細節以提供對本專利技術的實施例的徹底理解。然而,對于本領域技術人員而言,很明顯的是可以不使用這些特定細節或可以使用等同布置來實現本專利技術的實施例。在其他實例中,以框圖形式示出已知結構和裝置,以避免不必要地混淆本專利技術的實施例。圖1是根據一個實施例的能夠識別媒體內容中的對象的系統的視圖。如前所提到的,例如面部或話音識別的識別方法已經開發了數年。作為該開發的結果,識別方法已經變得更為復雜和準確。例如,通過分析例如眼睛、鼻子和嘴的臉部顯著特征,以及到關鍵面部特征的相對距離,面部識別方法已經被擴展到識別面部表情。附加地,話音和語音識別方法已經從識別語音擴展到識別有聲表達,例如笑聲和哭聲,以及通常的周圍或背景噪聲(例如、交通、來自聚會的聲音等)。然而,如前所指出,識別方法仍努力于在某些條件下(例如,噪聲、變化的表情、壞的角度、差的照明、低分辨率圖像或聲音等)執行,這使得識別不會最優或者有時不準確。此外,傳統的識別方法通常操作在捕獲內容的特定實例上(例如,場景的單次捕獲的照片),由此通常依賴于特定實例的識別條件上。作為結果,在與捕獲實例中的識別主體(例如,對象或臉部,也統稱為對象)關聯的條件對于識別不夠理想的情況下,傳統的識別方法可能無法準確地識別對象。例如,當臉部遠離、方位不直接對著捕獲裝置(例如,照相機、攝像機等),受陰影遮蔽等,當圖像被捕獲時,面部識別可以產生不準確的結果。為解決該問題,圖1的系統100引入了存儲對象的最佳表征或將對象的最佳表征與對象的相應捕獲實例(例如,照片、音頻記錄、視頻記錄等)關聯的能力。在一個實施例中,這些最佳表征(例如,在更適合于例如當臉正直視照相機時執行對象識別的條件下捕獲的表征)可以作為元數據附接到捕獲的實例。在另一個實施例中,當應用或其他服務試圖在捕獲的實例上執行對象識別時,對象的附接或關聯的最佳表征可以識別為替換捕獲實例中的實際對象。例如,在其中當捕獲的實例是包含一個或多個臉部的相片時,臉部的一個或多個最佳表征可以附接到每個相片。通過這種方式,臉部可以被自動地識別,即使臉部例如從照相機轉開或否則不清楚。更具體地,系統100在內容流的實例(例如,相片、音頻記錄、視頻記錄等)被捕獲之前、之后和/或同時檢測內容流中的對象。例如,內容流表征連續地或基本上連續地在捕獲設備處接收到的內容,例如在照相機的取景器處接收到的圖像或在打開的麥克風處接收到的音頻。一旦在內容流中檢測到對象,系統100可以隨關于對象改變的情形(例如,人員走來走去,臉部轉離照相機、照明改變等)來持續跟蹤對象。并發地,系統100捕獲內容流中的對象的表征(例如,連續地或周期性地)。在一個實施例中,系統100可以在內容流的實例被捕獲之前、之后和/或同時來捕獲對象的表征。在另一個實施例中,當用戶發起對包括對象的內容流的特定實例的捕獲時(例如,當激勵照相機上的快門以拍攝相片時),跟蹤的對象信息,以及對象的最佳表征的相應一個或多個可以與捕獲的實例關聯或標記到捕獲的實例。在一些實施例中,跟蹤信息包括標識至少在捕獲實例內的對象的相對位置的信息,由此使得系統100能夠將對象的最佳表征與捕獲的實例內的對象的位置關聯。如上所指出,對于作為實例的一部分本文檔來自技高網...

【技術保護點】
【技術特征摘要】
【國外來華專利技術】2010.08.23 US 12/861,6031.一種用于識別媒體內容中的對象的方法,包括:確定在裝置處檢測內容流中的一個或多個對象;確定捕獲所述內容流中的所述一個或多個對象的一個或多個表征;以及將所述一個或多個表征與所述內容流的一個或多個實例關聯;其中在捕獲所述內容流的實例之前、之后和/或同時捕獲所述一個或多個表征中的一個或多個。2.根據權利要求1所述的方法,進一步包括:確定捕獲所述內容流中的所述一個或多個對象的一個或多個其他表征;至少部分基于一個或多個準則來選擇所述一個或多個表征或所述一個或多個其他表征以與所述一個或多個實例關聯。3.根據權利要求2所述的方法,其中持續地、周期性地或在預定的調度處捕獲所述一個或多個表征或所述一個或多個其他表征,直到所述一個或多個表征或一個或多個其他表征滿足預定的質量閾值。4.根據權利要求1-3的任意一項所述的方法,進一步包括:至少部分地基于所述一個或多個表征來確定所述一個或多個對象的識別信息;以及將所述識別信息與所述一個或多個實例關聯。5.根據權利要求4所述的方法,其中確定所述識別信息進一步至少部分地基于在所述裝置、另一個裝置、服務器、網絡組件或者其組合處可獲得的資源。6.根據權利要求4所述的方法,其中關聯一個或多個表征包括:確定將所述一個或多個表征存儲為所述一個或多個實例中的元數據,存儲為鏈接到所述一個或多個實例的存儲器中的元數據,或者其組合。7.根據權利要求4所述的方法,進一步包括:將所述一個或多個表征與各自的時間戳關聯;以及至少部分地基于所述時間戳將所述一個或多個表征與所述一個或多個其他實例關聯。8.根據權利要求4所述的方法,進一步包括:從一個或多個其他裝置、一個或多個其他內容流或者其組合接收所述一個或多個表征的至少一個表征。9.根據權利要求4所述的方法,其中所述一個或多個表征對應于所述一個或多個對象的一個或多個特性。10.根據權利要求4所述的方法,其中所述內容流是直播視頻流,并且所述一個或多個實例是圖像、視頻、音頻記錄或其組合。11.一種用于識別媒體內容中的對象的設備,包括:至少一個處理器;以及至少一個存儲器,其包括用于一個或多個程序的計算機程序代碼,所述至少一個存儲器和計算機程序代碼配置成利用所述至少一個處理器,使得所述設備執行至少以下:確定在裝置處檢測內容流中的一個或多個對象;確定捕獲所述內容流中的所述一個或多個對象的一個或多個表征;以及將所述一個或多個表征與所述內容流的一個或多個實例關聯;其中在捕獲所述內容流的實例之前、之后和/或同時捕獲所述一個或多個表征中的一個或多個。12.根據權利要求11所述的設備,其中進一步使得所述設備:確定捕獲所述...
【專利技術屬性】
技術研發人員:I·T·薩爾米南,M·A·尼爾米,
申請(專利權)人:諾基亞公司,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。