• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    針對圖像中的對象的自動邊界框生成制造技術(shù)

    技術(shù)編號:24290411 閱讀:52 留言:0更新日期:2020-05-26 20:24
    本申請的各實(shí)施例涉及針對圖像中的對象的自動邊界框生成。本文中描述的一個或多個實(shí)施例包括一種確定針對圖像中的對象的邊界框的計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括使用第一算法確定針對第一圖像中的對象的標(biāo)簽,以及基于第一圖像、通過從選擇的方向裁剪第一圖像來生成圖像集合。該方法還包括使用第一算法確定針對該集合中的每個圖像的標(biāo)簽,以及從該集合去除圖像,從而使得剩余圖像具有與初始標(biāo)簽匹配的標(biāo)簽。該方法還包括確定針對該集合的關(guān)鍵圖像,關(guān)鍵圖像是來自該集合的、具有超過閾值的置信度得分的最小圖像。此外,該方法包括基于第一圖像的與關(guān)鍵圖像重疊的一部分的周長來確定第一圖像中的對象的邊界框。

    Automatic bounding box generation for objects in images

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    針對圖像中的對象的自動邊界框生成
    本專利技術(shù)涉及計(jì)算技術(shù),并且特別地涉及用于針對圖像中的對象的自動邊界框生成的技術(shù)。在一個或多個示例中,具有針對圖像中的對象而被標(biāo)識的邊界框的這樣的圖像被用作訓(xùn)練數(shù)據(jù)集。
    技術(shù)介紹
    在過去的幾年中,基于數(shù)字圖像的對象檢測得到了越來越多的關(guān)注。例如,對象檢測系統(tǒng)當(dāng)前正在高級駕駛員輔助系統(tǒng)(ADAS)、電子商務(wù)應(yīng)用和各種其他領(lǐng)域中被實(shí)現(xiàn)。傳統(tǒng)的對象檢測方法通常涉及兩個階段。首先,在檢測階段中,包含目標(biāo)對象的候選的圖像區(qū)域被檢測或定位。然后,在識別階段中,這樣的區(qū)域被進(jìn)一步分析以識別具體內(nèi)容。然而,這些傳統(tǒng)的對象檢測系統(tǒng)和方法通常需要大量的訓(xùn)練數(shù)據(jù)、計(jì)算資源,檢測速度較慢并且有時可能不準(zhǔn)確。針對感興趣對象的具有邊界框的訓(xùn)練數(shù)據(jù)不容易找到,并且其生成需要付出努力。
    技術(shù)實(shí)現(xiàn)思路
    本文中描述的一個或多個實(shí)施例包括一種確定針對圖像中的對象的邊界框的計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括使用第一算法確定針對第一圖像中的對象的標(biāo)簽,以及基于第一圖像、通過從選擇的方向裁剪(crop)第一圖像來生成圖像集合。該方法還包括使用第一算法確定針對該集合中的每個圖像的標(biāo)簽,以及從該集合去除圖像,從而使得圖像的剩余部分具有與初始標(biāo)簽匹配的標(biāo)簽。該方法還包括確定針對該集合的關(guān)鍵圖像,關(guān)鍵圖像來自該集合的、具有超過閾值的置信度得分的最小圖像。此外,該方法包括基于第一圖像的與關(guān)鍵圖像重疊的一部分的周長來確定針對第一圖像中的對象的邊界框。根據(jù)本專利技術(shù)的一個或多個實(shí)施例,一種系統(tǒng)包括圖像數(shù)據(jù)庫,該圖像數(shù)據(jù)庫具有包含一個或多個對象的圖像,以及標(biāo)識圖像中的一個或多個對象的標(biāo)簽。該系統(tǒng)還包括處理器,該處理器被配置為使用方法從圖像數(shù)據(jù)庫確定針對第一圖像中的對象的邊界框,該方法包括使用第一算法確定針對第一圖像中的對象的標(biāo)簽,以及基于第一圖像,通過從選擇的方向裁剪第一圖像來生成圖像集合。該方法還包括使用第一算法確定針對該集合中的每個圖像的標(biāo)簽,以及從該集合去除圖像,從而使得剩余圖像具有與初始標(biāo)簽匹配的標(biāo)簽。該方法還包括確定針對該集合的關(guān)鍵圖像,關(guān)鍵圖像是來自該集合的、具有超過閾值的置信度得分的最小圖像。此外,該方法包括基于第一圖像的與關(guān)鍵圖像重疊的一部分的周長來確定針對第一圖像中的對象的邊界框。根據(jù)本專利技術(shù)的一個或多個實(shí)施例,一種計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲介質(zhì),該計(jì)算機(jī)可讀存儲介質(zhì)具有存儲于其上的程序指令,該程序指令由一個或多個處理設(shè)備可執(zhí)行以執(zhí)行方法,該方法包括:使用第一算法確定針對第一圖像中的對象的標(biāo)簽,以及基于第一圖像、通過從選擇的方向裁剪第一圖像來生成圖像集合。該方法還包括使用第一算法確定針對該集合中的每個圖像的標(biāo)簽,以及從該集合去除圖像,從而使得剩余圖像具有與初始標(biāo)簽匹配的標(biāo)簽。該方法還包括確定針對該集合的關(guān)鍵圖像,關(guān)鍵圖像是來自該集合的、具有超過閾值的置信度得分的最小圖像。此外,該方法包括基于第一圖像的與關(guān)鍵圖像重疊的一部分的周長來確定針對第一圖像中的對象的邊界框。通過本專利技術(shù)的技術(shù)實(shí)現(xiàn)了附加的特征和優(yōu)點(diǎn)。本專利技術(shù)的其他實(shí)施例和方面在本文中被詳細(xì)描述,并且被視為所要求保護(hù)的專利技術(shù)的一部分。為了更好地理解本專利技術(shù)的優(yōu)點(diǎn)和特征,參考說明書和附圖。應(yīng)當(dāng)理解,技術(shù)方案在應(yīng)用中不限于以下描述中被闡述的或在附圖中被示出的構(gòu)造的細(xì)節(jié)和組件的布置。這些技術(shù)方案還能夠具有除了所描述的那些之外的其他實(shí)施例,并且能夠以各種方式來實(shí)踐和執(zhí)行。另外,應(yīng)當(dāng)理解,本文中采用的措詞和術(shù)語以及摘要是出于描述的目的,而不應(yīng)當(dāng)被認(rèn)為是限制性的。這樣,本領(lǐng)域技術(shù)人員將認(rèn)識到,本公開所基于的概念可以容易地用作設(shè)計(jì)用于實(shí)現(xiàn)當(dāng)前描述的技術(shù)方案的幾個目的的其他結(jié)構(gòu)、方法和系統(tǒng)的基礎(chǔ)。附圖說明參考以下附圖和描述,將能夠更好地理解貫穿本文檔描述的示例。圖中的組件不一定按比例繪制。此外,在附圖中,貫穿不同的視圖,相似的附圖標(biāo)記指代相應(yīng)的部分。圖1描繪了被用于利用邊界框標(biāo)記訓(xùn)練圖像的現(xiàn)有系統(tǒng);圖2示出了用于在圖像中生成邊界框的示例現(xiàn)有系統(tǒng);圖3描繪了根據(jù)本專利技術(shù)的一個或多個實(shí)施例的用于自動地生成訓(xùn)練圖像集合的系統(tǒng)的框圖;圖4描繪了針對根據(jù)本專利技術(shù)的一個或多個實(shí)施例的自動地生成訓(xùn)練圖像集合的方法的流程圖;以及圖5描繪了本專利技術(shù)的一個或多個實(shí)施例的示例場景的視覺表示。具體實(shí)施方式本文中參考相關(guān)附圖描述了本專利技術(shù)的各種實(shí)施例??梢栽诓幻撾x本專利技術(shù)的范圍的情況下設(shè)計(jì)本專利技術(shù)的替代實(shí)施例。在以下描述和附圖中,闡述了元件之間的各種連接和位置關(guān)系(例如,上方、下方、相鄰等)。除非另有說明,否則這些連接和/或位置關(guān)系可以是直接的或間接的,并且本專利技術(shù)并不意圖在這方面進(jìn)行限制。因此,實(shí)體的耦合可以是指直接或間接耦合,并且實(shí)體之間的位置關(guān)系可以是直接或間接位置關(guān)系。此外,本文中描述的各種任務(wù)和過程步驟可以被并入具有本文中未詳細(xì)描述的附加步驟或功能的更全面的程序或過程中。以下定義和縮寫用于解釋權(quán)利要求和說明書。如本文中使用的,術(shù)語“包括(comprises)”、“包括(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“包含(contains)”或“包含(containing)”或其任何其他變型旨在覆蓋非排他性的包括。例如,包括一系列元素的組合物、混合物、過程、方法、制品或裝置不必僅限于這些元素,而是可以包括未明確列出的或者這樣的組合物、混合物、過程、方法、制品或裝置所固有的其他元素。此外,術(shù)語“示例性”在本文中用來表示“用作示例、實(shí)例或說明”。本文中描述為“示例性”的任何實(shí)施例或設(shè)計(jì)不必被解釋為比其他實(shí)施例優(yōu)選或有利。設(shè)計(jì)。術(shù)語“至少一個”和“一個或多個”可以被理解為包括大于或等于1的任何整數(shù),即1、2、3、4等。術(shù)語“多個”可以被理解為包括大于或等于2的任何整數(shù),即2、3、4、5等。術(shù)語“連接”可以同時包括間接“連接”和直接“連接”。術(shù)語“大約”、“基本上”、“近似”及其變體旨在包括與基于提交申請時可用的設(shè)備的特定數(shù)量的測量相關(guān)聯(lián)的誤差程度。例如,“大約”可以包括給定值的±8%或5%或2%的范圍。為了簡潔起見,在本文中可以或可以不詳細(xì)描述與制造和使用本專利技術(shù)的各方面有關(guān)的常規(guī)技術(shù)。特別地,用以實(shí)現(xiàn)本文中描述的各種技術(shù)特征的計(jì)算系統(tǒng)和特定計(jì)算機(jī)程序的各個方面是公知的。因此,為了簡潔起見,很多傳統(tǒng)的實(shí)現(xiàn)細(xì)節(jié)在本文中僅被簡要提及,或者被完全省略而不提供公知的系統(tǒng)和/或過程細(xì)節(jié)。應(yīng)當(dāng)注意,本文中的描述是指電子圖像中的對象檢測,因此,本文中對“圖像”的這樣的引用是指電子圖像,其可以按照諸如JPEG、PNG等任何電子格式被存儲。在計(jì)算技術(shù)中,可以使用在可編程計(jì)算機(jī)上運(yùn)行的人工神經(jīng)網(wǎng)絡(luò)(ANN)或機(jī)器學(xué)習(xí)算法來執(zhí)行自動地檢測圖像中的對象以及標(biāo)記圖像中的這樣的檢測到的對象。為了使ANN能夠按預(yù)期操作,必須對ANN進(jìn)行訓(xùn)練。在這種情況中,為了訓(xùn)練ANN以檢測和標(biāo)記圖像中的對象,必須利用已經(jīng)與針對這些圖像中的對象的邊本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】
    1.一種確定針對圖像中的對象的邊界框的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括:/n使用第一算法確定針對第一圖像中的對象的標(biāo)簽;/n確定選擇的方向:/n基于所述第一圖像來生成圖像集合,其中所述圖像集合中的每個圖像通過從所述選擇的方向裁剪所述第一圖像而被生成;/n使用所述第一算法確定針對所述圖像集合中的每個圖像的標(biāo)簽;/n從所述圖像集合去除圖像,從而使得所述圖像集合中剩余的每個圖像具有與針對所述第一圖像中的所述對象的所述標(biāo)簽匹配的標(biāo)簽;以及/n確定針對所述圖像集合的關(guān)鍵圖像,其中所述關(guān)鍵圖像是來自所述圖像集合的、具有超過閾值的置信度得分的最小圖像,所述最小圖像是在所述選擇的方向中具有最小尺寸的圖像;以及/n基于所述第一圖像的與所述關(guān)鍵圖像重疊的一部分的周長來確定針對所述第一圖像中的所述對象的邊界框。/n

    【技術(shù)特征摘要】
    20181119 US 16/194,8171.一種確定針對圖像中的對象的邊界框的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括:
    使用第一算法確定針對第一圖像中的對象的標(biāo)簽;
    確定選擇的方向:
    基于所述第一圖像來生成圖像集合,其中所述圖像集合中的每個圖像通過從所述選擇的方向裁剪所述第一圖像而被生成;
    使用所述第一算法確定針對所述圖像集合中的每個圖像的標(biāo)簽;
    從所述圖像集合去除圖像,從而使得所述圖像集合中剩余的每個圖像具有與針對所述第一圖像中的所述對象的所述標(biāo)簽匹配的標(biāo)簽;以及
    確定針對所述圖像集合的關(guān)鍵圖像,其中所述關(guān)鍵圖像是來自所述圖像集合的、具有超過閾值的置信度得分的最小圖像,所述最小圖像是在所述選擇的方向中具有最小尺寸的圖像;以及
    基于所述第一圖像的與所述關(guān)鍵圖像重疊的一部分的周長來確定針對所述第一圖像中的所述對象的邊界框。


    2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述選擇的方向是來自包括右方向、左方向、上方向和下方向的一組方向的一個方向。


    3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中針對所述第一圖像中的所述對象的所述邊界框基于所述第一圖像的與針對每個方向的每個關(guān)鍵圖像重疊的所述一部分的所述周長而被確定。


    4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述邊界框是沿著所述選擇的方向的第一邊界框,所述方法還包括:確定沿著第二選擇的方向的第二邊界框。


    5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第一邊界框針對所述對象,并且所述第二邊界框針對所述第一圖像中的另一對象。


    6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第一圖像是二維(2D)圖像。


    7.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第一圖像是n維圖像。


    8.一種系統(tǒng),包括:
    圖像數(shù)據(jù)庫,所述圖像數(shù)據(jù)庫包括多個圖像以及多個標(biāo)簽,所述多個圖像包含一個或多個對象,所述多個標(biāo)簽標(biāo)識所述圖像中的所述一個或多個對象;
    ...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:B·巴塔查爾吉,J·R·史密斯,M·格林伯格
    申請(專利權(quán))人:國際商業(yè)機(jī)器公司,
    類型:發(fā)明
    國別省市:美國;US

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码视频在线观看| 无码 免费 国产在线观看91 | 无码爆乳护士让我爽| 日日摸日日踫夜夜爽无码| 无码人妻丝袜在线视频| 无码人妻少妇久久中文字幕 | 国产激情无码一区二区app| 久久久久亚洲Av无码专| 亚洲中文字幕无码久久2017| 在线A级毛片无码免费真人| 中文字幕无码高清晰| 亚洲AV无码久久精品蜜桃| 精品一区二区无码AV| 无码 免费 国产在线观看91| 中文字幕人成无码免费视频| 国模GOGO无码人体啪啪| 久久久人妻精品无码一区 | 国产精品无码久久久久久久久久| 国产丰满乱子伦无码专区| 亚洲成A∨人片天堂网无码| 妖精色AV无码国产在线看| 在线观看无码的免费网站| 在线精品自偷自拍无码中文| 无码精品国产dvd在线观看9久 | 777爽死你无码免费看一二区| 国产白丝无码免费视频| 亚洲国产精品无码专区| 国产白丝无码免费视频| 亚洲AV无码久久精品成人| 色综合久久久久无码专区| 久久精品九九热无码免贵| 久久精品国产亚洲AV无码娇色 | 亚洲色偷拍区另类无码专区| 尤物永久免费AV无码网站| 无码人妻一区二区三区精品视频 | 国产精品无码无需播放器| 中文字幕无码乱人伦| 久久无码人妻一区二区三区午夜| 日韩精品久久无码人妻中文字幕| 久久无码中文字幕东京热| 中文字幕无码播放免费|