【技術實現步驟摘要】
將圖片的局部特征量化為視覺詞匯的方法和裝置
本專利技術涉及計算機應用
,特別涉及一種將圖片局部特征量化為視覺詞匯的方法和裝置。
技術介紹
隨著多媒體相關技術的發展,數字圖片的規模迅速擴大,其應用也越來越廣泛,因此,如何有效、快速地從大規模圖片數據中檢索出所需的圖片已成為一個研究熱點。傳統的基于文本的圖片檢索方式由于人工標注圖片引起的主觀性以及不確定性等弊端,已經不能滿足用戶對查詢的要求,因此基于內容的圖片檢索技術逐漸興起和被廣泛采用。根據視覺詞匯對圖片建立倒排索引是一種通用的基于內容的圖片檢索方法,這種 方法首先確定圖片的局部特征,將不同的局部特征量化到視覺詞匯上,進而將一副圖片表示成視覺詞匯的組合,用類似于文本檢索的方法實現圖片檢索。其中,如何將局部特征量化到視覺詞匯上是實現圖片檢索的一個基礎,目前主要存在以下兩種方式,即最近路徑映射(Best Bin Frist)方式和貪心N近鄰路徑映射(Greedy N-best Paths)。這兩種方式均是基于視覺詞匯樹的方法,假定一棵視覺詞匯樹有L層,每一個父節點對應K個子節點,那么一棵L為6,K為10的視覺詞匯樹可以表示100萬個視覺詞匯,如附圖說明圖1所示。在最近路徑映射方法中,一個局部特征首先與第I層的K個詞匯比較,并選定最近的詞匯對應的子節點,然后與第2層選定的K個詞匯比較,并選定最近的子節點;以此類推,最終被映射到第L層與之最近的詞匯,將整個視覺詞匯樹查詢過程中選定的詞匯構成該局部特征的視覺詞匯表。在貪心N近鄰路徑映射方法中,引入了一個視覺詞匯擴展因子N,一個局部特征首先與第I層的K個詞匯比較,并 ...
【技術保護點】
一種將圖片的局部特征量化為視覺詞匯的方法,其特征在于,在針對圖片的局部特征查詢視覺詞匯樹的過程中,執行以下步驟:S1、從視覺詞匯樹的第一層確定待選擇詞匯,將第一層作為當前層次執行步驟S2;S2、利用所述局部特征與當前層次的各待選擇詞匯之間的距離以及當前層次的各待選擇詞匯的父節點所在路徑的置信度,分別計算當前層次中各待選擇詞匯所在路徑的置信度,其中第一層的各待選擇詞匯的父節點所在路徑的置信度為預設的初始值;S3、選擇當前層次中所在路徑的置信度大于或等于預設置信度閾值的待選擇詞匯,判斷當前層次是否為最后一層,如果是,將當前層次中選擇的詞匯確定為所述局部特征的視覺詞匯;否則,從當前層次中選擇的詞匯進入下一層次,并將選擇的詞匯的子節點確定為下一層次的待選擇詞匯,將下一層次作為當前層次轉至所述步驟S2。
【技術特征摘要】
1.一種將圖片的局部特征量化為視覺詞匯的方法,其特征在于,在針對圖片的局部特征查詢視覺詞匯樹的過程中,執行以下步驟 51、從視覺詞匯樹的第一層確定待選擇詞匯,將第一層作為當前層次執行步驟S2; 52、利用所述局部特征與當前層次的各待選擇詞匯之間的距離以及當前層次的各待選擇詞匯的父節點所在路徑的置信度,分別計算當前層次中各待選擇詞匯所在路徑的置信度,其中第一層的各待選擇詞匯的父節點所在路徑的置信度為預設的初始值; 53、選擇當前層次中所在路徑的置信度大于或等于預設置信度閾值的待選擇詞匯,判斷當前層次是否為最后一層,如果是,將當前層次中選擇的詞匯確定為所述局部特征的視覺詞匯;否則,從當前層次中選擇的詞匯進入下一層次,并將選擇的詞匯的子節點確定為下一層次的待選擇詞匯,將下一層次作為當前層次轉至所述步驟S2。2.根據權利要求1所述的方法,其特征在于,所述步驟SI具體為將視覺詞匯樹的第一層中所有詞匯確定為待選擇詞匯。3.根據權利要求1所述的方法,其特征在于,在所述步驟S2中按照以下公式計算當前層次中第i個待選擇詞匯所在路徑的置信度Y i 4.根據權利要求1所述的方法,其特征在于,待針對圖片的所有局部特征完成視覺詞匯的量化后,將所有局部特征的視覺詞匯按照所在路徑的置信度進行排序,選擇排在前N個的視覺詞匯作為所述圖片的視覺詞匯,所述N為預設的正整數。5.根據權利要求4所述的方法,其特征在于,所述圖片的局部特征數目越大,所述N值設置得越小,所述圖片的局部特征數目越小,所述N值設置得越大。6.一種將圖片的局部特征量化為視覺詞匯的裝置,其特征在于,該裝置包括 初始查詢單元,用...
【專利技術屬性】
技術研發人員:李浩,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。