本發明專利技術公開了一種基于知識網絡的搜索結果聚焦系統及聚焦方法。該聚焦系統包括知識網絡庫、搜索結果模塊、模式引擎和聚焦呈現模塊,其中模型引擎分別連接搜索結果模塊、知識網絡庫和聚焦呈現模塊。搜索結果模塊將通用搜索引擎的搜索結果輸入模式引擎中,模式引擎從知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數對搜索結果進行模式判別歸類,完成搜索結果的聚焦工作;聚焦呈現模塊將聚焦后的搜索結果輸出顯示。本發明專利技術利用知識網絡對搜索結果進行聚焦,能夠實現準確分類,分類數量確切,并使每一類別的命名清晰可讀。
【技術實現步驟摘要】
本專利技術涉及一種搜索結果聚焦系統及聚焦方法,尤其涉及一種利用預定領域的知識網絡作為聚焦依據,從而改善搜索結果聚焦效果的聚焦系統及聚焦方法,屬于網絡搜索
技術介紹
當前,互聯網中的數據總量以幾百兆兆字節來計算,而且仍然呈指數增長。為了幫助用戶從這個漫無邊際的數據海洋中快速獲取所需的信息,搜索引擎發揮著不可替代的作用。互聯網信息是極其浩繁的,任何一個關鍵詞都可能搜索到數百個甚至數萬個相關的網頁或者鏈接。而通過通用搜索引擎得到的搜索結果往往精度低,難以迅速讓用戶得到所需內容。因此,有必要對搜索結果進行聚焦分類,重新整理分類排序,使得用戶能夠迅速鎖定目標集合。在這一
,目前通用的方法是利用搜索結果聚類,根據某些用戶未知的條件將搜索結果聚類到若干子集中,并提供子集標簽以利于用戶迅速鎖定。例如申請號為200410091772. 7的中國專利申請中,公開了一種搜索結果聚類的方法,包括如下步驟預先記錄被索引文檔相對于其所包含的某個或者某幾個關鍵詞的一個或多個類別;根據預先記錄的文檔相對于包含在搜索請求中的某個或者某幾個關鍵詞的類別,對所述搜索結果中的文檔分組。所述類別可以為任意的文檔分類標記或者關鍵詞。每個類別可設置一個權重值。搜索結果中的文檔被放入該文檔相對于查詢關鍵詞的類別集合中,并且所得到的各個聚類類別的級別可由其所包含的文檔的級別來計算。該聚類方法適用于大規模文檔檢索系統(例如互聯網搜索引擎)對搜索結果的聚類,并且通過對聚類類別評級,可以將具有較高級別的聚類以及其中較高級別的文檔優先呈現給用戶。美國雅虎公司在申請號為200780049318. 7的中國專利申請中,也提出了一種用于搜索數據并且將搜索結果分組成根據搜索相關性來排序的聚類的方法和裝置。每個聚類包括一個或多個數據類型,諸如圖像、WEB頁面、本地信息、新聞、廣告等。在一個實施例中,針對指示搜索的數據源的分類的相關概念來評價搜索項。還可通過諸如客戶端設備的位置、當前運行的應用等上下文信息來識別數據源。每個聚類中的搜索結果通過相關性來排序,并且每個聚類都基于該聚類之內的相關性的聚集而被給予分數。每個聚類分數可基于一個或多個相應概念和/或上下文信息來修改?;诮浶薷牡姆謹祦砼判蚓垲?。包括廣告的內容還可被增加到經排序的列表以表現為另一聚類。另外,在專利號為ZL 200810226637. 7的中國專利技術專利中,進一步提出了一種優化聚類搜索結果的方法及其裝置,用以解決現有聚類搜索技術返回的搜索結果不能滿足用戶的個性化搜索需求的問題。具體技術方案包括根據當前聚類搜索結果中的聚類類別,從預先保存的用戶歷史搜索信息中查找與所述聚類類別對應的歷史權值;根據所述歷史權值的查找結果以及所述聚類類別對應的當前權值,確定所述聚類類別對應的結果權值;根據所述結果權值,確定所述聚類類別返回給用戶時的優先級。通過該技術方案返回的聚類搜索結果能夠滿足用戶的個性化搜索需求,提高用戶的體驗度。由于聚類技術所存在的局限性,導致現有的通用搜索引擎所提供的搜索結果數據量大、精度低。用戶不得不進行人工二次搜索,工作效率低下。
技術實現思路
本專利技術所要解決的技術問題在于提供一種。該技術方案利用預定領域的知識網絡作為聚焦依據,可以有效改善搜索結果的聚焦效果。為實現上述的專利技術目的,本專利技術采用下述的技術方案一種基于知識網絡的搜索結果聚焦系統,包括知識網絡庫、搜索結果模塊、模式引擎和聚焦呈現模塊,其中所述模型引擎分別連接所述搜索結果模塊、所述知識網絡庫和所述聚焦呈現模塊;所述搜索結果模塊將通用搜索引擎的搜索結果輸入所述模式引擎中,所述模式引擎從所述知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數對所述搜索結果進行模式判別歸類,完成所述搜索結果的聚焦工作;所述聚焦呈現模塊將聚焦后的所述搜索結果輸出顯示。其中較優地,所述搜索結果聚焦系統中還包括輔助概念樹,所述輔助概念樹與所述知識網絡庫連接。其中較優地,所述知識網絡庫由多個知識網絡節點構成,每個知識網絡節點具有自身專屬的模式判別函數和概念標簽。其中較優地,所述知識網絡庫中的多個知識網絡節點采用樹狀層次結構分布方式。一種基于知識網絡的搜索結果聚焦方法,基于上述的搜索結果聚焦系統實現,包括如下步驟首先通過用戶輸入,引發通用搜索引擎的搜索結果;當所述搜索結果加載到模式引擎后,所述模式引擎從知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數對所述搜索結果進行模式判別歸類,將所述搜索結果分別歸并入相應的知識網絡節點中,從而完成所述搜索結果的聚焦工作;聚焦呈現模塊將聚焦后的所述搜索結果輸出顯示。其中較優地,在所述模式引擎的判斷過程中,進一步利用輔助概念樹中存儲的概念詞集輔助進行語義邏輯判別。其中較優地,記錄所述搜索結果的原始排列順序,將每個知識網絡節點處聚焦的搜索結果按照原始排序順序進行排列。其中較優地,所述聚焦呈現模塊的輸出呈樹狀分層遞增形式,并顯示每個知識網絡節點的概念標簽。本專利技術利用知識網絡對搜索結果進行聚焦,能夠實現準確分類,分類數量確切,并使每一類別的命名清晰可讀,避免了現有的聚類方法生成類別個數隨機,類別語義不清,讓用戶難以快速定位所需內容的問題。附圖說明圖1是本專利技術所提供的搜索結果聚焦系統的整體結構示意圖;圖2是知識網絡庫的樹狀層次結構示意圖;圖3是圖2所示的知識網絡庫的一個實施例示意圖。具體實施例方式下面結合附圖和具體實施例,對本專利技術所采用的技術方案做進一步的詳細說明。圖1顯示了本專利技術所提供的搜索結果聚焦系統的整體結構。該搜索結果聚焦系統 由輔助概念樹、知識網絡庫、搜索結果模塊、模式引擎和聚焦呈現模塊組成。其中,模型引擎分別連接搜索結果模塊、知識網絡庫和聚焦呈現模塊,輔助概念樹連接知識網絡庫。該搜索結果模塊、聚焦呈現模塊等可以采用計算機領域的成熟算法,以軟件或者固件方式實現。輔助概念樹和知識網絡庫等可以以非易失性存儲器方式實現。在本搜索結果聚焦系統中,首先通過用戶輸入,引發通用搜索引擎的搜索結果。搜索結果模塊從通用搜索引擎處獲得搜索結果,并將該搜索結果輸入模式引擎中。知識網絡庫由多個概念與邏輯判別融合的知識網絡節點構成,每個知識網絡節點具有概念標簽及其概念判別模式(體現為模式判別函數)。輔助概念樹是概念詞集的存儲集合,對知識網絡庫起到概念支持作用。模式引擎是模式判別的執行核心,當搜索結果記錄加載后,模式引擎從知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數g(x)對搜索結果記錄進行模式判別歸類,從而完成搜索結果的聚焦工作。聚焦呈現模塊將聚焦后的搜索結果輸出顯示,輸出呈樹狀分層遞增形式,并顯示每個知識網絡節點的概念標簽(Tag)。圖2顯示了知識網絡庫中,多個知識網絡節點的樹狀層次結構分布方式。在知識網絡庫的內部結構上,本專利技術以樹狀層次結構遞增的形式表示知識概念間的層次關系,并且每個知識網絡節點是概念標簽及知識的機器表達的融合,即Tag與g(x)的融合體。每個知識網絡節點通過模式判別函數g(x)實現下一級的概念細分,以便能夠實現快速聚焦。例如在圖2中,根節點root下有i個子節點sub(l, I)、sub (I, 2)、......sub(l, i),而子節點sub (I, I)下又有j個孫節點sub (2,I)、s本文檔來自技高網...
【技術保護點】
一種基于知識網絡的搜索結果聚焦系統,其特征在于:所述搜索結果聚焦系統包括知識網絡庫、搜索結果模塊、模式引擎和聚焦呈現模塊,其中所述模型引擎分別連接所述搜索結果模塊、所述知識網絡庫和所述聚焦呈現模塊;所述搜索結果模塊將通用搜索引擎的搜索結果輸入所述模式引擎中,所述模式引擎從所述知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數對所述搜索結果進行模式判別歸類,完成所述搜索結果的聚焦工作;所述聚焦呈現模塊將聚焦后的所述搜索結果輸出顯示。
【技術特征摘要】
1.一種基于知識網絡的搜索結果聚焦系統,其特征在于所述搜索結果聚焦系統包括知識網絡庫、搜索結果模塊、模式引擎和聚焦呈現模塊,其中所述模型引擎分別連接所述搜索結果模塊、所述知識網絡庫和所述聚焦呈現模塊;所述搜索結果模塊將通用搜索引擎的搜索結果輸入所述模式引擎中,所述模式引擎從所述知識網絡庫的根節點開始,依據知識網絡節點中的模式判別函數對所述搜索結果進行模式判別歸類,完成所述搜索結果的聚焦工作;所述聚焦呈現模塊將聚焦后的所述搜索結果輸出顯示。2.如權利要求1所述的搜索結果聚焦系統,其特征在于所述搜索結果聚焦系統中還包括輔助概念樹,所述輔助概念樹與所述知識網絡庫連接。3.如權利要求1所述的搜索結果聚焦系統,其特征在于所述知識網絡庫由多個知識網絡節點構成,每個知識網絡節點具有自身專屬的模式判別函數和概念標簽。4.如權利要求1所述的搜索結果聚焦系統,其特征在于所述知識網絡庫中的多個知識網絡節點采用樹狀層次結...
【專利技術屬性】
技術研發人員:王樹強,宋傳寶,龐曉曦,
申請(專利權)人:北京海量融通軟件技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。