本實用新型專利技術涉及電子技術領域,尤其是涉及一種中文關鍵字提取系統。它解決了現有技術設計不夠合理等技術問題。本系統包括中央處理器,在中央處理器上連接有用于存儲中文詞語語義且能在中央處理器控制下更新存儲數據的智能中文詞語語義存儲器,在中央處理器上連接有能夠輸入目標文本信息的文本信息收集器,所述的中央處理器上還連接有神經元網絡拓撲聯想處理器,在神經元網絡拓撲聯想處理器上設有中文關鍵字輸出端口。與現有的技術相比,本中文關鍵字提取系統的優點在于:設計合理,結構簡單,工作效率高,提取效果好,并且能夠根據工作過程實時更新數據,進一步提高提取效率。(*該技術在2021年保護過期,可自由使用*)
【技術實現步驟摘要】
中文關鍵字提取系統技術領 域本技術涉及電子
,尤其是涉及一種中文關鍵字提取系統。
技術介紹
提取關鍵字在文獻處理領域具有重要的作用,能夠有效優化文獻檢索、便于對文獻進行歸納和分類。為了提高關鍵字提取的準確性和合理性,人們進行了長期的探索,提出了各種各樣的解決方案。例如,中國專利文獻公開了一種關鍵字存儲、查找方法和設備,所述方法包括將關鍵字分為多個字段;取第一字段對應的隨機數;對常數進行移位運算,移位的結果與所述隨機數進行異或運算,得到第一字段對應的哈希值;從第二字段開始,取當前字段對應的隨機數;對當前字段的前一字段對應的哈希值進行移位運算,移位的結果與所述當前字段的隨機數進行異或運算,得到當前字段對應的哈希值;將所述關鍵字存儲到地址為最后字段對應的哈希值的存儲區;以及應用上述方法到相應的存儲區查找關鍵字。所述設備包括分割模塊、第一哈希值獲取模塊、多級哈希值獲取模塊和存儲模塊。本專利技術中最終哈希值的分布與理論上的隨機分布非常接近,提高了查找的準確度。上述方案在一定程度上提高了關鍵字的提取效果,但是仍然存在著設計不夠合理,設備成本較高,數據處理時間較長,無法根據使用狀況對提取過程進行優化等技術問題。
技術實現思路
本技術的目的是針對上述問題,提供一種設計合理,結構簡單,易于操作,工作效率高的中文關鍵字提取系統。為達到上述目的,本技術采用了下列技術方案本中文關鍵字提取系統,其特征在于,本系統包括中央處理器,在中央處理器上連接有用于存儲中文詞語語義且能在中央處理器控制下更新存儲數據的智能中文詞語語義存儲器,在中央處理器上連接有能夠輸入目標文本信息的文本信息收集器,所述的中央處理器上還連接有神經元網絡拓撲聯想處理器,在神經元網絡拓撲聯想處理器上設有中文關鍵字輸出端口。在上述的中文關鍵字提取系統中,所述的神經元網絡拓撲聯想處理器上連接有用于統計詞頻的計數器。在上述的中文關鍵字提取系統中,所述的中央處理器上還連接有顯示裝置和網絡通訊裝置。與現有的技術相比,本中文關鍵字提取系統的優點在于設計合理,結構簡單,工作效率高,提取效果好,并且能夠根據工作過程實時更新數據,進一步提高提取效率。附圖說明圖1是本技術提供的結構框圖。圖中,中央處理器1、智能中文詞語語義存儲器2、文本信息收集器3、神經元網絡拓撲聯想處理器4、中文關鍵字輸出端口 5、計數器6、顯示裝置7、網絡通訊裝置8。具體實施方 式如圖1所示,本中文關鍵字提取系統包括中央處理器1,在中央處理器1上連接有用于存儲中文詞語語義且能在中央處理器1控制下更新存儲數據的智能中文詞語語義存儲器2,在中央處理器1上連接有能夠輸入目標文本信息的文本信息收集器3,所述的中央處理器1上還連接有神經元網絡拓撲聯想處理器4,在神經元網絡拓撲聯想處理器4上設有中文關鍵字輸出端口 5。神經元網絡拓撲聯想處理器4上連接有用于統計詞頻的計數器6。 中央處理器1上還連接有顯示裝置7和網絡通訊裝置8。本文中所描述的具體實施例僅僅是對本技術精神作舉例說明。本技術所屬
的技術人員可以對所描述的具體實施例做各種各樣的修改或補充或采用類似的方式替代,但并不會偏離本技術的精神或者超越所附權利要求書所定義的范圍。盡管本文較多地使用了中央處理器1、智能中文詞語語義存儲器2、文本信息收集器3、神經元網絡拓撲聯想處理器4、中文關鍵字輸出端口 5、計數器6、顯示裝置7、網絡通訊裝置8等術語,但并不排除使用其它術語的可能性。使用這些術語僅僅是為了更方便地描述和解釋本技術的本質;把它們解釋成任何一種附加的限制都是與本技術精神相違背的。權利要求1.一種中文關鍵字提取系統,其特征在于,本系統包括中央處理器(1),在中央處理器 (1)上連接有用于存儲中文詞語語義且能在中央處理器(1)控制下更新存儲數據的智能中文詞語語義存儲器(2),在中央處理器(1)上連接有能夠輸入目標文本信息的文本信息收集器(3),所述的中央處理器(1)上還連接有神經元網絡拓撲聯想處理器(4),在神經元網絡拓撲聯想處理器(4)上設有中文關鍵字輸出端口(5)。2.根據權利要求1所述的中文關鍵字提取系統,其特征在于,所述的神經元網絡拓撲聯想處理器(4)上連接有用于統計詞頻的計數器(6)。3.根據權利要求1或2所述的中文關鍵字提取系統,其特征在于,所述的中央處理器 (1)上還連接有顯示裝置(7)和網絡通訊裝置(8)。專利摘要本技術涉及電子
,尤其是涉及一種中文關鍵字提取系統。它解決了現有技術設計不夠合理等技術問題。本系統包括中央處理器,在中央處理器上連接有用于存儲中文詞語語義且能在中央處理器控制下更新存儲數據的智能中文詞語語義存儲器,在中央處理器上連接有能夠輸入目標文本信息的文本信息收集器,所述的中央處理器上還連接有神經元網絡拓撲聯想處理器,在神經元網絡拓撲聯想處理器上設有中文關鍵字輸出端口。與現有的技術相比,本中文關鍵字提取系統的優點在于設計合理,結構簡單,工作效率高,提取效果好,并且能夠根據工作過程實時更新數據,進一步提高提取效率。文檔編號G06F17/30GK202025316SQ201120085840公開日2011年11月2日 申請日期2011年3月28日 優先權日2011年3月28日專利技術者韓偉 申請人:韓偉本文檔來自技高網...
【技術保護點】
1.一種中文關鍵字提取系統,其特征在于,本系統包括中央處理器(1),在中央處理器(1)上連接有用于存儲中文詞語語義且能在中央處理器(1)控制下更新存儲數據的智能中文詞語語義存儲器(2),在中央處理器(1)上連接有能夠輸入目標文本信息的文本信息收集器(3),所述的中央處理器(1)上還連接有神經元網絡拓撲聯想處理器(4),在神經元網絡拓撲聯想處理器(4)上設有中文關鍵字輸出端口(5)。
【技術特征摘要】
【專利技術屬性】
技術研發人員:韓偉,
申請(專利權)人:韓偉,
類型:實用新型
國別省市:86
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。