• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    文本分類的處理方法及裝置制造方法及圖紙

    技術編號:15690884 閱讀:117 留言:0更新日期:2017-06-24 03:38
    本申請公開了一種文本分類的處理方法及裝置。該方法包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率;根據第一從屬概率和第一歷史從屬概率計算第一目標概率;判斷第一目標概率是否高于預設閾值;以及當第一目標概率低于預設閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標概率高于或等于預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。通過本申請,解決了相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題。

    Method and device for processing text classification

    The present invention discloses a method and a device for processing text classification. The method includes: the first classification method treats text classification, text classification and the first to be confirmed first subordinate probability; calculates a first target probability according to the first slave probability and the first history dependent probability; determine the first target probability is higher than a preset threshold value; and when the first target probability below a preset threshold value, followed by different the first classification method of at least one classification method treats text classification process, until the calculated target probability is higher than or equal to a preset threshold value, and will eventually have to be confirmed as the target text category text category. Through this application, the problem of low efficiency in text categorization is solved in order to improve the accuracy of text classification in related technologies.

    【技術實現步驟摘要】
    文本分類的處理方法及裝置
    本申請涉及文本處理領域,具體而言,涉及一種文本分類的處理方法及裝置。
    技術介紹
    文本分類是自然語言處理的重要任務之一,類似于文章的行業分類,情感分析等許多自然語言處理任務其實質都是文本的分類。目前,無論是基于規則還是基于機器學習,處理文本分類問題的方法都有很多。通常,采用一種分類方法對文本進行分類處理,得到分類結果,輸出分類處理結果。然后僅采用一種分類方法對文本進行分類處理的準確性較低。為了提升對文本進行分類的準確性,相關技術中采用了一系列分類方法,旨在使用多個不太精準的分類方法對文本進行分類處理,得到多個分類處理結果。然后再對每一個分類處理結果進行投票,選出最高票的分類處理結果作為輸出。這種方法在很大程度上彌補了僅僅使用一個分類方法的不足,然而無論是否有必要,該方法對于每一個輸入的文本都需要采用多個分類方法,造成對文本處理性能的下降。針對相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題,目前尚未提出有效的解決方案。
    技術實現思路
    本申請的主要目的在于提供一種文本分類的處理方法及裝置,以解決相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題。為了實現上述目的,根據本申請的一個方面,提供了一種文本分類的處理方法。該方法包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,第一從屬概率為根據第一分類方法判定待處理文本屬于第一待確認文本類別的概率;根據第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,第一歷史從屬概率為預設數據庫中存儲的待處理文本屬于第一待確認文本類別的概率;判斷第一目標概率是否高于預設閾值;以及當第一目標概率低于預設閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標概率高于或等于預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。進一步地,在采用第一分類方法對待處理文本進行分類處理之前,該方法還包括:確定對待處理文本進行分類處理的多種分類方法;以及獲取多種分類方法組成的分類方法集合,其中,分類方法集合包括第一分類方法。進一步地,根據第一從屬概率和第一歷史從屬概率計算第一目標概率包括:將第一從屬概率和第一歷史從屬概率相乘,得到第一目標從屬概率;將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標非從屬概率,其中,第一非從屬概率為根據第一分類方法判定待處理文本不屬于第一待確認文本類別的概率,第一歷史非從屬概率為預設數據庫中存儲的待處理文本不屬于第一待確認文本類別的概率;將第一目標從屬概率與第一目標非從屬概率相加,得到第一目標子概率;以及將第一目標從屬概率與第一目標子概率相除,得到第一目標概率。進一步地,在將最終得到的待確認文本類別作為目標文本類別之后,該方法還包括:以最終計算出的目標概率更新預設數據庫中存儲的與最終采用的分類方法對應的歷史從屬概率。進一步地,在將最終得到的待確認文本類別作為目標文本類別之后,該方法還包括:輸出目標文本類別至目標地址。為了實現上述目的,根據本申請的另一方面,提供了一種文本分類的處理裝置。該裝置包括:處理單元,用于采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,第一從屬概率為根據第一分類方法判定待處理文本屬于第一待確認文本類別的概率;計算單元,用于根據第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,第一歷史從屬概率為預設數據庫中存儲的待處理文本屬于第一待確認文本類別的概率;判斷單元,用于判斷第一目標概率是否高于預設閾值;以及第一確定單元,用于當第一目標概率低于預設閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標概率高于或等于預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。進一步地,該裝置還包括:第二確定單元,用于確定對待處理文本進行分類處理的多種分類方法;以及獲取單元,用于獲取多種分類方法組成的分類方法集合,其中,分類方法集合包括第一分類方法。進一步地,計算單元包括:第一計算模塊,用于將第一從屬概率和第一歷史從屬概率相乘,得到第一目標從屬概率;第二計算模塊,用于將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標非從屬概率,其中,第一非從屬概率為根據第一分類方法判定待處理文本不屬于第一待確認文本類別的概率,第一歷史非從屬概率為預設數據庫中存儲的待處理文本不屬于第一待確認文本類別的概率;第三計算模塊,用于將第一目標從屬概率與第一目標非從屬概率相加,得到第一目標子概率;以及第四計算模塊,用于將第一目標從屬概率與第一目標子概率相除,得到第一目標概率。進一步地,該裝置還包括:更新單元,用于以最終計算出的目標概率更新預設數據庫中存儲的與最終采用的分類方法對應的歷史從屬概率。進一步地,該裝置還包括:輸出單元,用于輸出目標文本類別至目標地址。通過本申請,采用以下步驟:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,第一從屬概率為根據第一分類方法判定待處理文本屬于第一待確認文本類別的概率;根據第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,第一歷史從屬概率為預設數據庫中存儲的待處理文本屬于第一待確認文本類別的概率;判斷第一目標概率是否高于預設閾值;以及當第一目標概率低于預設閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標概率高于或等于預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別,解決了相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題。通過引入目標概率,根據目標概率確定待處理文本對應的目標文本類型,彌補僅使用一種分類方法處理確定目標文本類型和有效的減少了通過不必要多次分類處理方法去確定目標文本類型,進而達到了在提升對文本分類的準確性同時也提升了對文本分類的處理效率的效果。附圖說明構成本申請的一部分的附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:圖1是根據本申請實施例的文本分類的處理方法的流程圖;以及圖2是根據本申請實施例的文本分類的處理裝置的示意圖。具體實施方式需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。為了使本
    的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換,以便這里描述的本申請的實施例。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統本文檔來自技高網
    ...
    文本分類的處理方法及裝置

    【技術保護點】
    一種文本分類的處理方法,其特征在于,包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,所述第一從屬概率為根據所述第一分類方法判定所述待處理文本屬于所述第一待確認文本類別的概率;根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,所述第一歷史從屬概率為預設數據庫中存儲的所述待處理文本屬于所述第一待確認文本類別的概率;判斷所述第一目標概率是否高于預設閾值;以及當所述第一目標概率低于所述預設閾值時,依次采用與所述第一分類方法不同的至少一種分類方法對所述待處理文本進行所述分類處理,直到計算出的目標概率高于或等于所述預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。

    【技術特征摘要】
    1.一種文本分類的處理方法,其特征在于,包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,所述第一從屬概率為根據所述第一分類方法判定所述待處理文本屬于所述第一待確認文本類別的概率;根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,所述第一歷史從屬概率為預設數據庫中存儲的所述待處理文本屬于所述第一待確認文本類別的概率;判斷所述第一目標概率是否高于預設閾值;以及當所述第一目標概率低于所述預設閾值時,依次采用與所述第一分類方法不同的至少一種分類方法對所述待處理文本進行所述分類處理,直到計算出的目標概率高于或等于所述預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。2.根據權利要求1所述的方法,其特征在于,在采用第一分類方法對所述待處理文本進行分類處理之前,所述方法還包括:確定對所述待處理文本進行分類處理的多種分類方法;以及獲取所述多種分類方法組成的分類方法集合,其中,所述分類方法集合包括所述第一分類方法。3.根據權利要求1所述的方法,其特征在于,根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率包括:將所述第一從屬概率和所述第一歷史從屬概率相乘,得到第一目標從屬概率;將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標非從屬概率,其中,所述第一非從屬概率為根據所述第一分類方法判定所述待處理文本不屬于所述第一待確認文本類別的概率,所述第一歷史非從屬概率為所述預設數據庫中存儲的所述待處理文本不屬于所述第一待確認文本類別的概率;將所述第一目標從屬概率與所述第一目標非從屬概率相加,得到第一目標子概率;以及將所述第一目標從屬概率與所述第一目標子概率相除,得到所述第一目標概率。4.根據權利要求1所述的方法,其特征在于,在所述將最終得到的待確認文本類別作為目標文本類別之后,所述方法還包括:以最終計算出的目標概率更新所述預設數據庫中存儲的與最終采用的分類方法對應的歷史從屬概率。5.根據權利要求1所述的方法,其特征在于,在所述將最終得到的待確認文本類別作為目標文本類別之后,所述方法還包括:輸出所述目標文本類別至目標地...

    【專利技術屬性】
    技術研發人員:何鑫
    申請(專利權)人:北京國雙科技有限公司
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 成人无码精品一区二区三区| 亚洲爆乳精品无码一区二区| 亚洲av无码国产精品夜色午夜 | 日韩免费a级毛片无码a∨| 成人毛片无码一区二区| 丰满熟妇人妻Av无码区| 色欲AV永久无码精品无码| 久久亚洲精品成人无码网站| 18禁超污无遮挡无码免费网站| 亚洲av无码一区二区三区在线播放 | 亚洲AV无码之国产精品| 国产午夜片无码区在线播放| 少妇人妻av无码专区| 亚洲综合一区无码精品| 亚洲av日韩av高潮潮喷无码| 国产亚洲精久久久久久无码| 国产精品无码久久久久| 少妇极品熟妇人妻无码| 亚洲中文无码永久免| 亚洲精品久久无码| 无码福利一区二区三区| 无码专区天天躁天天躁在线| 中文字幕乱偷无码AV先锋| YY111111少妇无码理论片| 麻豆亚洲AV成人无码久久精品| 亚洲中文字幕无码久久2020| 精品爆乳一区二区三区无码av| 日韩精品无码久久久久久 | 久久Av无码精品人妻系列| 亚洲va中文字幕无码久久| 欧洲精品无码一区二区三区在线播放 | 无码日韩人妻精品久久蜜桃| 亚洲中文久久精品无码ww16| 亚洲热妇无码AV在线播放| 亚洲熟妇无码AV在线播放| 国产午夜无码视频在线观看| 无码精品久久久天天影视| 久久精品无码一区二区WWW| 亚洲GV天堂无码男同在线观看| 无码一区二区三区爆白浆| 18禁成年无码免费网站无遮挡|