The present invention discloses a method and a device for processing text classification. The method includes: the first classification method treats text classification, text classification and the first to be confirmed first subordinate probability; calculates a first target probability according to the first slave probability and the first history dependent probability; determine the first target probability is higher than a preset threshold value; and when the first target probability below a preset threshold value, followed by different the first classification method of at least one classification method treats text classification process, until the calculated target probability is higher than or equal to a preset threshold value, and will eventually have to be confirmed as the target text category text category. Through this application, the problem of low efficiency in text categorization is solved in order to improve the accuracy of text classification in related technologies.
【技術實現步驟摘要】
文本分類的處理方法及裝置
本申請涉及文本處理領域,具體而言,涉及一種文本分類的處理方法及裝置。
技術介紹
文本分類是自然語言處理的重要任務之一,類似于文章的行業分類,情感分析等許多自然語言處理任務其實質都是文本的分類。目前,無論是基于規則還是基于機器學習,處理文本分類問題的方法都有很多。通常,采用一種分類方法對文本進行分類處理,得到分類結果,輸出分類處理結果。然后僅采用一種分類方法對文本進行分類處理的準確性較低。為了提升對文本進行分類的準確性,相關技術中采用了一系列分類方法,旨在使用多個不太精準的分類方法對文本進行分類處理,得到多個分類處理結果。然后再對每一個分類處理結果進行投票,選出最高票的分類處理結果作為輸出。這種方法在很大程度上彌補了僅僅使用一個分類方法的不足,然而無論是否有必要,該方法對于每一個輸入的文本都需要采用多個分類方法,造成對文本處理性能的下降。針對相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題,目前尚未提出有效的解決方案。
技術實現思路
本申請的主要目的在于提供一種文本分類的處理方法及裝置,以解決相關技術中為了提升對文本分類的準確性導致對文本分類的處理效率低的問題。為了實現上述目的,根據本申請的一個方面,提供了一種文本分類的處理方法。該方法包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,第一從屬概率為根據第一分類方法判定待處理文本屬于第一待確認文本類別的概率;根據第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,第一歷史從屬概率為預設數據庫中存儲的待處理文本屬于第一待確認文 ...
【技術保護點】
一種文本分類的處理方法,其特征在于,包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,所述第一從屬概率為根據所述第一分類方法判定所述待處理文本屬于所述第一待確認文本類別的概率;根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,所述第一歷史從屬概率為預設數據庫中存儲的所述待處理文本屬于所述第一待確認文本類別的概率;判斷所述第一目標概率是否高于預設閾值;以及當所述第一目標概率低于所述預設閾值時,依次采用與所述第一分類方法不同的至少一種分類方法對所述待處理文本進行所述分類處理,直到計算出的目標概率高于或等于所述預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。
【技術特征摘要】
1.一種文本分類的處理方法,其特征在于,包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認文本類別和第一從屬概率,其中,所述第一從屬概率為根據所述第一分類方法判定所述待處理文本屬于所述第一待確認文本類別的概率;根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率,其中,所述第一歷史從屬概率為預設數據庫中存儲的所述待處理文本屬于所述第一待確認文本類別的概率;判斷所述第一目標概率是否高于預設閾值;以及當所述第一目標概率低于所述預設閾值時,依次采用與所述第一分類方法不同的至少一種分類方法對所述待處理文本進行所述分類處理,直到計算出的目標概率高于或等于所述預設閾值為止,并將最終得到的待確認文本類別作為目標文本類別。2.根據權利要求1所述的方法,其特征在于,在采用第一分類方法對所述待處理文本進行分類處理之前,所述方法還包括:確定對所述待處理文本進行分類處理的多種分類方法;以及獲取所述多種分類方法組成的分類方法集合,其中,所述分類方法集合包括所述第一分類方法。3.根據權利要求1所述的方法,其特征在于,根據所述第一從屬概率和第一歷史從屬概率計算第一目標概率包括:將所述第一從屬概率和所述第一歷史從屬概率相乘,得到第一目標從屬概率;將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標非從屬概率,其中,所述第一非從屬概率為根據所述第一分類方法判定所述待處理文本不屬于所述第一待確認文本類別的概率,所述第一歷史非從屬概率為所述預設數據庫中存儲的所述待處理文本不屬于所述第一待確認文本類別的概率;將所述第一目標從屬概率與所述第一目標非從屬概率相加,得到第一目標子概率;以及將所述第一目標從屬概率與所述第一目標子概率相除,得到所述第一目標概率。4.根據權利要求1所述的方法,其特征在于,在所述將最終得到的待確認文本類別作為目標文本類別之后,所述方法還包括:以最終計算出的目標概率更新所述預設數據庫中存儲的與最終采用的分類方法對應的歷史從屬概率。5.根據權利要求1所述的方法,其特征在于,在所述將最終得到的待確認文本類別作為目標文本類別之后,所述方法還包括:輸出所述目標文本類別至目標地...
【專利技術屬性】
技術研發人員:何鑫,
申請(專利權)人:北京國雙科技有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。