本申請涉及一種增強發言情感的方法、系統、終端及存儲介質,其屬于數據處理技術領域,該方法包括:獲取目標發言人當前發言數據的初始涉電詐情感分值;獲取目標發言人的歷史發言數據的風險分值并計算得到歷史情感偏向分值T1;獲取第一關聯發言人在第一指定時間內的發言數據的風險分值和第二關聯發言人在第二指定時間內的發言數據的風險分值,并計算得到關聯情感偏向分值T2;獲取第一關聯發言人的歷史發言數據的風險分值和第二關聯發言人的歷史發言數據的風險分值,并計算得到歷史關聯情感偏向分值T3;獲取第一權重W1、第二權重W2、第三權重W3;基于權重和偏向分值計算目標發言人的最終涉電詐情感分值。本申請具有提高識別詐騙話術的效果。話術的效果。話術的效果。
【技術實現步驟摘要】
一種增強發言情感的方法、系統、終端及存儲介質
[0001]本申請涉及數據處理
,尤其是涉及一種增強發言情感的方法、系統、終端及存儲介質。
技術介紹
[0002]當前,很多電信詐騙采用偽裝成跟人交友、推薦理財、返利刷單等等話術施行詐騙,對于詐騙意圖明顯的話術在當前的自然語言分類中已經有了一定的準確性,但是,對于一些偽裝性強的話術,自然語言分析模型仍然不能準確進行識別和判斷,從而可能出現誤判的情況。
技術實現思路
[0003]本申請提供一種增強發言情感的方法、系統、終端及存儲介質,具有提高識別詐騙話術的特點。
[0004]本申請目的一是提供一種增強發言情感的方法。
[0005]本申請的上述申請目的一是通過以下技術方案得以實現的:一種增強發言情感的方法,包括:獲取目標發言人當前發言數據的初始涉電詐情感分值K,所述目標發言人為不能明確識別當前發言數據的情感的發言人;獲取所述目標發言人的歷史發言數據的風險分值;計算所述歷史發言數據的風險分值的中位數,并根據所述中位數得到歷史情感偏向分值T1;以所述目標發言人發送當前的發言數據為中心時刻,在時間長度上,以中心時刻向前截取第一指定時間,將在第一指定時間內發言的發言人標記為第一關聯發言人;以中心時刻向后截取第二指定時間,將在第二指定時間內發言的發言人標記為第二關聯發言人;獲取第一關聯發言人在第一指定時間內的發言數據的風險分值;獲取第二關聯發言人在第二指定時間內的發言數據的風險分值;合并第一關聯發言人在第一指定時間內的發言數據的風險分值和第二關聯發言人在第二指定時間內的發言數據的風險分值,得到第一風險分值序列,計算所述第一風險分值序列中的中位數,并根據所述第一風險分值序列中的中位數得到關聯情感偏向分值T2;獲取第一關聯發言人的歷史發言數據的風險分值,并計算第一關聯發言人的歷史發言數據的風險分值的中位數值;獲取第二關聯發言人的歷史發言數據的風險分值,并計算第二關聯發言人的歷史發言數據的風險分值的中位數值;合并第一關聯發言人的歷史發言數據的風險分值的中位數值和第二關聯發言人
的歷史發言數據的風險分值的中位數值,得到第二風險分值序列,計算所述第二風險分值序列中的中位數,并根據所述第二風險分值序列中的中位數得到歷史關聯情感偏向分值T3;獲取預設的第一權重W1、第二權重W2、第三權重W3;計算目標發言人的最終涉電詐情感分值。
[0006]通過采用上述技術方案,首先,獲取無法明確識別情感的發言,將該發言標記為當前發言數據,并依據當前發言數據確定目標發言人、第一關聯發言人以及第二關聯發言人。然后,再根據目標發言人的歷史發言、第一關聯發言人和第二關聯發言人在當前發言數據的上下文中的發言、以及第一關聯發言人的歷史發言和第二關聯發言人的歷史發言,分析當前發言數據的情感偏向。由于發言的分值越高則說明其為涉電詐發言,而分值越低則說明其為不涉電詐發言,所以本申請能夠依據情感偏向在當前發言數據上疊加分值,從而實現了提高識別詐騙話術的目的。
[0007]本申請在一較佳示例中可以進一步配置為:所述獲取目標發言人當前發言數據的初始涉電詐情感分值K之前,包括:獲取訓練數據,所述訓練數據包括涉電詐發言和不涉電詐發言;采用所述訓練數據訓練分類模型得到風險分值預測模型;獲取待測數據;根據所述待測數據和所述風險分值預測模型得到初始涉電詐情感分值K;獲取涉電詐情感分值閾值范圍Q;當所述初始涉電詐情感分值K位于所述涉電詐情感分值閾值范圍Q中時,將所述待測數據標記為不能明確識別情感的當前發言數據,且將發送所述當前發言數據的發言人標記為目標發言人。
[0008]本申請在一較佳示例中可以進一步配置為:計算所述歷史發言數據的風險分值的中位數包括:將n項歷史發言數據的風險分值按照降序排序或者升序排序的方式進行排列,得到歷史分值序列(x1,x2,x3,
…
,x
n
);計算歷史分值序列(x1,x2,x3,
…
,x
n
)的中位數,當:n為奇數時,所述中位數;n為偶數時,所述中位數。
[0009]本申請在一較佳示例中可以進一步配置為:所述根據所述中位數得到歷史情感偏向分值T1包括:歷史情感偏向分值T2=m1?
h;所述h為映射值。
[0010]本申請在一較佳示例中可以進一步配置為:所述根據所述第一風險分值序列中的中位數得到關聯情感偏向分值T2包括:關聯情感偏向分值T2=m2?
h;所述m2為第一風險分值序列中的中位數。
[0011]本申請在一較佳示例中可以進一步配置為:所述根據所述第二風險分值序列中的
中位數得到歷史關聯情感偏向分值T3包括:歷史關聯情感偏向分值T3=m3?
h;所述m3為第二風險分值序列中的中位數。
[0012]本申請在一較佳示例中可以進一步配置為:所述第一權重W1和第二權重W2均大于第三權重W3。
[0013]本申請目的二是提供一種增強發言情感的系統。
[0014]本申請的上述申請目的二是通過以下技術方案得以實現的:一種增強發言情感的系統,用于執行增強發言情感的方法,包括:第一獲取模塊,用于獲取目標發言人當前發言數據的初始涉電詐情感分值K,所述目標發言人為不能明確識別當前發言數據的情感的發言人;第二獲取模塊,用于獲取所述目標發言人的歷史發言數據和每一項歷史發言數據的風險分值;第一處理模塊,用于計算所述歷史發言數據的風險分值的中位數,并根據所述中位數得到歷史情感偏向分值T1;預處理模塊,用于以所述目標發言人發送當前的發言數據為中心時刻,在時間長度上,以中心時刻向前截取第一指定時間,將在第一指定時間內發言的發言人標記為第一關聯發言人;以中心時刻向后截取第二指定時間,將在第二指定時間內發言的發言人標記為第二關聯發言人;第三獲取模塊,用于獲取第一關聯發言人在第一指定時間內的發言數據的風險分值,還用于獲取第二關聯發言人在第二指定時間內的發言數據的風險分值;第二處理模塊,用于合并第一關聯發言人在第一指定時間內的發言數據的風險分值和第二關聯發言人在第二指定時間內的發言數據的風險分值,得到第一風險分值序列,計算所述第一風險分值序列中的中位數,并根據所述第一風險分值序列中的中位數得到關聯情感偏向分值T2;第四獲取模塊,用于獲取第一關聯發言人的歷史發言數據的風險分值,并計算第一關聯發言人的歷史發言數據的風險分值的中位數值;第三處理模塊,用于合并第一關聯發言人的歷史發言數據的風險分值的中位數值和第二關聯發言人的歷史發言數據的風險分值的中位數值,得到第二風險分值序列,計算所述第二風險分值序列中的中位數,并根據所述第二風險分值序列中的中位數得到歷史關聯情感偏向分值T3;第五獲取模塊,用于獲取預設的第一權重W1、第二權重W2、第三權重W3;第四處理模塊,用于計算目標發言人的最終涉電詐情感分值。
[0015]本申請目的三是提供一種智能終端。
[0016]本申請的上述申請目的三是通過以下技術方案得以實現的:一種智能終端,包括存儲器和處理器,所述存儲器上存儲有能本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種增強發言情感的方法,其特征在于,包括:獲取目標發言人當前發言數據的初始涉電詐情感分值K,所述目標發言人為不能明確識別當前發言數據的情感的發言人;獲取所述目標發言人的歷史發言數據的風險分值;計算所述歷史發言數據的風險分值的中位數,并根據所述中位數得到歷史情感偏向分值T1;以所述目標發言人發送當前的發言數據為中心時刻,在時間長度上,以中心時刻向前截取第一指定時間,將在第一指定時間內發言的發言人標記為第一關聯發言人;以中心時刻向后截取第二指定時間,將在第二指定時間內發言的發言人標記為第二關聯發言人;獲取第一關聯發言人在第一指定時間內的發言數據的風險分值;獲取第二關聯發言人在第二指定時間內的發言數據的風險分值;合并第一關聯發言人在第一指定時間內的發言數據的風險分值和第二關聯發言人在第二指定時間內的發言數據的風險分值,得到第一風險分值序列,計算所述第一風險分值序列中的中位數,并根據所述第一風險分值序列中的中位數得到關聯情感偏向分值T2;獲取第一關聯發言人的歷史發言數據的風險分值,并計算第一關聯發言人的歷史發言數據的風險分值的中位數值;獲取第二關聯發言人的歷史發言數據的風險分值,并計算第二關聯發言人的歷史發言數據的風險分值的中位數值;合并第一關聯發言人的歷史發言數據的風險分值的中位數值和第二關聯發言人的歷史發言數據的風險分值的中位數值,得到第二風險分值序列,計算所述第二風險分值序列中的中位數,并根據所述第二風險分值序列中的中位數得到歷史關聯情感偏向分值T3;獲取預設的第一權重W1、第二權重W2、第三權重W3;計算目標發言人的最終涉電詐情感分值。2.根據權利要求1所述的增強發言情感的方法,其特征在于,所述獲取目標發言人當前發言數據的初始涉電詐情感分值K之前,包括:獲取訓練數據,所述訓練數據包括涉電詐發言和不涉電詐發言;采用所述訓練數據訓練分類模型得到風險分值預測模型;獲取待測數據;根據所述待測數據和所述風險分值預測模型得到初始涉電詐情感分值K;獲取涉電詐情感分值閾值范圍Q;當所述初始涉電詐情感分值K位于所述涉電詐情感分值閾值范圍Q中時,將所述待測數據標記為不能明確識別情感的當前發言數據,且將發送所述當前發言數據的發言人標記為目標發言人。3.根據權利要求1所述的增強發言情感的方法,其特征在于,所述計算所述歷史發言數據的風險分值的中位數包括:將n項歷史發言數據的風險分值按照降序排序或者升序排序的方式進行排列,得到歷史分值序列(x1,x2,x3,
…
,x
n
);計算歷史分值序列(x1,x2,x3,
…
,x
n
)的中位數,當:
n為奇數時,所述中位數;n為偶數時,所述中位數。4.根據權利要求3所述的增強發言情感的方法,其特征在于,所述根據所述中位數得到歷史情感偏向分值T1包括:歷史情感偏向分值T1=m1?
h;所述h為...
【專利技術屬性】
技術研發人員:徐濤,吳楠,蔣修強,胡大明,盧小軍,王金濤,王方舟,
申請(專利權)人:北京碼牛科技股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。