The invention discloses a method and a device for constructing an emotional dictionary, belonging to the field of information technology. The method comprises: acquiring a plurality of input data from every modeling; modeling data in identifying, acquiring at least one emotion feature words; for any emotional feature words, acquiring at least two words of emotion annotation results at least two annotation results published by mark and a plurality of receivers, each labeled the result corresponds to a classification of emotion labels; at least according to the emotional characteristics of two word annotation results, to determine whether the emotional characteristics of words satisfying the preset conditions; if the emotional characteristics of words satisfying the preset conditions, adding emotional feature words to the dictionary in emotion. The invention does not rely on the professional labeling of personnel, and based on the published multi recipient of emotional feature label, solves the problem of inaccurate and incomplete labeling of emotional feature words, improve the accuracy of sentiment dictionary.
【技術(shù)實現(xiàn)步驟摘要】
構(gòu)建情感詞典的方法及裝置
本專利技術(shù)涉及信息
,特別涉及一種構(gòu)建情感詞典的方法及裝置。
技術(shù)介紹
隨著信息技術(shù)的發(fā)展,終端普及率的提高,越來越多用戶借助終端中安裝的微博、微信等社交應(yīng)用來表達(dá)自己的意見、觀點、態(tài)度。例如,對政治人物、娛樂人物、熱點人物的個人喜好;對某類產(chǎn)品的用后評價與建議;對社會政治事件的看法、立場;對自己的心情、感受的宣泄等。通常用于表達(dá)自己的意見、觀點、態(tài)度的詞語往往具有一定的情感傾向,基于這些詞語所構(gòu)建的情感詞典,具有十分重要的意義,可用于個人形象的維護(hù)、企業(yè)營銷管理及品牌宣傳、商家對產(chǎn)品的改進(jìn)、政府對輿情控制等方面。目前,構(gòu)建情感詞典的方法為:專業(yè)標(biāo)注人員對從社交應(yīng)用中獲取到的海量語料進(jìn)行篩選,選取情感特征詞,為情感特征詞標(biāo)注相應(yīng)的分類情感標(biāo)簽,得到包括情感特征詞及對應(yīng)分類情感標(biāo)簽的情感詞典。然而,隨著網(wǎng)絡(luò)語言的不斷發(fā)展,各種新詞語層出不窮,加上各種網(wǎng)絡(luò)符號也常被用來表達(dá)用戶情感,單純依賴專業(yè)標(biāo)注人員很難全面地、準(zhǔn)確地對社交應(yīng)用中的情感特征詞進(jìn)行標(biāo)注,使得構(gòu)建情感詞典準(zhǔn)確性較低。
技術(shù)實現(xiàn)思路
為了解決現(xiàn)有技術(shù)的問題,本專利技術(shù)實施例提供了一種構(gòu)建情感詞典的方法及裝置。所述技術(shù)方案如下:一方面,提供了一種構(gòu)建情感詞典的方法,所述方法包括:獲取多個待識別的建模語料;從每個待識別的建模語料中,獲取至少一個情感特征詞;對于任一情感特征詞,獲取對所述情感特征詞的至少兩個標(biāo)注結(jié)果,所述至少兩個標(biāo)注結(jié)果由發(fā)表者及多個接收者標(biāo)注,每個標(biāo)注結(jié)果對應(yīng)一個分類情感標(biāo)簽;根據(jù)對所述情感特征詞的至少兩個標(biāo)注結(jié)果,判斷所述情感特征詞是否滿足預(yù)設(shè)條件;如果所 ...
【技術(shù)保護(hù)點】
一種構(gòu)建情感詞典的方法,其特征在于,所述方法包括:獲取多個待識別的建模語料;從每個待識別的建模語料中,獲取至少一個情感特征詞;對于任一情感特征詞,獲取對所述情感特征詞的至少兩個標(biāo)注結(jié)果,所述至少兩個標(biāo)注結(jié)果由發(fā)表者及多個接收者標(biāo)注,每個標(biāo)注結(jié)果對應(yīng)一個分類情感標(biāo)簽;根據(jù)對所述情感特征詞的至少兩個標(biāo)注結(jié)果,判斷所述情感特征詞是否滿足預(yù)設(shè)條件;如果所述情感特征詞滿足所述預(yù)設(shè)條件,將所述情感特征詞加入到情感詞典中。
【技術(shù)特征摘要】
1.一種構(gòu)建情感詞典的方法,其特征在于,所述方法包括:獲取多個待識別的建模語料;從每個待識別的建模語料中,獲取至少一個情感特征詞;對于任一情感特征詞,獲取對所述情感特征詞的至少兩個標(biāo)注結(jié)果,所述至少兩個標(biāo)注結(jié)果由發(fā)表者及多個接收者標(biāo)注,每個標(biāo)注結(jié)果對應(yīng)一個分類情感標(biāo)簽;根據(jù)對所述情感特征詞的至少兩個標(biāo)注結(jié)果,判斷所述情感特征詞是否滿足預(yù)設(shè)條件;如果所述情感特征詞滿足所述預(yù)設(shè)條件,將所述情感特征詞加入到情感詞典中。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從每個待識別的建模語料中,獲取至少一個情感特征詞,包括:采用指定分詞算法將每個待識別的建模語料切分為多個語素片;對所述多個語素片進(jìn)行過濾,得到至少一個情感特征詞。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對于任一情感特征詞,獲取對所述情感特征詞的至少兩個標(biāo)注結(jié)果,包括:將所述情感特征詞及分類情感標(biāo)簽列表發(fā)送至所述發(fā)表者所在的移動終端,所述分類情感標(biāo)簽列表中包括多個分類情感標(biāo)簽;接收所述發(fā)表者所在移動終端發(fā)送的第一標(biāo)注結(jié)果,所述第一標(biāo)注結(jié)果為所述發(fā)表者從所述分類情感標(biāo)簽列表中,為所述情感特征詞所選取的分類情感標(biāo)簽;將所述情感特征詞及所述分類情感標(biāo)簽列表發(fā)送至多個接收者所在的移動終端;接收每個接收者所在的移動終端發(fā)送的第二標(biāo)注結(jié)果,所述第二標(biāo)注結(jié)果為所述接收者從所述分類情感標(biāo)簽列表中,為所述情感特征詞所選取的分類情感標(biāo)簽;將所述第一標(biāo)注結(jié)果及多個第二標(biāo)注結(jié)果作為所述至少兩個標(biāo)注結(jié)果。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)對所述情感特征詞的至少兩個標(biāo)注結(jié)果,判斷所述情感特征詞是否滿足預(yù)設(shè)條件,包括:對所述情感特征詞的至少兩個標(biāo)注結(jié)果進(jìn)行統(tǒng)計,得到對所述情感特征詞的總標(biāo)記數(shù);判斷所述總標(biāo)記數(shù)是否大于第一閾值;如果所述總標(biāo)記數(shù)大于所述第一閾值,則根據(jù)每個標(biāo)注結(jié)果對應(yīng)的分類情感標(biāo)簽,將所述至少兩個標(biāo)注結(jié)果劃分為多種分類結(jié)果;獲取每種分類結(jié)果在所述總標(biāo)記數(shù)中所占的比值;從每種分類結(jié)果在所述總標(biāo)記數(shù)中所占的比值中,獲取最大比值;判斷所述最大比值是否大于第二閾值;如果所述最大比值大于所述第二閾值,則確定所述情感特征詞滿足預(yù)設(shè)條件。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述如果所述情感特征詞滿足所述預(yù)設(shè)條件,將所述情感特征詞加入到情感詞典中,包括:將所述情感特征詞及所述最大比值對應(yīng)的分類情感標(biāo)簽加入到情感詞典中。6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述分類情感標(biāo)簽列表中包括的分類情感標(biāo)簽為樂標(biāo)簽、好標(biāo)簽、怒標(biāo)簽、哀標(biāo)簽、懼標(biāo)簽、惡標(biāo)簽、驚標(biāo)簽,且每個分類情感標(biāo)簽中包括多個子標(biāo)簽;其中,所述好標(biāo)簽包括尊敬子標(biāo)簽、贊揚(yáng)子標(biāo)簽、相信子標(biāo)簽、喜好子標(biāo)簽、祝愿子標(biāo)簽;所述怒標(biāo)簽包括憤怒子標(biāo)簽;所述哀標(biāo)簽包括悲傷子標(biāo)簽、失望子標(biāo)簽、疚子標(biāo)簽、思子標(biāo)簽;所述懼標(biāo)簽包括慌子標(biāo)簽、恐懼子標(biāo)簽、...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郭向前,
申請(專利權(quán))人:北京新媒傳信科技有限公司,
類型:發(fā)明
國別省市:北京,11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。