Preference region recognition method and apparatus of the present invention relates to a product, the method includes: acquiring users in different areas of the treated product and the comment text analysis, from the comment text acquisition to extract the product characteristics of products to be analyzed; determine the polarity of the characteristics of the product users in the comments in the text; correlation between the emotional tendency and regional characteristics of computing products; extract features from each regional preference product features; for a regional preference of each product feature, determine the product features for the sentiment polarity preference region. The invention can provide the preference area for the fragmentary and random online product review content, and make the enterprise develop the marketing strategy more effectively, and drive the regional marketing strategy of the enterprise product.
【技術實現步驟摘要】
產品的偏好區域識別方法和裝置
本專利技術涉及文本挖掘
,尤其是涉及一種產品的偏好區域識別方法和裝置。
技術介紹
隨著Web2.0技術的快速發展,越來越多的用戶選擇通過在線社交媒體發表自己的購物體驗。研究表明77%的消費者在購買之前會瀏覽在線評論。相比于個人推薦,75%的消費者更加相信在線產品評論。研究結果說明,在線產品評論在用戶的購買決策中扮演著越來越重要的角色,成為企業重要的信息資源。從用戶空間分布來看,不同區域的用戶由于區域環境、文化以及經濟的差異,對產品特征的偏好是不同的。實現對不同區域特征偏好的識別,從而驅動企業產品的區域化營銷策略。但是,由于在線產品評論內容的零碎性和隨意性,導致從在線產品評論中識別產品特征區域偏好十分復雜。
技術實現思路
針對以上缺陷,本專利技術提供一種產品的偏好區域識別方法和裝置,可以提供偏好區域,使企業更加有針對性的制定營銷策略,驅動企業產品的區域化營銷策略。第一方面,本專利技術提供的產品的偏好區域識別方法包括:獲取不同區域的用戶對待分析產品的評論文本,并從獲取的各條評論文本中提取出所述待分析產品的產品特征,其中的區域為用戶所屬城市的等級或用戶的所屬地區;根據在每一條評論文本中的每一個產品特征的觀點詞,確定在該條評論文本中用戶對該產品特征的情感極性;根據每一個產品特征在包含該產品特征的各條評論文本中的情感極性以及包含該產品特征的各條評論文本的用戶的所屬區域,計算該產品特征的情感傾向與區域之間的關聯程度;根據各個產品特征的情感傾向與區域之間的關聯程度,從各個產品特征中提取出具有區域偏好的產品特征;對于提取出的具有區域偏好的每 ...
【技術保護點】
一種產品的偏好區域識別方法,其特征在于,包括:獲取不同區域的用戶對待分析產品的評論文本,并從獲取的各條評論文本中提取出所述待分析產品的產品特征,其中的區域為用戶所屬城市的等級或用戶的所屬地區;根據在每一條評論文本中的每一個產品特征的觀點詞,確定在該條評論文本中用戶對該產品特征的情感極性;根據每一個產品特征在包含該產品特征的各條評論文本中的情感極性以及包含該產品特征的各條評論文本的用戶的所屬區域,計算該產品特征的情感傾向與區域之間的關聯程度;根據各個產品特征的情感傾向與區域之間的關聯程度,從各個產品特征中提取出具有區域偏好的產品特征;對于提取出的具有區域偏好的每一個產品特征,根據在不同區域中包含該產品特征且該產品特征的情感極性相同的評論文本的數量的統計值與期望值之間的差值,確定該產品特征針對該情感極性的偏好區域。
【技術特征摘要】
1.一種產品的偏好區域識別方法,其特征在于,包括:獲取不同區域的用戶對待分析產品的評論文本,并從獲取的各條評論文本中提取出所述待分析產品的產品特征,其中的區域為用戶所屬城市的等級或用戶的所屬地區;根據在每一條評論文本中的每一個產品特征的觀點詞,確定在該條評論文本中用戶對該產品特征的情感極性;根據每一個產品特征在包含該產品特征的各條評論文本中的情感極性以及包含該產品特征的各條評論文本的用戶的所屬區域,計算該產品特征的情感傾向與區域之間的關聯程度;根據各個產品特征的情感傾向與區域之間的關聯程度,從各個產品特征中提取出具有區域偏好的產品特征;對于提取出的具有區域偏好的每一個產品特征,根據在不同區域中包含該產品特征且該產品特征的情感極性相同的評論文本的數量的統計值與期望值之間的差值,確定該產品特征針對該情感極性的偏好區域。2.根據權利要求1所述的方法,其特征在于,所述從獲取的各條評論文本中提取出所述待分析產品的產品特征,包括:對各條評論文本進行中文分詞,從分詞結果中提取出名詞和名詞短語;利用關聯規則從提取出的名詞和名詞短語中提取出頻繁項集;對所述頻繁項集中的名詞和/或名詞短語進行同義詞聚合,并剔除所述頻繁項集中的非產品特征詞。3.根據權利要求1所述的方法,其特征在于,所述根據在每一條評論文本中的每一個產品特征的觀點詞,確定在該條評論文本中用戶對該產品特征的情感極性,包括:確定所述觀點詞所屬的情感詞庫的類型;根據所述情感詞庫的類型,確定該條評論文本中用戶對該產品特征的情感極性。4.根據權利要求1所述的方法,其特征在于,所述每一條評論文本中的每一個產品特征的觀點詞為在該條評論文本中與該產品特征鄰近的預設數量的字符中的形容詞。5.根據權利要求1所述的方法,其特征在于,采用下式計算每一個產品特征的情感傾向與區域之間的關聯程度:式中,χ2為該產品特征的情感傾向與區域之間的關聯程度,nkj為在第k個區域中包含該產品特征且該產品特征的情感極性為j的評論文本的數量的統計值,Ekj為在第k個區域中包含該產品特征且該產品特征的情感極性為j的評...
【專利技術屬性】
技術研發人員:張強,王安寧,楊善林,彭張林,倪鑫,任明侖,陸效農,
申請(專利權)人:合肥工業大學,
類型:發明
國別省市:安徽,34
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。