The invention discloses a method for mining positive and negative sequence rules, which belongs to the field of sequence rules mining. The technical problem to be solved is how to mine negative sequence rules to fully reflect the relationship between customers'buying behavior and purchasing commodities. The method comprises the following steps: mining sequence databases to obtain positive and negative sequence patterns, the positive and negative sequence patterns include positive sequence patterns. The positive and negative sequence rules are generated by the positive and negative sequence patterns mentioned above. The positive and negative sequence rules include positive sequence rules and negative sequence rules. The positive and negative sequence rules can contain negative elements in both the front and back keys of the negative sequence rules. Based on the support, correlation and confidence of the sequence rules, each sequence rule in the positive and negative sequence rules is filtered sequentially to obtain the positive and negative sequence rules. Positive and negative sequence rules satisfying user-defined requirements. This method reflects the order of purchase of goods in customer's purchase behavior, and also reflects the negative and positive correlation between goods in each purchase behavior.
【技術實現步驟摘要】
一種挖掘正負序列規則的方法
本專利技術涉及序列規則挖掘領域,具體地說是一種挖掘正負序列規則的方法。
技術介紹
序列模式的主要目的是研究商品購買的先后關系,找出其中的規律,即不僅需要知道商品是否被購買,而且需要確定該商品與其它商品購買的先后順序,例如,購買行為C可能在一些購買行為A和B之后頻繁出現,但也有許多情況下A和B不跟隨C。在這種情況下,根據序列模式ABC,而預測C將發生在AB之后可能是一個巨大的錯誤。因此,為了進行預測,需要指示在序列模式AB之后出現多少次C以及多少次不出現C。很顯然序列模式無法很好的解決對商品的預測問題。為了實現對商品進行預測的功能,序列規則被提出,它是指如果發生某些事件,則某些其他事件可能會在給定的置信度或概率的范圍之內隨之發生。但在應用序列規則分析客戶購買行為,解決個性化商品推薦問題時,目前僅考慮了已發生的事件,也稱為正序列規則(PositiveSequentialRule,PSR)挖掘,為研究事件之間的負相關的關系,研究人員提出了負序列規則挖掘,負序列規則(NegativeSequentialRule,NSR)挖掘不僅僅考慮了事物之間的正相關性,還將事物之間的負相關性考慮在內,它能更全面的理解和挖掘數據中的潛在含義。例如,b代表咖啡,c代表茶,表示一個客戶購買序列規則,該規則說明在某一段時間內,該客戶在購買了商品b的情況下,很大概率下不會再購買商品c。如何挖掘負序列規則,以全面反映顧客的購買行為和購買商品之間的關系,是需要解決的技術問題。
技術實現思路
本專利技術的技術任務是針對以上不足,提供一種挖掘正負序列規則的方法,來解決如何 ...
【技術保護點】
1.一種挖掘正負序列規則的方法,其特征在于包括如下步驟:S100、對序列數據庫進行挖掘,得到正負序列模式,上述正負序列模式包括正序列模式和負序列模式;S200、通過上述正負序列模式生成正負序列規則,所述正負序列規則包括正序列規則和負序列規則,所述負序列規則的前鍵和后鍵中均能夠包含負元素;S300、基于序列規則的支持度、相關性以及置信度對上述正負序列規則中的每個序列規則依次進行篩選,得到滿足用戶定義需求的正負序列規則。
【技術特征摘要】
1.一種挖掘正負序列規則的方法,其特征在于包括如下步驟:S100、對序列數據庫進行挖掘,得到正負序列模式,上述正負序列模式包括正序列模式和負序列模式;S200、通過上述正負序列模式生成正負序列規則,所述正負序列規則包括正序列規則和負序列規則,所述負序列規則的前鍵和后鍵中均能夠包含負元素;S300、基于序列規則的支持度、相關性以及置信度對上述正負序列規則中的每個序列規則依次進行篩選,得到滿足用戶定義需求的正負序列規則。2.根據權利要求1所述的一種挖掘正負序列規則的方法,其特征在于在執行步驟S100之前,進行數據處理,數據處理包括將客戶的交易數據以時間為序進行轉變生成序列數據庫。3.根據權利要求1所述的一種挖掘正負序列規則的方法,其特征在于步驟S100中通過e-NSP算法對序列數據庫進行挖掘,包括如下步驟:S110、通過傳統的正序列模式挖掘算法挖掘所有的正序列模式,并計算正序列模式的支持度;S120、基于上述正序列模式生成負序列模式;S130、通過將負序列模式轉換為正序列模式計算負序列模式的支持度。4.根據權利要求3所述的一種挖掘正負序列規則的方法,其特征在于通過哈希表存儲上述正負序列模式以及正負序列模式的支持度,哈希表的key值用于存儲上述正負序列模式,哈希表的value值用于存儲上述正負序列的支持度。5.根據權利要求3所述的一種挖掘正負序列規則的方法,其特征在于步驟S200中,對正負序列模式進行判斷選擇,如果該正負序列模式的大小大于1,通過上述正負序列模式生成正負序列規則。6.根據權利要求5所述的一種挖掘正負序列規則的方法,其特征在于在執行步驟S300之前,判斷正負序列規...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。