本發明專利技術公開了一種基于用戶心智模型的網站分類優化分析方法。該方法首先對網站日志數據進行預處理,所述日志數據是包含用戶基于對網站分類目錄的認知而提交的關于網站分類目錄優化的概念的數據,通過預處理從日志數據中提取出概念;然后利用用戶心智模型分類理論,確定其與網站分類目錄中的概念之間的共現關系,所述概念是指網站分類目錄具體名稱,例如圖書、生活用品;之后將共現關系轉換為共現矩陣;再利用pearson系數算法將共現矩陣轉換為相似性矩陣;最后進行聚類分析和多維尺度分析,以分析用戶關于網站分類目錄認知的概念間的相似性和空間性。利用上述六個步驟就可基于網站用戶心智模型,從定量角度為網站分類優化提供決策支持。
【技術實現步驟摘要】
本專利技術涉及一種網站分類優化分析方法,特別是。
技術介紹
網站信息分類體系優化是在評估網站已有信息分類體系的基礎上,決定是否需要調整網站已有信息分類體系,若需要調整則確定如何調整。目前針對網站信息分類體系優化方法的研究還很欠缺,主要集中在分類依據、標準、原則等理論研究和分類的層次、粒度等具體問題現象的研究上,還僅僅關注于從已有的分類方法中找缺陷,較少有研究在一定的理論方法的支持下進行深層次的探索。Norman在他的《The Design ofEveryday Things)) 一書中首次提出了交互設計中存在3種心智模型,即表現模型、用戶心智模型、系統模型,他認為表現模型和用戶心智模型越接近時,用戶更能理解網站組織結構,能更高效地進行信息獲取。因此在進行網站信息分類體系優化時應該盡量考查用戶的心智模型,即用戶對網站分類體系的認知。在網站用戶的心智模型測量中,心理近似數據是由個體感知的概念之間關系的主觀評估,其中“相似性”、“空間性”是主要測量角度。心智模型的定量測量大多都是以概念相似性為出發點,提取研究主題中的相關概念,采用不同的分類方法設計實驗,獲取被試對概念的相似性評估數據,對數據進行分析,表征用戶關于相關研究主題的心智模型。聚類分析通常就是用來處理概念相似性數據,依據概念相似性將概念進行分類。而概念的空間性是指不同的概念在被試心理空間中的相對位置(Rusbult C. E, Onizuka R. K, Lipkus I. What Do We Really Want :MentalModels of Ideal Romantic Involvement Explored through Multidimensional Scaling. Journal ofExperimental Social Psychology, 1993,29(9) :493_527),多維尺度法可用于概念空間性的測量,得到用戶關于概念的空間表征,直觀地觀察用戶關于某一領域概念的心智模型。而當前將兩者結合起來用于網站分類目錄優化中用戶心智模型測量的研究還沒有。當前對網站用戶的研究還都是停留在傳統的用戶調研階段,采用的用戶調研方式主要包括場景法、焦點小組、可用性測試、深度訪談、觀察法等,但是這些方法都存在局限性,能夠獲取到的有效數據十分有限,耗費成本高且采用這些方式進行用戶調查時,涉及問題不能太多,因此獲得信息太宏觀,很難獲得對用戶行為研究真正有用的細節信息。因此網站分類體系優化方法還是存在一些問題(1)很難進行有效的用戶研究, 很難全面地搜集用戶對網站的認知;(2)很少“以用戶為中心”進行網站分類體系優化。
技術實現思路
本專利技術所解決的技術問題在于提供。實現本專利技術目的的技術解決方案為,步驟如下步驟I、對網站日志數據進行預處理,具體為步驟1-1、對網站日志數據進行凈化,刪除日志文件中與分析目的無關或存在錯誤的數據,所述與分析目的無關的數據包括包含分類目錄中概念的數據、包含產品用代碼表示的數據;所述存在錯誤的數據包括拼寫錯誤、產品描述錯誤;之后選擇數據處理中需要的屬性,所述屬性包括用戶名稱、用戶地域、用戶認知概念、產品類別,所述的用戶認知概念為用戶基于對網站分類目錄的認知而提交的關于網站分類目錄優化的概念;步驟1-2、對步驟1-1中凈化過的數據進行格式轉化,將提取的用戶認知概念及地域、名稱三個屬性的格式進行統一,具體為去除編號、大小寫統一、單復數統一;步驟1-3、確定用戶認知概念出現的頻次,之后設定閾值,閾值根據實際數據量及提取用戶認知概念數量確定,選取頻次大于該閾值的用戶認知概念,并記錄頻次;步驟2、確定用戶認知概念與網站分類目錄中的概念是否共現,具體是利用心智模型分類理論,將用戶認知概念作為檢索關鍵詞到網站進行檢索,統計檢索結果中出現的分類目錄中的概念及頻次;步驟3、生成共現矩陣,所述共現矩陣為對稱矩陣,第一行和第一列為概念,包括用戶認知概念和網站分類目錄中的概念,其余單元格均為概念間的共現頻次,具體為單元格對應的第一行和第一列中概念間的共現頻次;步驟4、在步驟3中共現矩陣的基礎上生成相似度矩陣;步驟5、在步驟4的基礎上進行聚類分析,具體利用譜系聚類法對相似度矩陣進行聚類,之后根據聚類的統計量,確定概念的聚類結果,所述概念包括提取的用戶認知概念和網站分類目錄中的概念;步驟6、利用多維尺度分析對步驟4中的相似度矩陣進行分析,得到相應維數的多維尺度分析空間圖,從而完成網站分類優化分析。本專利技術與現有技術相比,其顯著優點為(1)本專利技術直接利用網站日志數據進行用戶研究,節約用戶調研的成本,可以全面的獲取用戶信息;(2)采用定量計算方法,結果準確,分析得到的最終結果可直接為網站分類體系優化提供依據;(3)聚類分析和多維尺度分析兩者展現用戶心智模型的兩個關鍵點“相似性”和“空間性”,且兩者的分析結果可相互驗證,直觀地展現可視化結果。下面結合附圖對本專利技術作進一步詳細描述。附圖說明圖I是本專利技術的基于用戶心智模型的網站分類優化分析方法流程圖。圖2是二級分類目錄中概念與自定義組名聚類樹。圖3是二級分類目錄中概念與自定義組名的多維尺度分析空間圖。具體實施方式,步驟如下步驟I、對網站日志數據進行預處理,具體為步驟1-1、對網站日志數據進行凈化,刪除日志文件中與分析目的無關或存在錯誤的數據,所述與分析目的無關的數據包括包含分類目錄中概念的數據、包含產品用代碼表示的數據;所述存在錯誤的數據包括拼寫錯誤、產品描述錯誤;之后選擇數據處理中需要的屬性,所述屬性包括用戶名稱、用戶地域、用戶認知概念、產品類別,所述的用戶認知概念為用戶基于對網站分類目錄的認知而提交的關于網站分類目錄優化的概念,即用戶利用網站分類目錄進行瀏覽時,找不到最合適的概念時,在網站交互界面提交的自己認為更合適的概念;例如用戶在卓越網上利用分類目錄查找數據挖掘的書籍,發現該類書籍屬于分類目錄“數據庫”類別,認為這樣不合適,用戶認為數據挖掘應該直接出現在分類目錄類別中, 這時“數據挖掘”就是所述的用戶認知概念。步驟1-2、對步驟1-1中凈化過的數據進行格式轉化,將提取的用戶認知概念及地域、名稱三個屬性的格式進行統一,具體為去除編號、大小寫統一、單復數統一;步驟1-3、確定用戶認知概念出現的頻次,之后設定閾值,閾值根據實際數據量及提取用戶認知概念數量確定,例如,在實際數據量和用戶認知概念數量均較小的情況下,為了獲取一定的數據量,可設定較小的閾值。選取頻次大于該閾值的用戶認知概念,并記錄頻次;步驟2、確定用戶認知概念與網站分類目錄中的概念是否共現,具體是利用心智模型分類理論,將用戶認知概念作為檢索關鍵詞到網站進行檢索,統計檢索結果中出現的分類目錄中的概念及頻次;根據心智模型分類理論,用戶在網站利用分類目錄進行信息獲取時,主要采用水平、垂直和水平垂直均等的點擊方式,點擊過程中根據分類目錄中概念間的相關性,選擇相關性高的概念進行點擊,利用這一原理,將用戶認知概念作為檢索關鍵詞到網站進行檢索, 統計檢索結果中出現的分類目錄中的概念及其頻次,以分析用戶認知概念與網站分類目錄中概念間的相關性。心智模型分類理論是Charles Cole, Yang Lin等人通過實驗發現人的心智模型最常見的三種是垂本文檔來自技高網...
【技術保護點】
一種基于用戶心智模型的網站分類優化分析方法,其特征在于,步驟如下:步驟1、對網站日志數據進行預處理,具體為:步驟1?1、對網站日志數據進行凈化,刪除日志文件中與分析目的無關或存在錯誤的數據,所述與分析目的無關的數據包括:包含分類目錄中概念的數據、包含產品用代碼表示的數據;所述存在錯誤的數據包括:拼寫錯誤、產品描述錯誤;之后選擇數據處理中需要的屬性,所述屬性包括用戶名稱、用戶地域、用戶認知概念、產品類別,所述的用戶認知概念為用戶基于對網站分類目錄的認知而提交的關于網站分類目錄優化的概念;步驟1?2、對步驟1?1中凈化過的數據進行格式轉化,將提取的用戶認知概念及地域、名稱三個屬性的格式進行統一,具體為去除編號、大小寫統一、單復數統一;步驟1?3、確定用戶認知概念出現的頻次,之后設定閾值,選取頻次大于該閾值的用戶認知概念,并記錄頻次;步驟2、確定用戶認知概念與網站分類目錄中的概念是否共現,具體是利用心智模型分類理論,將用戶認知概念作為檢索關鍵詞到網站進行檢索,統計檢索結果中出現的分類目錄中的概念及頻次;步驟3、生成共現矩陣,所述共現矩陣為對稱矩陣,第一行和第一列為概念,包括用戶認知概念和網站分類目錄中的概念,其余單元格均為概念間的共現頻次,具體為單元格對應的第一行和第一列中概念間的共現頻次;步驟4、在步驟3中共現矩陣的基礎上生成相似度矩陣;步驟5、在步驟4的基礎上進行聚類分析,具體利用譜系聚類法對相似度矩陣進行聚類,之后根據聚類的統計量,確定概念的聚類結果,所述概念包括提取的用戶認知概念和網站分類目錄中的概念;步驟6、利用多維尺度分析對步驟4中的相似度矩陣進行分析,得到相應維數的多維尺度分析空間圖,從而完成網站分類優化分析。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:吳鵬,張佩佩,
申請(專利權)人:南京理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。