The invention relates to electronic commerce, aiming at providing an analysis method and system of product quality credit index of electronic commerce. The method of product quality credit index analysis for e-commerce firstly defines the index used to construct the product quality credit index of e-commerce, obtains the initial product quality credit index of each commodity according to the hierarchy, calculates the original growth rate of the tool variable corresponding to each commodity in the time dimension, and revises the algorithm of the original growth rate to obtain the revised growth rate. The revised growth rate is used to update the quality credit index of historical e-commerce products. Finally, the quality credit index and voting rights of each commodity are collected to calculate the quality credit index of e-commerce products in the overall industry. The invention is an innovative calculation method for the analysis of the quality credit index of electronic commerce products, which can analyze the electronic commerce products in depth, depict the track of the development fluctuation of electronic commerce products truthfully, and effectively monitor the development trend of the electronic commerce product industry.
【技術實現步驟摘要】
一種電商產品質量信用指數分析方法及系統
本專利技術是關于電子商務領域,特別涉及一種電商產品質量信用指數分析方法及系統。
技術介紹
電子商務運用越來越廣泛,很多電商平臺如天貓、京東都極大地便利了人們的生活,用戶對產品質量的關注不斷增加,然而僅僅憑借電商平臺的網上用戶評論來判斷商品的好壞仍具有一定的局限性,比如部分商家通過不正常的手段刷好評,或者惡意評論競爭對手的商品,這些都會給用戶造成誤導。信息的不對稱、不全面、不透明,致使用戶無法科學有效決策,進而無法根據自己意愿選擇電商平臺的高質量商品,長此以往不僅會造成不愉快的使用體驗,甚至會擾亂電商市場。因此,需要公開透明許多有關商品的信息,使用戶和商家信息對等,用戶方能全面地了解商品的各個維度。傳統的商品評價方法有因子分析法,對評論真實度情感分析,提取產品質量特征詞進行產品綜合評價等方法。這些方法普遍都過于重視對評論的情感分析,沒有將線下如產品質檢報告,制造商的勞動力資本等要素考慮在內,而且采用的機器學習方法如神經網絡訓練權重價格昂貴,不同商品采用普遍性的標準不夠準確,上述方案均不能很好的完成。針對目前電子商務領域存在的假冒偽劣、消費者對產品良莠難辨、傳統產品質量監管手段不適用等現狀,產生了很多基于互聯網環境的產品質量信用評價模型,它們一般包含如下幾個主要工作流程:首先從異構的系統數據源中采集跨域數據,將不同類型和結構的原始數據清洗、處理成統一框架下的標準化數據,對非結構化數據中的關鍵信息通過相應信息抽取算法提取出來完成結構化過程,將這些綜合性的數據提交給統一的產品質量數據倉庫;然后通過大數據分析計算,建立統一的產 ...
【技術保護點】
1.一種電商產品質量信用指數分析方法,其特征在于,具體包括下述步驟:步驟(1):采集并融合多源跨平臺的電商產品質量數據;先從異構的系統數據源中采集數據對象,采集完成后,將不同類型和不同結構的原始數據清洗、處理成統一框架下的標準化數據;異構的系統數據源包括結構化的數據源和非結構化的數據源;結構化的數據源中存儲結構化數據,結構化數據包括產品質量檢驗報告、商家征信記錄和電商平臺產品屬性數據;非結構化的數據源中存儲非結構化數據,非結構化數據包括文本化的產品質量檢測結果數據、電商平臺上針對產品的用戶評價文本和產品質量輿情信息;標準化數據是指:將原始數據按比例縮放到一個特定區間,去除數據的單位限制,形成的無量綱的純數值的數據;不同類型和不同結構的原始數據處理后,得到的標準化數據分為結構化的標準化數據和非結構化的標準化數據:對于結構化的標準化數據,直接提交給統一的產品質量數據倉庫;對于非結構化的標準化數據,先將非結構化的標準化數據中的關鍵信息,通過相應信息抽取算法提取出來完成結構化過程,變成結構化的標準化數據后,再提交給統一的產品質量數據倉庫;步驟(2):定義電商產品質量信用指數評價模型,構建用于表 ...
【技術特征摘要】
1.一種電商產品質量信用指數分析方法,其特征在于,具體包括下述步驟:步驟(1):采集并融合多源跨平臺的電商產品質量數據;先從異構的系統數據源中采集數據對象,采集完成后,將不同類型和不同結構的原始數據清洗、處理成統一框架下的標準化數據;異構的系統數據源包括結構化的數據源和非結構化的數據源;結構化的數據源中存儲結構化數據,結構化數據包括產品質量檢驗報告、商家征信記錄和電商平臺產品屬性數據;非結構化的數據源中存儲非結構化數據,非結構化數據包括文本化的產品質量檢測結果數據、電商平臺上針對產品的用戶評價文本和產品質量輿情信息;標準化數據是指:將原始數據按比例縮放到一個特定區間,去除數據的單位限制,形成的無量綱的純數值的數據;不同類型和不同結構的原始數據處理后,得到的標準化數據分為結構化的標準化數據和非結構化的標準化數據:對于結構化的標準化數據,直接提交給統一的產品質量數據倉庫;對于非結構化的標準化數據,先將非結構化的標準化數據中的關鍵信息,通過相應信息抽取算法提取出來完成結構化過程,變成結構化的標準化數據后,再提交給統一的產品質量數據倉庫;步驟(2):定義電商產品質量信用指數評價模型,構建用于表示電商產品質量信用指數的層次指標框架,并確定用于表示所定義指標的工具變量;電商產品質量信用指數評價模型包括目標層、概念層、指標層、數據層和技術層;目標層設置指標:電商產品質量信用,電商產品質量信用于作為評價該電商產品質量的數據;概念層設置指標:固有質量、損失質量、感知質量、商家信用和質量追溯;其中,固有質量、損失質量和感知質量共同構成產品質量;指標層設置指標:標準化指標、生產指標、設計指標、原材料指標、安全性指標、環保性指標、消費者指標、三方指標、服務指標、基礎指標、金融指標、信用指標和溯源指標;數據層即步驟(1)所述的產品質量數據倉庫,存儲有:產品質檢數據、電商平臺數據、政府數據、溯源數據、金融機構數據、三方機構數據、商家數據和運行數據,用于作為電商產品質量信用指數評價模型的數據來源;技術層對各層指標進行降維操作,用于減少指標數量,計算得到最終的電商產品質量信用指數;在電商產品質量信用指數評價模型中,存在層次指標框架,具體是指:概念層的指標,共同對應上層次目標層的電商產品質量信用指數;指標層的指標,對應上層次概念層的指標:標準化指標、生產指標、設計指標和原材料指標對應概念層的固有質量,安全性指標和環保性指標對應概念層的損失質量,消費者指標、三方指標和服務指標對應概念層的感知質量,基礎指標、金融指標和信用指標對應概念層的商家信用,溯源指標對應概念層的質量追溯;指標層的指標,分別對應不同的工具變量:標準化指標對應制造許可證和節能環保認證;生產指標對應流水線管理和生產環境控制;設計指標對應功能實用性;原材料指標對應原材料質量檢驗和原材料運輸存儲;安全性指標對應安全損害性;環保性指標對應環保損害性;消費者指標對應消費者滿意度;三方指標對應行業協會評價和媒體評價;服務指標對應售前和售后服務;基礎指標對應工商登記信息、納稅情況、法定資質和勞動力投入;金融指標對應信貸信息和保險信息;信用指標對應企業質量信用;溯源指標對應產品質量追溯網絡;步驟(3):量化層次指標框架中的工具變量,并確定工具變量類型;制定量化標準,并根據量化標準,對所述工具變量進行量化,得到各個工具變量的量化值,作為各個工具變量的初始數值;指定各個工具變量的類型,工具變量的類型分為:數值類型變量、狀態類型變量、比例類型變量;步驟(4):構造判斷矩陣并計算各層次指標權重;分別對目標層、概念層、指標層中的各指標的相對重要性給出判斷,并用數值表示出來,寫成矩陣形式即形成判斷矩陣;然后,對判斷矩陣按行進行歸一化,得到每一個指標的權重;每一層次指標的權重計算方法具體為:計算該層次對應判斷矩陣的行中元素的乘積Mi,i=1~n,n是指該行元素的數量;然后計算Mi的n次方根Ni,即得到向量N=(N1,N2,...,Nn)T;其中,T是指矩陣轉置;對向量N進行歸一化處理,即求得該行每一個元素的權重Pi:步驟(5):按權重合成每個商品的初始電商產品質量信用指數;對步驟(3)得到的工具變量的初始數值進行加權,計算得到概念層指標j的初始質量信用指數ConceptionIndexij0:其中,bk是商品i的工具變量k的初始數值;wk是商品i的工具變量k所對應的指標的權重,即由步驟(4)計算得到;indicators是商品i的指標層的指標對應的工具變量集合;然后,對概念層的初始質量信用指數進行加權,得到目標層指標的初始質量信用指數Indexi0:其中,uj是概念層指標j的權重,即由步驟(4)計算得到;步驟(6):利用每個工具變量類型對應的增長率算法,計算每個商品所對應指標的工具變量的原始增長率;對應數值類型的增長率算法:其中,i是指商品i;t是指月份t;RelativeRatioit是指商品i在t月的工具變量的原始增長率;Xit是指商品i在t月的工具變量的值,Xit-1是指商品i在(t-1)月的工具變量的值,這里的工具變量的值是指標層的每個指標所對應的工具變量值;對應狀態類型的增長率算法:對應比例類型的增長率算法:其中,Zit是指商品i在t月的比例類型工具變量值,Zit-1是指商品i在(t-1)月的比例類型工具變量值,這里的比例類型工具變量值是指標層的每個指標所對應的工具變量值;步驟(7):修正原始增長率以獲得修正后增長率;根據增長率數據的數據分布情況,對增長率進行標準化,將標準化增長率作為修正增長率;增長率的取值范圍是[-1,+INF],其中INF是指無窮大;電商產品質量信用指數評價模型中的指標類型分為:流量類型指標、比例類型指標和狀態類型指標;根據工具變量對應的指標的類型,標準化增長率的方式具體為:方式1)對于流量類型或者比例類型的指標對應的工具變量:其中,RelativeRatio’it是指商品i在t月的工具變量的修正增長率;x是指商品i在t月的工具變量的原始增長率,由步驟(6)計算得到;方式2)對于狀態類型的指標對應的工具變量:RelativeRatio′it=RelativeRatioit步驟(8):按權重合成各變量的修正增長率,按月份更新每個商品的質量信用指數;計算每個商品的產品質量信用指數的方法,具體為:通過對工具變量的修正增長率數值進行加權來得到該產品當月的產品質量信用指數增長率IndexRationit:其中,RelativeRatio’ijt是商品i的工具變量j在t月的修正增長率;wj是工具變量j在計算質量信用指數中的權重,由步驟(4)計算得到;indicators是商品i的指標層的指標對應的工具變量集合;利用當前月份產品質量信用指數增長率對歷史產品質量信用指數進行更新,得到當前月份的產品質量信用指數Indexit:Indexit=lndexit-1*(1+IndexRatioit)其中,Indexit-1是前一個月份的產品質量信用指數;所述符號“*”是指乘法運算;步驟(9):計算每個商品的投票權,集合每個商品的產品質量信用指數及投票權來計算總體產品質量信用指數;計算每個商品的投票權變量,具體包括下述方法步驟為:方法步驟1):確定銷量總和的占比超過市場總銷量的固定百分比r的前topN商品;topN值的計算方法為:將商品銷量按從大到小排序,取前topN個商品,使得這些商品的銷量和大于等于市場總銷量的固定百分比r;其中,r為常數,取值范圍為:10%~50%;方法步驟2):計算集中度ratio:其中,為近N個月所述topN商品的銷量和;N為常數,取值范圍為:1~12;mean(volume)為該行業中的同類商品的平均銷量;方法步驟3):根據銷量和集中度計算投票權voteit:其中,volumeit為近M個月商品i的平均成交量;M為自然數,取值范圍為1~5;voteit是商品i在t月的投票權;τ是指投票溫度,取值范圍為0~1,設置τ越小則銷量高的商品權重越高;所述items是指該行業中的同類商品集合;volumekt是指商品k在t月的銷量,k指商品k;符號“*”是指乘法運算;集合每個商品的產品質量信用指數及投票權變量來計算得到當前月份的總體產品質量信用指數,公式如下:其中,items是指該行業中的同類商品集合;L默認值為100;計算得到的總體產品質量信用指數Indext,即為最終評價電商產品當前月份的質量信用的數據,該值越大,則產品質量信用越好。2.一種電商產品質量信用指數分析...
【專利技術屬性】
技術研發人員:鄭小林,楊煜溟,陳凌飛,
申請(專利權)人:浙江大學,
類型:發明
國別省市:浙江,33
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。