本發(fā)明專(zhuān)利技術(shù)公開(kāi)了一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法和裝置,該方法包括以下步驟:首先將收集到的評(píng)分?jǐn)?shù)據(jù)轉(zhuǎn)化為二維矩陣并進(jìn)行數(shù)據(jù)預(yù)處理;其次利用單向異常檢測(cè)法、一致性檢驗(yàn)法及雙向異常檢測(cè)法對(duì)處理后的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行異常判斷,并將檢測(cè)出的異常數(shù)據(jù)歸入異常數(shù)據(jù)集中;然后利用信息熵修正法對(duì)異常數(shù)據(jù)集進(jìn)行異常數(shù)據(jù)修復(fù);最后結(jié)合異常數(shù)據(jù)集生成能力評(píng)價(jià)報(bào)告,并結(jié)合能力評(píng)價(jià)報(bào)告中評(píng)審人的評(píng)分權(quán)重對(duì)修正后的評(píng)分?jǐn)?shù)據(jù)進(jìn)行加權(quán)平均得到最終評(píng)分結(jié)果,并生成異常評(píng)分修正報(bào)告。本發(fā)明專(zhuān)利技術(shù)能夠有效檢測(cè)企業(yè)人員績(jī)效考核中同行互評(píng)分?jǐn)?shù)異常現(xiàn)象,并通過(guò)能力評(píng)估報(bào)告對(duì)評(píng)審人進(jìn)行約束,保證同行互評(píng)結(jié)果的公平、公正及客觀性。性。性。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法和裝置
[0001]本專(zhuān)利技術(shù)涉及企業(yè)人員考核管理制度,尤其涉及一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法和裝置。
技術(shù)介紹
[0002]同行互評(píng)機(jī)制已被越來(lái)越多的企業(yè)應(yīng)用于內(nèi)部人員考核管理中。一方面,企業(yè)管理者可以通過(guò)互評(píng)結(jié)果直觀的了解到不同員工在其他同事眼中的工作能力及工作狀態(tài);另一方面,企業(yè)管理者可以通過(guò)互評(píng)結(jié)果了解日常管理中不曾看到的一面,有助于企業(yè)的發(fā)展。然而,受獎(jiǎng)金、晉級(jí)等超額利益的名額限制,評(píng)分者出于自身利益考慮會(huì)出現(xiàn)“故意壓分”、“抱團(tuán)取暖”等舞弊形式,使得評(píng)分結(jié)果出現(xiàn)異常偏差。因此,如何判斷同行評(píng)分中的異常行為將是保證同行互評(píng)結(jié)果的公平、公正及客觀性的關(guān)鍵所在。
[0003]當(dāng)前針對(duì)評(píng)分異常的判斷主要包括以下三種方法,一是基于統(tǒng)計(jì)的異常數(shù)據(jù)檢測(cè),即預(yù)先假定數(shù)據(jù)集的分布符合某種分布,然后通過(guò)假設(shè)檢驗(yàn)方法判斷數(shù)據(jù)分布是否在置信區(qū)間范圍內(nèi),如基于正態(tài)分布3倍標(biāo)準(zhǔn)差檢測(cè)、基于Grubbs檢測(cè)方法、基于t統(tǒng)計(jì)檢測(cè)法等;二是基于距離的異常數(shù)據(jù)檢測(cè),通過(guò)距離函數(shù)計(jì)算數(shù)據(jù)對(duì)象之間的距離,如超過(guò)距離閾值則判斷異常數(shù)據(jù)點(diǎn);三是關(guān)于密度的異常檢測(cè)方法,即通過(guò)聚類(lèi)算法思想,尋找空間中密度相對(duì)稀疏的對(duì)象。
[0004]除此之外,受評(píng)審人自身偏好、專(zhuān)業(yè)能力與外界環(huán)境等因素影響,使得評(píng)審人在面對(duì)相似的評(píng)審對(duì)象時(shí)表現(xiàn)出不一致性。當(dāng)前度量該現(xiàn)象的指標(biāo)包括肯德?tīng)柡椭C系數(shù)、最大絕對(duì)值偏差、變異系數(shù)及平均離差等。
[0005]然而針對(duì)同行互評(píng)機(jī)制,上述方法均存在或多或少的缺陷。如基于統(tǒng)計(jì)的異常數(shù)據(jù)檢測(cè)需要預(yù)先知道數(shù)據(jù)的分布形態(tài)、參數(shù)個(gè)數(shù)及異常值個(gè)數(shù)。在現(xiàn)實(shí)情況下,數(shù)據(jù)分布形態(tài)往往并不符合標(biāo)準(zhǔn)分布,且對(duì)研究的數(shù)據(jù)維度要求較高。因此如何在未知分布的情況下對(duì)多維評(píng)分?jǐn)?shù)據(jù)進(jìn)行異常檢測(cè)與修正是本專(zhuān)利技術(shù)將要解決的的技術(shù)難題。
技術(shù)實(shí)現(xiàn)思路
[0006]本專(zhuān)利技術(shù)的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法和裝置。
[0007]本專(zhuān)利技術(shù)的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:本專(zhuān)利技術(shù)實(shí)施例第一方面提供了一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法,包括以下步驟:
[0008](1)獲取評(píng)分?jǐn)?shù)據(jù):從企業(yè)人員績(jī)效考核數(shù)據(jù)庫(kù)中收集同行互評(píng)數(shù)據(jù)集,以獲取評(píng)分?jǐn)?shù)據(jù),并對(duì)評(píng)分?jǐn)?shù)據(jù)的原始數(shù)據(jù)信息進(jìn)行結(jié)構(gòu)化轉(zhuǎn)換,以獲取結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù);
[0009](2)清洗評(píng)分?jǐn)?shù)據(jù):采用數(shù)據(jù)清洗方法對(duì)所述步驟(1)得到的結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)清洗的流程包括數(shù)據(jù)缺失值填充與數(shù)據(jù)歸一化處理;
[0010](3)單向異常檢測(cè):對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)中的每一列單向評(píng)分結(jié)果進(jìn)行單向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第一異常數(shù)據(jù)集中;
[0011](4)一致性檢測(cè):采用離散率進(jìn)行一致性檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第二異常數(shù)據(jù)集中;
[0012](5)雙向異常檢測(cè):對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)進(jìn)行雙向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第三異常數(shù)據(jù)集中;
[0013](6)異常數(shù)據(jù)集修復(fù):對(duì)所述第一異常數(shù)據(jù)集、第二異常數(shù)據(jù)集和第三異常數(shù)據(jù)集進(jìn)行異常數(shù)據(jù)修復(fù);
[0014](7)生成評(píng)價(jià)報(bào)告:所述評(píng)價(jià)報(bào)告包括評(píng)審人能力評(píng)價(jià)報(bào)告和異常評(píng)分修正報(bào)告。
[0015]進(jìn)一步地,所述原始數(shù)據(jù)信息包括評(píng)審時(shí)間、評(píng)審人編號(hào)、被評(píng)審人編號(hào)和評(píng)分結(jié)果。
[0016]進(jìn)一步地,所述缺失值填充具體為:利用歷史評(píng)分?jǐn)?shù)據(jù)計(jì)算平均值替代當(dāng)期缺失值進(jìn)行填充;
[0017]所述數(shù)據(jù)歸一化處理具體為:利用最大
?
最小標(biāo)準(zhǔn)化法或Z
?
score法,將評(píng)分?jǐn)?shù)據(jù)統(tǒng)一映射到[0,1]區(qū)間上,并對(duì)評(píng)分?jǐn)?shù)據(jù)按列進(jìn)行升序排列。
[0018]進(jìn)一步地,所述步驟(3)包括以下子步驟:
[0019](3.1)根據(jù)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)的數(shù)據(jù)集構(gòu)建索引結(jié)構(gòu),所述索引結(jié)構(gòu)為Kd
?
樹(shù);
[0020](3.2)異常點(diǎn)挖掘:首先建立查詢路徑,通過(guò)計(jì)算查詢節(jié)點(diǎn)與當(dāng)前最近節(jié)點(diǎn)的距離,判斷是否對(duì)當(dāng)前節(jié)點(diǎn)進(jìn)行回溯,若當(dāng)前距離小于等于設(shè)定的距離閾值D,則對(duì)當(dāng)前節(jié)點(diǎn)進(jìn)行回溯,直至回溯節(jié)點(diǎn)與查詢節(jié)點(diǎn)的距離大于設(shè)定的距離閾值D;其次,進(jìn)行異常點(diǎn)判斷,統(tǒng)計(jì)當(dāng)前查詢節(jié)點(diǎn)D
?
鄰域內(nèi)包含的數(shù)據(jù)對(duì)象的個(gè)數(shù)m1,若所包含的數(shù)據(jù)對(duì)象的個(gè)數(shù)m1小于閾值M,則判斷該查詢點(diǎn)為異常點(diǎn);其中,閾值M為異常點(diǎn)在其D
?
鄰域內(nèi)允許包含數(shù)據(jù)對(duì)象的最多個(gè)數(shù);
[0021](3.3)重復(fù)所述步驟(3.2),依次完成對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)中的每一列中每一個(gè)數(shù)據(jù)對(duì)象的單向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第一異常數(shù)據(jù)集中。
[0022]進(jìn)一步地,所述步驟(3.1)包括以下子步驟:
[0023](3.1.1)確定分割域S:計(jì)算數(shù)據(jù)集在每個(gè)維度上的方差,并選取方差最大的維度作為分割域S;
[0024](3.1.2)確定分割節(jié)點(diǎn)A:將數(shù)據(jù)集按照分割域S上的值進(jìn)行升序排序,并將中位數(shù)做為分割節(jié)點(diǎn)A;
[0025](3.1.3)確定左右子樹(shù):根據(jù)分割節(jié)點(diǎn)A進(jìn)行數(shù)據(jù)切分,將所有小于等于分割節(jié)點(diǎn)A的數(shù)據(jù)對(duì)象劃分至左子樹(shù)中,將所有大于分割節(jié)點(diǎn)A的數(shù)據(jù)對(duì)象劃分至右子樹(shù)中;
[0026](3.1.4)重復(fù)所述步驟(3.1.2)
?
步驟(3.1.3),直至將所有數(shù)據(jù)對(duì)象劃分完成為止。
[0027]進(jìn)一步地,所述離散率代表評(píng)審人對(duì)不同評(píng)審對(duì)象的評(píng)分值與各評(píng)審對(duì)象的平均評(píng)分值之間的偏差,其計(jì)算公式為:
[0028][0029]其中,c
i
為評(píng)審人i的離散率;x
i
′
j
為評(píng)審人i在被評(píng)審人j上的差異程度,x
i
′
j
=x
ij
?
x
j
(mid);是x
i
′
j
的平均值,m代表參與評(píng)審的人數(shù)。
[0030]進(jìn)一步地,所述步驟(5)包括以下子步驟:
[0031](5.1)從結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)的數(shù)據(jù)集中提取特征值,并生成結(jié)構(gòu)化矩陣;其中,特征值包括相關(guān)系數(shù)、差異一致性和離散率;結(jié)構(gòu)化矩陣中的每一行代表一個(gè)樣本,每一列代表一個(gè)特征值變量;
[0032](5.2)根據(jù)結(jié)構(gòu)化矩陣計(jì)算特征變量協(xié)方差矩陣,以對(duì)特征值進(jìn)行相關(guān)性檢測(cè),若檢測(cè)到的相關(guān)性超過(guò)相關(guān)性閾值,則利用主成分分析方法消除特征值變量之間的相關(guān)性;
[0033](5.3)利用特征值進(jìn)行聚類(lèi)并計(jì)算不同數(shù)據(jù)對(duì)象與它最近鄰局部可達(dá)密度比率的平均值,以判斷數(shù)據(jù)對(duì)象的異常程度,并將異常的數(shù)據(jù)對(duì)象加入第三異常數(shù)據(jù)集中。
[0034]進(jìn)一步地,所述步驟(6)包括以下子步驟:
[0035](6.1)從第一異常數(shù)據(jù)集、第二異常數(shù)據(jù)集和第三異常數(shù)據(jù)集中獲取待修正的數(shù)據(jù);
[0036](6.2)利用歷史評(píng)分?jǐn)?shù)據(jù)計(jì)算信息熵,并結(jié)合異常評(píng)分?jǐn)?shù)據(jù)對(duì)最終評(píng)分結(jié)果進(jìn)行修正。
[0037]進(jìn)一步本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種同行互評(píng)異常評(píng)分檢測(cè)及修正方法,其特征在于,包括以下步驟:(1)獲取評(píng)分?jǐn)?shù)據(jù):從企業(yè)人員績(jī)效考核數(shù)據(jù)庫(kù)中收集同行互評(píng)數(shù)據(jù)集,以獲取評(píng)分?jǐn)?shù)據(jù),并對(duì)評(píng)分?jǐn)?shù)據(jù)的原始數(shù)據(jù)信息進(jìn)行結(jié)構(gòu)化轉(zhuǎn)換,以獲取結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù);(2)清洗評(píng)分?jǐn)?shù)據(jù):采用數(shù)據(jù)清洗方法對(duì)所述步驟(1)得到的結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)清洗的流程包括數(shù)據(jù)缺失值填充與數(shù)據(jù)歸一化處理;(3)單向異常檢測(cè):對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)中的每一列單向評(píng)分結(jié)果進(jìn)行單向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第一異常數(shù)據(jù)集中;(4)一致性檢測(cè):采用離散率進(jìn)行一致性檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第二異常數(shù)據(jù)集中;(5)雙向異常檢測(cè):對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)進(jìn)行雙向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第三異常數(shù)據(jù)集中;(6)異常數(shù)據(jù)集修復(fù):對(duì)所述第一異常數(shù)據(jù)集、第二異常數(shù)據(jù)集和第三異常數(shù)據(jù)集進(jìn)行異常數(shù)據(jù)修復(fù);(7)生成評(píng)價(jià)報(bào)告:所述評(píng)價(jià)報(bào)告包括評(píng)審人能力評(píng)價(jià)報(bào)告和異常評(píng)分修正報(bào)告。2.根據(jù)權(quán)利要求1所述的同行互評(píng)異常評(píng)分檢測(cè)及修正方法,其特征在于,所述原始數(shù)據(jù)信息包括評(píng)審時(shí)間、評(píng)審人編號(hào)、被評(píng)審人編號(hào)和評(píng)分結(jié)果。3.根據(jù)權(quán)利要求1所述的同行互評(píng)異常評(píng)分檢測(cè)及修正方法,其特征在于,所述缺失值填充具體為:利用歷史評(píng)分?jǐn)?shù)據(jù)計(jì)算平均值替代當(dāng)期缺失值進(jìn)行填充;所述數(shù)據(jù)歸一化處理具體為:利用最大
?
最小標(biāo)準(zhǔn)化法或Z
?
score法,將評(píng)分?jǐn)?shù)據(jù)統(tǒng)一映射到[0,1]區(qū)間上,并對(duì)評(píng)分?jǐn)?shù)據(jù)按列進(jìn)行升序排列。4.根據(jù)權(quán)利要求1所述的同行互評(píng)異常評(píng)分檢測(cè)及修正方法,其特征在于,所述步驟(3)包括以下子步驟:(3.1)根據(jù)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)的數(shù)據(jù)集構(gòu)建索引結(jié)構(gòu),所述索引結(jié)構(gòu)為Kd
?
樹(shù);(3.2)異常點(diǎn)挖掘:首先建立查詢路徑,通過(guò)計(jì)算查詢節(jié)點(diǎn)與當(dāng)前最近節(jié)點(diǎn)的距離,判斷是否對(duì)當(dāng)前節(jié)點(diǎn)進(jìn)行回溯,若當(dāng)前距離小于等于設(shè)定的距離閾值D,則對(duì)當(dāng)前節(jié)點(diǎn)進(jìn)行回溯,直至回溯節(jié)點(diǎn)與查詢節(jié)點(diǎn)的距離大于設(shè)定的距離閾值D;其次,進(jìn)行異常點(diǎn)判斷,統(tǒng)計(jì)當(dāng)前查詢節(jié)點(diǎn)D
?
鄰域內(nèi)包含的數(shù)據(jù)對(duì)象的個(gè)數(shù)m1,若所包含的數(shù)據(jù)對(duì)象的個(gè)數(shù)m1小于閾值M,則判斷該查詢點(diǎn)為異常點(diǎn);其中,閾值M為異常點(diǎn)在其D
?
鄰域內(nèi)允許包含數(shù)據(jù)對(duì)象的最多個(gè)數(shù);(3.3)重復(fù)所述步驟(3.2),依次完成對(duì)結(jié)構(gòu)化評(píng)分?jǐn)?shù)據(jù)中的每一列中每一個(gè)數(shù)據(jù)對(duì)象的單向異常檢測(cè),并將檢測(cè)出的異常數(shù)據(jù)對(duì)象加入第一異常數(shù)據(jù)集中。5.根據(jù)權(quán)利要求4所述的同行互評(píng)異常評(píng)分檢測(cè)及修正方法,其特征在于,所述步驟(3.1)包括以下子步驟:(3.1.1)確定分割域S:計(jì)算數(shù)據(jù)集在每個(gè)維度上的方差,并選取方差最大的維度作為分割域S;(3.1.2)確定分割節(jié)點(diǎn)A:將數(shù)據(jù)集按照分割域S上的值進(jìn)行升序排序,并將中位數(shù)做為分割節(jié)點(diǎn)A;(3.1.3)確定左右子樹(shù):根據(jù)分割節(jié)點(diǎn)A進(jìn)行數(shù)據(jù)切分,將所有小于等于分割節(jié)點(diǎn)A的數(shù)據(jù)對(duì)象劃分至左子樹(shù)中,將所有大于分割節(jié)點(diǎn)A的數(shù)據(jù)對(duì)象劃分至右子樹(shù)中;
(3.1.4)重復(fù)所述步驟(3.1.2)
?
步驟(3.1.3),直至將所有數(shù)據(jù)對(duì)象...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:王藝涵,楊耀,許浩,陳楊,
申請(qǐng)(專(zhuān)利權(quán))人:之江實(shí)驗(yàn)室,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。