本發明專利技術涉及一種電力數據指數快速生成方法及系統,從指標庫中獲取所需指標數據作為數據源;根據所述數據源,從指標數據特征、指標數據分布進行指標數據探索性分析、指標相關性度量及指標重要程度分析以進行指標篩選和組合;通過數值變換對所述篩選和組合后的指標進行連續變換處理或離散變換處理,生成基礎指數;將所述基礎指數根據各自權重進行加權計算得到中間指數;根據所述中間指數綜合評判得到電力數據產品指數,建立指數體系。本發明專利技術能夠實現指標數據分析、基礎指數生成、指體系構建等功能。功能。功能。
【技術實現步驟摘要】
一種電力數據指數快速生成方法及系統
[0001]本專利技術涉及指數處理
,尤其涉及一種電力數據指數快速生成方法及系統。
技術介紹
[0002]現有技術中,指數或稱統計指數,是分析社會經濟現象數量變化的一種重要統計方法,是一種表明社會經濟現象動態的相對數。運用指數可以測定不能直接相加和不能直接對比的社會經濟現象的總動態;可以分析社會經濟現象總變動中各因素變動的影響程度;可以研究總平均指標變動中各組標志水平和總體結構變動的作用。指數按所反映的現象范圍不同,分為個體指數和總指數。前者反映個體經濟現象變動的相對數,如個別產品的物量指數、個別商品的價格指數等;后者是表明全部經濟現象變動的相對數,如工業總產值指數、居民消費價格總指數。
[0003]電力數據以脫敏化指數方式服務于經濟、產業及產業鏈、民生和城市發展,助力精準施策、高效監管、智慧運營和風險控制。但是電力指數基礎產品的建設能力有待進一步的提升和完善,目前還缺乏針對行業、產業、區域、主題等宏觀場景下的指數建設能力。需要解決以定基指數為代表的宏觀場景下的指數快速生產、實時跟蹤和差異化運營分析三大方向技術能力。電力體系中的指標眾多,指數版本管理缺乏,指數權重設計不合理,存在著基礎指標重復計算等業務痛點問題。
技術實現思路
[0004]本專利技術提供一種電力數據指數快速生成方法及系統,解決現有技術中基于電力數據進行指數快速生成的問題。
[0005]根據本專利技術的一個方面,提供一種電力數據指數快速生成方法,包括:
[0006]從指標庫中獲取所需指標數據作為數據源;
[0007]根據所述數據源,從指標數據特征、指標數據分布進行指標數據探索性分析、指標相關性度量及指標重要程度分析以進行指標篩選和組合;
[0008]通過數值變換對所述篩選和組合后的指標進行連續變換處理或離散變換處理,生成基礎指數;
[0009]將所述基礎指數根據各自權重進行加權計算得到中間指數;根據所述中間指數綜合評判得到電力數據產品指數,建立指數體系。
[0010]所述從指標庫中獲取所需指標數據作為數據源,包括:
[0011]根據經典區域時間維度作為維度的閾值化以默認范圍獲取指標數據;或根據用戶指定指標維度屬性,按用戶指定的范圍獲取指標數據;
[0012]所述指標數據包含時間維度、省網維度、地區維度及行業維度屬性。
[0013]所述指標數據特征探索性分析,包括:
[0014]集中趨勢分析:通過批量計算各指標數據的平均數、中位數、眾數,反映各指標數
據的集中趨勢;
[0015]離散程度測定:通過批量計算各指標數據的極差、四分位差、方差、標準差、離散系數,反映各指標數據的離散程度。
[0016]所述指標數據分布探索性分析,包括:
[0017]通過直方圖定性的分析指標數據的分布形式;
[0018]計算指標數據的偏度和峰度,根據偏度和峰度通過正態性檢驗定性判定指標數據是否服從正態分布,對指標數據的分布形狀進行度量。
[0019]所述指標相關性度量,包括:
[0020]計算數據源中兩兩指標數據的相關性;設定指標數據之間相關度量的上限閾值,依次決定指標數據取舍;指標數據相關性度量通過對協方差/標準差、余弦相似度或等級變量之間的皮爾遜相關系數的計算實現。
[0021]所述指標重要程度分析,包括:
[0022]對所述指標數據進行指標主成分分析;
[0023]對指標數據對應樣本打上標簽,監督學習建模輸出指標數據重要性。
[0024]所述通過數值變換對所述篩選和組合后的指標進行連續變換處理或離散變換處理,包括:
[0025]通過線性映射函數、非線性映射函數或分段映射函數將指標數據的數值映射到指定區間內;包括:線性映射及非線性映射;或
[0026]根據基于孿生網絡的深度學習聚類算法、等距、等頻、規則分檔以及設定分檔方法,將連續型的指數數據的數值轉變為類別型的指數數據數值。
[0027]所述將所述基礎指數根據各自權重進行加權計算得到中間指數;根據所述中間指數綜合評判得到電力數據產品指數,建立指數體系,包括:
[0028]通過基于多方法融合的空間距離權重法、層次分析法、專家打分法、熵值法、主成分分析法或CRITIC權重分析法進行基礎指數的權重設定;
[0029]通過基礎指數加權計算得到多層中間指數;
[0030]對中間指數優化、調整、組合得到綜合評判的電力數據產品指數。
[0031]根據本專利技術的另一個方面,提供一種電力數據指數快速生成系統,所述系統包括:
[0032]指標獲取單元,用于從指標庫中獲取所需指標數據作為數據源;
[0033]指標篩選單元,用于根據所述數據源,從指標數據特征、指標數據分布進行指標數據探索性分析、指標相關性度量及指標重要程度分析以進行指標篩選和組合;
[0034]基礎指數單元,用于通過數值變換對所述篩選和組合后的指標進行連續變換處理或離散變換處理,生成基礎指數;
[0035]指數體系單元,用于將所述基礎指數根據各自權重進行加權計算得到中間指數;根據所述中間指數綜合評判得到電力數據產品指數,建立指數體系。
[0036]所述系統還包括:
[0037]優化調整單元,用于調整指數數據的組合策略以及查看不同指數數據組合策略下的指數運算結果,直至得到滿意的指數體系;
[0038]指數保存單元,用于將計算完成后的指數體系保存在行式數據庫或列式數據庫中。
[0039]采用上述方案的有益效果是:
[0040]本專利技術方案中,聚焦解決指數的快速生產方向技術能力,實現指標數據分析、基礎指數生成、指體系構建等功能。支持用戶通過指標數據分布性探索、指標相關性度量和指標重要程度分析來篩選指標和組合指標;支持指標數據內容的數值變換,形成基礎指數;支持引導性的指標體系構建,在指數體系編輯界面提供指數體系構建、各層級權重計算工具、初始化的構建方案、案列示范功能;支持用戶通過選擇指數,計算指數權重,確定層級關系構建指數體系。
[0041]本專利技術方案針對電力體系中的指標多、指數版本管理缺乏、指數權重設計不合理等業務現狀,以適用電力企業數據生態環境為出發點,構建指數快速生成的方案。本專利技術方案分為三個模塊,第一模塊是指標數據分析,包括4個功能,分別為指標獲取、指標數據探索分析、指標相關性度量、指標重要程度分析;第二模塊為基礎指數生成,包括2個功能,分別為連續變換、離散變換;第三模塊為指數體系構建,包含5個功能,分別為指數權重計算工具、指數優化調整、指數保存、方案建議、案例示范。本專利技術方案首先從指標庫中獲取所需的指標數據作為數據源,從指標數據特征、指標數據分布進行指標數據探索性分析,指標相關性度量以及指標重要程度分析以進行指標篩選和組合;然后通過數值變換工具,對指標進行連續變換處理或者離散變換處理,生成基礎指數;最后將指數通過拖拽組合形成指數體系。
附圖說明
[本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種電力數據指數快速生成方法,其特征在于,所述方法包括:從指標庫中獲取所需指標數據作為數據源;根據所述數據源,從指標數據特征、指標數據分布進行指標數據探索性分析、指標相關性度量及指標重要程度分析以進行指標篩選和組合;通過數值變換對所述篩選和組合后的指標進行連續變換處理或離散變換處理,生成基礎指數;將所述基礎指數根據各自權重進行加權計算得到中間指數;根據所述中間指數綜合評判得到電力數據產品指數,建立指數體系。2.如權利要求1所述的方法,其特征在于,所述從指標庫中獲取所需指標數據作為數據源,包括:根據經典區域時間維度作為維度的閾值化以默認范圍獲取指標數據;或根據用戶指定指標維度屬性,按用戶指定的范圍獲取指標數據;所述指標數據包含時間維度、省網維度、地區維度及行業維度屬性。3.如權利要求1所述的方法,其特征在于,所述指標數據特征探索性分析,包括:集中趨勢分析:通過批量計算各指標數據的平均數、中位數、眾數,反映各指標數據的集中趨勢;離散程度測定:通過批量計算各指標數據的極差、四分位差、方差、標準差、離散系數,反映各指標數據的離散程度。4.如權利要求3所述的方法,其特征在于,所述指標數據分布探索性分析,包括:通過直方圖定性的分析指標數據的分布形式;計算指標數據的偏度和峰度,根據偏度和峰度通過正態性檢驗定性判定指標數據是否服從正態分布,對指標數據的分布形狀進行度量。5.如權利要求1所述的方法,其特征在于,所述指標相關性度量,包括:計算數據源中兩兩指標數據的相關性;設定指標數據之間相關度量的上限閾值,依次決定指標數據取舍;指標數據相關性度量通過對協方差/標準差、余弦相似度或等級變量之間的皮爾遜相關系數的計算實現。6.如權利要求5所述的方法,其特征在于,所述指標重要程度分析,包括:對所述指標數據進行指標主成分分析;對指標數據對應樣...
【專利技術屬性】
技術研發人員:宮立華,劉鯤鵬,張明杰,楊菁,龔建,
申請(專利權)人:國家電網有限公司客戶服務中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。