The embodiment of the invention discloses a method, a device and a device for selecting an electric risk model for breach of contract. The method includes: S101, access to the user's default feature label and user power factor; S102, according to the default label and the electricity characteristic factor, construct the LASSO penalty function; S103, LARS by solving the modified the LASSO penalty function, effectively set the variable LASSO penalty function. Screening; rule S104, according to set and the efficient set of the independent variables were obtained, the characteristic factor selection. The technical proposal provided by the embodiment of the invention improves the selection efficiency and validity of the feature factor.
【技術實現步驟摘要】
一種違約用電風險模型特征選擇方法、裝置及設備
本專利技術實施例涉及特征因子選擇方法,尤其涉及一種違約用電風險模型特征選擇方法、裝置及設備。
技術介紹
電力企業客戶信息涉及計量自動化系統實時電量數據、GIS(GeographicInformationSystem,地理信息系統)數據、電網潮流信息、95598客服錄音等海量數據。這些數據來源廣,包括內部數據和外部數據,數據類型多,且隨著電網企業信息化程度的提高,移動互聯網、大數據技術等的深入發展,與客戶相關的數據呈現爆炸式增長。隨著科技的進步。電力大數據的應用一方面是與宏觀經濟、人民生活、社會保障、道路交通等信息融合,促進經濟社會發展;另一方面,是電力行業或企業內部,跨專業、跨單位、跨部門的數據融合,提升行業、企業管理水平和經濟效益。因此如何有效地從電力大數據中挖掘出有用的信息也越來越受到人們的關注。目前最有效的處理手段之一就是數學建模,而建模之初,通常會盡可能多地選擇自變量來減少因缺少自變量而出現的模型偏差,但在實際建模過程中需要尋找對因變量最具有解釋性的自變量子集,這個過程稱為特征選擇,是建模過程中很重要的一個問題。用戶違約用電行為是指用戶私自改變用電類別、用電容量;私自變動供電設施、計量裝置;私自引入、供電或自備電源并網等情況。這不僅會影響供電企業的利益,還可能引發事故。目前對于用戶違約用電的查處主要通過用電檢查工作進行。所以建立準確的違約用電風險模型,輔助業務人員進行有針對性的違約用電檢查,對于提高用電檢查的工作效率具有重要作用。在建立違約用電風險模型的時候,通常是由相關專家根據專業理論和經驗,對可能與 ...
【技術保護點】
一種違約用電風險模型特征選擇方法,其特征在于,包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。
【技術特征摘要】
1.一種違約用電風險模型特征選擇方法,其特征在于,包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。2.根據權利要求1所述的方法,其特征在于,所述LASSO懲罰函數為:其中,p為特征因子的總數,M為用戶的總數,t≥0是約束參數,yi為第i個用戶的違約用電標簽對應的因變量,xi=(xi(1),…,xi(j),…,xi(p))T為第i個用戶的特征因子對應的自變量,β=(β0,β1,…,βj,…,βp)T為待求解的回歸系數。3.根據權利要求1所述的方法,其特征在于,S103可以包括:S103-1、中心標準化自變量,從殘差開始,令β1,…βp均為0,初始有效集為空;S103-2、確定和殘差r相關性最強的自變量x(j)加入有效集;S103-3、調整有效集中自變量對應的系數,使有效集中各自變量與當前殘差的相關性均減小且一直相等,當前殘差為S103-4、確定有效集中自變量的非零系數是否變為0,若是,則將系數變為0的自變量從有效集中剔除,并繼續執行S103-5;若否,繼續執行S103-5;S103-5、確定是否存在非有效集自變量和有效集自變量與當前殘差的相關性相等;若是,則繼續執行S103-6;否則,返回執行S103-3;S103-6、將該非有效集自變量加入到有效集;S103-7、確定是否存在非有效集自變量,若是,則返回執行S103-3;否則,結束操作。4.根據權利要求1-3任一項所述的方法,其特征在于,所述篩選規則為MallowsCp準則。5.一種違約用電風險模型特征選擇裝置,其特征在于,包括:數據獲取模塊,用于獲取用戶的...
【專利技術屬性】
技術研發人員:陳豐,王志英,林火華,張詩軍,李遠寧,楊漾,黃聰,朱杏傳,
申請(專利權)人:中國南方電網有限責任公司,彩訊科技股份有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。