• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種違約用電風險模型特征選擇方法、裝置及設備制造方法及圖紙

    技術編號:15691635 閱讀:206 留言:0更新日期:2017-06-24 05:00
    本發明專利技術實施例公開了一種違約用電風險模型特征選擇方法、裝置及設備。該方法包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。本發明專利技術實施例提供的技術方案,提高了特征因子的選擇效率及有效性。

    Characteristic selection method, device and equipment for default power risk model

    The embodiment of the invention discloses a method, a device and a device for selecting an electric risk model for breach of contract. The method includes: S101, access to the user's default feature label and user power factor; S102, according to the default label and the electricity characteristic factor, construct the LASSO penalty function; S103, LARS by solving the modified the LASSO penalty function, effectively set the variable LASSO penalty function. Screening; rule S104, according to set and the efficient set of the independent variables were obtained, the characteristic factor selection. The technical proposal provided by the embodiment of the invention improves the selection efficiency and validity of the feature factor.

    【技術實現步驟摘要】
    一種違約用電風險模型特征選擇方法、裝置及設備
    本專利技術實施例涉及特征因子選擇方法,尤其涉及一種違約用電風險模型特征選擇方法、裝置及設備。
    技術介紹
    電力企業客戶信息涉及計量自動化系統實時電量數據、GIS(GeographicInformationSystem,地理信息系統)數據、電網潮流信息、95598客服錄音等海量數據。這些數據來源廣,包括內部數據和外部數據,數據類型多,且隨著電網企業信息化程度的提高,移動互聯網、大數據技術等的深入發展,與客戶相關的數據呈現爆炸式增長。隨著科技的進步。電力大數據的應用一方面是與宏觀經濟、人民生活、社會保障、道路交通等信息融合,促進經濟社會發展;另一方面,是電力行業或企業內部,跨專業、跨單位、跨部門的數據融合,提升行業、企業管理水平和經濟效益。因此如何有效地從電力大數據中挖掘出有用的信息也越來越受到人們的關注。目前最有效的處理手段之一就是數學建模,而建模之初,通常會盡可能多地選擇自變量來減少因缺少自變量而出現的模型偏差,但在實際建模過程中需要尋找對因變量最具有解釋性的自變量子集,這個過程稱為特征選擇,是建模過程中很重要的一個問題。用戶違約用電行為是指用戶私自改變用電類別、用電容量;私自變動供電設施、計量裝置;私自引入、供電或自備電源并網等情況。這不僅會影響供電企業的利益,還可能引發事故。目前對于用戶違約用電的查處主要通過用電檢查工作進行。所以建立準確的違約用電風險模型,輔助業務人員進行有針對性的違約用電檢查,對于提高用電檢查的工作效率具有重要作用。在建立違約用電風險模型的時候,通常是由相關專家根據專業理論和經驗,對可能與違約用電(即因變量)相關的自變量進行人工篩選。這可能引發對因變量影響小甚至沒影響的自變量被選中,自變量共線性等問題,從而導致建模過程計算量增大。另一方面,目前系統抽取到的歷史發生過違約用電的用戶數量太少,以此作為樣本,建立的預測模型準確度不高,也導致了最終估算和預測的精度下降。
    技術實現思路
    本專利技術實施例提供一種違約用電風險模型特征選擇方法、裝置及設備,以提高特征因子的選擇效率及有效性。一方面,本專利技術實施例提供了一種違約用電風險模型特征選擇方法,包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。另一方面,本專利技術實施例提供了一種違約用電風險模型特征選擇裝置,包括:數據獲取模塊,用于獲取用戶的違約用電標簽以及用戶的特征因子;LASSO構建模塊,用于依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;有效集確定模塊,用于通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;因子篩選模塊,用于依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。另一方面,本專利技術實施例還提供了一種設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現本專利技術實施例所述的方法。本專利技術實施例提供的技術方案,通過使用LASSO方法來解決特征選擇問題。具體的,通過構造一個懲罰函數得到一個較為精煉的模型,使得它壓縮一些系數,同時設定一些系數為零,進而達到降維的目的,保留了子集收縮的優點,是一種處理具有復共線性數據的有偏估計。這樣在違約用電風險建模中就可以有效地降低獲取自變量觀測數據的代價,減少建模過程的計算量,并充分提升最終的預測和估計精度。附圖說明圖1為本專利技術實施例中提供的一種違約用電風險模型特征選擇方法的流程圖;圖2為本專利技術實施例中提供的一種求解LASSO懲罰函數的示意圖;圖3為本專利技術實施例中提供的一種違約用電風險模型特征選擇裝置的結構圖。具體實施方式下面結合附圖和實施例對本專利技術作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本專利技術,而非對本專利技術的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本專利技術相關的部分而非全部結構。圖1為本專利技術實施例中提供的一種違約用電風險模型特征選擇方法的流程圖。本實施例的方法可以由違約用電風險模型特征選擇裝置來執行,該裝置可以通過軟件的方式來實現,且可以加載于終端設備中。參考圖1,本實施例提供的違約用電風險模型特征選擇方法可以包括如下步驟:S101、獲取用戶的違約用電標簽以及用戶的特征因子。數據來源于某區域電網公司。其中,用戶的違約用電標簽可以包括違約用電和按約用電。用戶的特征因子指的是確定用戶是否違約用電的影響因子,如用戶的特征因子可以是用電類別、電壓等級、行業分類、計量方式、用戶類別、合同容量、負荷性質、客戶身份、客戶分群和查表周期等。S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數。其中,特征因子(自變量)與用電標簽(因變量)成線性關系,LASSO懲罰函數用于確定自變量與因變量的相關系數。示例性的,構建的LASSO懲罰函數為:其中,p為特征因子的總數,M為用戶的總數,t≥0是約束參數,yi為第i個用戶的違約用電標簽對應的因變量,xi=(xi(1),…,xi(j),…,xi(p))T為第i個用戶的特征因子對應的自變量,β=(β0,β1,…,βj,…,βp)T為待求解的回歸系數。S103、通過修正的LARS(LeastAngleRegression,最小角回歸算法)求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集。LARS的運行模式為:一開始由于各個自變量的系數β1,…,βj,…,βp均為零,故回歸預測的擬合結果為每個自變量對應的當前殘差為找出與當前殘差相關性最大的自變量x(j)=(x1(j),x2(j),…,xM(j))T,然后沿著這個變量前進,逐點增大該自變量對應的系數βj,以減小該自變量與殘差的相關性。此時回歸預測的擬合結果為殘差為繼續計算新的殘差與各自變量之間的相關系數,隨著系數βj的逐點增大,該自變量x(j)與新的殘差的相關性會逐漸減小,直到出現一個新的自變量x(k)滿足內積此時沿著x(j)和x(k)的角平分線方向前進,對應地逐點增大βj和βk。相應地,回歸預測的預測結果為殘差為如此重復,找到第三個自變量,確定這三個自變量中第一自變量與第二自變量夾角的第一角平分線,以及第二自變量與第三自變量夾角的第二角平分線,再沿著第一角平分線和第二角平分線所在夾角的角平分線方向逐點移動,調整這三個自變量的系數,使得在移動過程中這個三個自變量與當前殘差的相關性均減小且一直相等……直到特征因子的所有自變量均屬于有效集為止,即直到所有自變量加入回歸預測為止,此時即為無約束的線性回歸。示例性的,結合圖2(圖2以p取10為例),S103可以包括:S103-1、中心標準化自變量,從殘差開始,令β1,…βp均為0,初始有效集為空。具體的,使實現中心標準化自變量,從殘差開始,令β1,…βp均為0,初始有效集為空。S103-2、確定和殘差r相關性最強的自變量x(j)加入有效集。由于自變量和殘差的相關本文檔來自技高網
    ...
    一種違約用電風險模型特征選擇方法、裝置及設備

    【技術保護點】
    一種違約用電風險模型特征選擇方法,其特征在于,包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。

    【技術特征摘要】
    1.一種違約用電風險模型特征選擇方法,其特征在于,包括:S101、獲取用戶的違約用電標簽以及用戶的特征因子;S102、依據所述違約用電標簽和所述特征因子,構建LASSO懲罰函數;S103、通過修正的LARS求解所述LASSO懲罰函數,得到所述LASSO懲罰函數的自變量的有效集;S104、依據設定的篩選規則和所述有效集對所述自變量進行篩選,得到選擇的特征因子。2.根據權利要求1所述的方法,其特征在于,所述LASSO懲罰函數為:其中,p為特征因子的總數,M為用戶的總數,t≥0是約束參數,yi為第i個用戶的違約用電標簽對應的因變量,xi=(xi(1),…,xi(j),…,xi(p))T為第i個用戶的特征因子對應的自變量,β=(β0,β1,…,βj,…,βp)T為待求解的回歸系數。3.根據權利要求1所述的方法,其特征在于,S103可以包括:S103-1、中心標準化自變量,從殘差開始,令β1,…βp均為0,初始有效集為空;S103-2、確定和殘差r相關性最強的自變量x(j)加入有效集;S103-3、調整有效集中自變量對應的系數,使有效集中各自變量與當前殘差的相關性均減小且一直相等,當前殘差為S103-4、確定有效集中自變量的非零系數是否變為0,若是,則將系數變為0的自變量從有效集中剔除,并繼續執行S103-5;若否,繼續執行S103-5;S103-5、確定是否存在非有效集自變量和有效集自變量與當前殘差的相關性相等;若是,則繼續執行S103-6;否則,返回執行S103-3;S103-6、將該非有效集自變量加入到有效集;S103-7、確定是否存在非有效集自變量,若是,則返回執行S103-3;否則,結束操作。4.根據權利要求1-3任一項所述的方法,其特征在于,所述篩選規則為MallowsCp準則。5.一種違約用電風險模型特征選擇裝置,其特征在于,包括:數據獲取模塊,用于獲取用戶的...

    【專利技術屬性】
    技術研發人員:陳豐王志英,林火華,張詩軍,李遠寧楊漾,黃聰,朱杏傳
    申請(專利權)人:中國南方電網有限責任公司,彩訊科技股份有限公司,
    類型:發明
    國別省市:廣東,44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av无码专区在线电影| 国产爆乳无码一区二区麻豆| 中文有码vs无码人妻| 亚洲日韩欧洲无码av夜夜摸| 国模吧无码一区二区三区| 亚洲精品无码Av人在线观看国产 | 国内精品久久久久久无码不卡| 亚洲中文字幕无码爆乳app| 亚洲av无码专区在线| 国产仑乱无码内谢| 亚洲国产精品无码久久| 亚洲国产a∨无码中文777| 国产在线拍揄自揄拍无码视频| 无码精品人妻一区二区三区漫画 | 国产丰满乱子伦无码专区| 99无码精品二区在线视频| 国产aⅴ激情无码久久| 国外AV无码精品国产精品| 少妇仑乱A毛片无码| 精品无码人妻一区二区免费蜜桃| 久久亚洲精品无码aⅴ大香| 无码精品不卡一区二区三区| 亚洲?V无码成人精品区日韩 | 久久亚洲AV无码精品色午夜麻豆 | 自慰无码一区二区三区| 中文无码喷潮在线播放| 国产精品无码素人福利| 久久精品无码一区二区三区| 变态SM天堂无码专区| 亚洲大尺度无码无码专区| 亚洲大尺度无码无码专区| 小13箩利洗澡无码视频网站| 久久久久亚洲av无码专区喷水| 亚洲av无码一区二区三区天堂古代| 亚洲av日韩av无码| 亚洲AV永久无码区成人网站| 精品亚洲A∨无码一区二区三区| 永久免费av无码不卡在线观看| 精品久久久久久无码中文字幕一区 | 一夲道dvd高清无码| 日韩无码系列综合区|