• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于主成分分析算法的醫保欺詐識別方法技術

    技術編號:15691251 閱讀:108 留言:0更新日期:2017-06-24 04:18
    本發明專利技術提出了一種基于主成分分析算法的醫保欺詐識別方法,包括:獲取醫保基礎數據,生成醫保結構化數據集;對各項數據進行標準化處理,生成標準化矩陣;計算標準化矩陣的協方差矩陣,并求解樣本協方差矩陣的特征方程,確定主成分;將標準化后的指標變量轉換為主成分得分;分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號。本發明專利技術對醫保數據進行清洗、整理,采取主成分分析方法,對與欺詐行為相關的變量進行特征降維,根據統計學方法計算異常閾值,對醫保欺詐高風險識別。

    A medical fraud identification method based on principal component analysis algorithm

    The invention provides an algorithm based on principal component analysis of the medical insurance fraud identification method, including: obtaining medical insurance data, generating structured data sets of the medical insurance; data standardization, standardization of generating matrix; calculate the covariance matrix matrix standardization, and the characteristic equation of the sample covariance matrix, to determine the main components; the variables of the normalized conversion component scores were calculated respectively; the mean and standard deviation of each principal component scores, calculate the abnormal threshold of each principal component dimension according to the Chebyshev law; each principal component is to coordinate, making two-dimensional scatter plots, each dot represents the actual Medicare accounts, judge is greater than the anomaly threshold step S5 in the Medicare reimbursement account as abnormal account. The invention of Medicare data cleaning, sorting, taking the principal component analysis method is adopted to reduce the dimensionality of fraud related variables, to calculate the abnormal threshold according to statistical methods, high risk identification of insurance fraud.

    【技術實現步驟摘要】
    一種基于主成分分析算法的醫保欺詐識別方法
    本專利技術涉及計算機應用
    ,特別涉及一種基于主成分分析算法的醫保欺詐識別方法。
    技術介紹
    隨著社會經濟的發展,國家為了給老百姓提供更好的醫保環境,醫保政策越來越好。然而,一些人通過各種各樣的手段騙取醫保,導致醫保基金不合理流失。另一方面,由于經辦機構的監管模式主要以人工審核監管為主,多采用基于簡單規則的數據篩選方法,從醫療基金收支監測、簡單指標預警等方面開展基金風險管理工作,不僅速度慢,人力成本高,而且難以保證對欺詐行為的識別準確度。在現有的技術中,專利(申請號:201510760477.4;名稱:一種醫療保險異常數據在線智能檢測方法)提出,對已標注為異常的醫保數據樣本進行特征學習,然后運用機器學習算法進行在線檢查,然而如何確定目標樣本是否異常,該專利并未涉及。此外,專利(申請號:201410598935.4;名稱:一種基于數據挖掘的醫保欺詐行為的檢測方法)采取對醫保參保人的信息記錄進行分位數打分的方法確定異常級別,并將多種異常類別簡單加總確定總異常分值。該方法把連續性變量人為分段,損失了數據信息,而且忽略了各變量間可能存在的相關性,使總異常分值失去準確性。
    技術實現思路
    本專利技術的目的旨在至少解決所述技術缺陷之一。為此,本專利技術的目的在于提出一種基于主成分分析算法的醫保欺詐識別方法。為了實現上述目的,本專利技術的實施例提供一種基于主成分分析算法的醫保欺詐識別方法,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。進一步,在所述步驟S1中,所述醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。進一步,在所述步驟S1中,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。進一步,在所述步驟S2中,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:其中p為特征變量個數得到標準化矩陣Z。進一步,在所述步驟S3中,所述協方差矩陣R為:其中,k為樣本數。進一步,在所述步驟S3中,所述求解樣本協方差矩陣R的特征方程,確定主成分,包括:計算樣本協方差矩陣R的特征方程|R-λIp|=0,得到p個特征根,確定主成分;根據λ為特征值、m為待選主成分數、p為變量數,當取2個主成分PC1和PC2時,對每個λj,計算方程組Rb=λjb,得到單位特征向量其中,j=1,2。進一步,在所述步驟S4中,所述將標準化后的指標變量轉換為主成分得分,包括:其中,Uij為每個樣本主成分得分,各樣本主成分總得分=U1+U2。進一步,在所述步驟S5中,所述根據切比雪夫定律計算每個主成分維度下的異常閾值,包括:max=mean+4*std,其中,max為異常閾值,mean為主成分得分的均值,std為主成分得分的標準差。根據本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法,對醫保數據進行清洗、整理,采取主成分分析方法,對與欺詐行為相關的變量進行特征降維,根據統計學方法計算異常閾值,通過數據可視化方法實現醫保欺詐高風險識別。本專利技術克服了現有方法的不足,基于醫保基金持卡人一年中發生門診報銷行為的天數、報銷總金額以及報銷金額占總費用中的比例,建立門診報銷異常行為識別模型,檢索涉嫌欺詐的高風險卡號。本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術的實踐了解到。附圖說明本專利技術的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中:圖1為根據本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法的流程圖;圖2為根據本專利技術實施例的某地區年度醫保數據的示意圖;圖3為根據本專利技術實施例的特征變量的碎石圖;圖4為根據本專利技術實施例的樣本得分的示意圖;圖5為根據本專利技術實施例的醫保欺詐高風險帳號的示意圖。具體實施方式下面詳細描述本專利技術的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本專利技術,而不能理解為對本專利技術的限制。本專利技術公開了一種基于主成分分析算法的醫保欺詐識別方法,該方法可以實現在醫療保險數據的基礎上,快速、準確識別醫保欺詐行為。如圖1所示,本專利技術實施例的基于主成分分析算法的醫保欺詐識別方法,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X。其中,醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。參考圖2,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。步驟S2,對醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z。具體的,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:其中p為特征變量個數,得到標準化矩陣Z。步驟S3,計算標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分。首先,計算協方差矩陣R為:其中,k為樣本數。然后,求解樣本協方差矩陣R的特征方程,確定主成分,包括:計算樣本協方差矩陣R的特征方程|R-λIp|=0,得到p個特征根,確定主成分;根據λ為特征值、m為待選主成分數、p為變量數,當取2個主成分PC1和PC2時,信息的利用率達85%以上。對每個λj,計算方程組Rb=λjb,得到單位特征向量其中,j=1,2。步驟S4,將標準化后的指標變量轉換為主成分得分。在本步驟中,將標準化后的指標變量轉換為主成分得分,包括:其中,Uij為每個樣本主成分得分,各樣本主成分總得分=U1+U2。步驟S5,分別計算每個主成分得分U1、U2的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值。在本步驟中,根據切比雪夫定律計算每個主成分維度下的異常閾值,包括:max=mean+4*std,其中,max為異常閾值,mean為主成分得分的均值,std為主成分得分的標準差。以2個主成分PC1和PC2為例,分別計算主成分得分U1、U2的均值(mean1、mean2)和標準差(std1、std2),根據切比雪夫定律計算PC1維度的異常閾值max1=mean1+4*std1、PC2維度的異常閾值max2=mean2+4*std2。步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常本文檔來自技高網...
    一種基于主成分分析算法的醫保欺詐識別方法

    【技術保護點】
    一種基于主成分分析算法的醫保欺詐識別方法,其特征在于,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。

    【技術特征摘要】
    1.一種基于主成分分析算法的醫保欺詐識別方法,其特征在于,包括如下步驟:步驟S1,獲取醫保基礎數據,生成醫保結構化數據集X;步驟S2,對所述醫保結構化數據集X中的各項數據進行標準化處理,生成標準化矩陣Z;步驟S3,計算所述標準化矩陣Z的協方差矩陣R,并求解樣本協方差矩陣R的特征方程,確定主成分;步驟S4,將標準化后的指標變量轉換為主成分得分;步驟S5,分別計算每個主成分得分的均值和標準差,根據切比雪夫定律計算每個主成分維度下的異常閾值;步驟S6,以每個主成分為坐標,制作二維空間散點圖,將每個散點代表實際醫保賬戶,判斷大于步驟S5中異常閾值的醫保報銷賬號視為異常帳號,將異常帳號以可視化形式進行呈現。2.如權利要求1所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S1中,所述醫保基礎數據,包括:醫保基金帳號、每個帳號基金報銷總額、門診天數、基金報銷比例和門診花費總額。3.如權利要求2所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S1中,計算每個醫保基金賬號每天門診花費總額和基金報銷總額,進而計算每年門診報銷總天數、基金報銷額和基金報銷比例,生成醫保結構化數據集X。4.如權利要求1所述的基于主成分分析算法的醫保欺詐識別方法,其特征在于,在所述步驟S2中,采集樣本向量x=(X1,X2,X3)T),n個樣品xi=(xi1,xi2,xi3)T,i=1,2,…,n,進行如下標準化變換:

    【專利技術屬性】
    技術研發人員:謝國亮程嵐孫志強張憲錄孫廣陽
    申請(專利權)人:天津艾登科技有限公司
    類型:發明
    國別省市:天津,12

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 岛国av无码免费无禁网站| 无码无遮挡又大又爽又黄的视频 | 中文字幕无码人妻AAA片| 无码国模国产在线无码精品国产自在久国产| 日本精品无码一区二区三区久久久 | 暴力强奷在线播放无码| 无码中文字幕乱在线观看| 中文字幕无码视频手机免费看| 国产精品无码AV不卡| 久久久久久国产精品免费无码 | 国产丝袜无码一区二区三区视频| 无码人妻精品一区二区在线视频| 无码国产精品久久一区免费| 亚洲AV永久无码精品| 国产高清无码二区 | 国产乱子伦精品免费无码专区| 精品无码av无码专区| 亚洲av永久无码一区二区三区| 潮喷失禁大喷水aⅴ无码| 色综合色国产热无码一| 亚洲AV综合色区无码二区偷拍 | 亚洲AV无码专区国产乱码电影| 国产精品国产免费无码专区不卡| 精品久久久无码21p发布| 亚洲国产成人片在线观看无码| 国产精品无码MV在线观看| 大胆日本无码裸体日本动漫| 99国产精品无码| 中文字幕无码成人免费视频 | 人妻av无码专区| 无码国产69精品久久久久孕妇| 久久AV高清无码| 亚洲AV无码专区在线电影成人| 免费无码一区二区三区| 精品无码国产污污污免费网站| 久久久久久AV无码免费网站下载| 亚洲AV无码一区二区乱孑伦AS | 永久免费无码网站在线观看个| 无码人妻久久一区二区三区蜜桃 | 亚洲AV无码一区二区三区鸳鸯影院| 精品久久久久久无码不卡|