The invention relates to a causal network inference method based on kurtosis, the kurtosis of the choice of exogenous variables, using the least squares method to identify the causal sequence and cutting edge test cutting edge three process layer based on the output to complete a causal network, is not sensitive to the interference of non Gauss variable degree of strong stability especially when Gauss is very weak, is still able to maintain a high recognition rate, low complexity, only need to calculate the kurtosis of each variable itself is a direct way to estimate the causal network, high recognition rate.
【技術實現步驟摘要】
一種基于峭度的因果網絡推斷方法
本專利技術涉及一種數據挖掘
,尤其是一種基于峭度的因果網絡推斷方法。
技術介紹
目前,從觀察數據中發現因果關系得到廣泛的關注,并應用在許多領域,例如神經科學,經濟學和流行病學等。在沒有任何先驗知識的情況下,傳統的因果發現方法只能夠找到馬爾可夫等價類,需要借助干預實驗來獲得一個完整的網絡,但實際情況下許多變量是不能夠做干預操作。Shimizu等人提出的線性非高斯無環模型(LiNGAM)可以很好地解決這個問題,該模型能夠僅僅從觀察數據集中識別完整的因果網絡而得到越來越多研究。針對線性非高斯無環模型(LiNGAM)模型的估計主要有三種思路:第一種是將問題轉化為現有問題,例如借助獨立成分分析(ICA)技術來求解的ICA-LiNGAM算法;第二種是利用貝葉斯評分方法構建因果網絡,例如BayesLiNGAM算法;第三種是使用兩兩獨立性來識別外生變量,逐層地估計因果次序,例如DirectLiNGAM算法和LR算法;然而前兩種思路是將問題轉換成一個函數優化問題,然后利用一些優化算法來解決,但是它們都有對初始值敏感,容易陷入局部收斂的缺陷;對于第三種方法,將當前變量與其余所有變量的殘差最獨立的一個作為外生變量是不可靠的衡量標準;使用近似變換方式估計LiNGAM模型會導致局部最優問題或者獨立性不可靠問題,特別是當干擾變量越接近高斯分布時,越難區分變量之間的因果關系。所以提出一種簡單直接的量化標準具有一定的研究價值和意義。
技術實現思路
針對現有技術的不足,本專利技術提供一種基于峭度的因果網絡推斷方法,從而能夠穩定、快速的識別因果網絡。本專利技 ...
【技術保護點】
一種基于峭度的因果網絡推斷方法,通過基于峭度選擇外生變量、逐層找出因果次序和利用最小二乘法剪邊檢驗剪邊三個過程,其特征在于,包括以下步驟:1)、設置觀察數據集X=[x
【技術特征摘要】
1.一種基于峭度的因果網絡推斷方法,通過基于峭度選擇外生變量、逐層找出因果次序和利用最小二乘法剪邊檢驗剪邊三個過程,其特征在于,包括以下步驟:1)、設置觀察數據集X=[x1,x2,…xn],其中每個變量xi(i=1,2,...n)包含p個樣本數據,設置因果次序集合K為空集合;2)、計算每個變量xi(i=1,2,...n)的峭度值ki(i=1,2,...n),找出最大峭度值maxki所對應的變量xm,那么變量xm即為外生變量,其計算式為:其中,E(xi4)為變量xi四階中心距,(E(xi2))2為xi方差的平方;3)、將其他變量與外生變量xm進行最小二乘回歸,得到殘差rim,其計算為:
【專利技術屬性】
技術研發人員:謝峰,郝志峰,蔡瑞初,溫雯,陳薇,陳炳豐,
申請(專利權)人:廣東工業大學,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。