一種基于CEVAE的屬性域測井數據缺失值填補方法技術

技術編號：42934933 閱讀：20 留言：0更新日期：2024-10-11 15:56

本發明專利技術涉及一種基于CEVAE的屬性域測井數據缺失值填補方法，屬于測井數據缺失填補技術領域。本發明專利技術從測井數據屬性域的角度出發，依據測井數據多屬性特點和測井數據橫向屬性和縱向深度的二維性，采用CNN神經網絡設計CEVAE編碼器網絡結構的同時，提出基于測井地質先驗知識的屬性特征交叉策略，擴增測井數據通道，使得網絡可以學習到之前未有的組合特征，并引入ECA通道注意力機制，改進模型對測井數據屬性之間復雜關聯關系的學習表征能力。引入PlanarFlow標準化流對數據潛在表示的隱變量進行增強改進，適應性采用置換卷積神經網絡設計CEVAE解碼器的網絡結構，最后通過解碼器輸出的完整測井數據結果對測井數據缺失值進行數據填補。本發明專利技術能夠為測井數據得完整性與穩定性提供保障。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及一種基于cevae的屬性域測井數據缺失值填補方法，屬于測井數據缺失填補。

技術介紹

1、測井數據是在鈾礦勘查中利用測井技術采集的重要地質資料，主要表現為密度、電阻率、孔隙度、滲透性和自然γ等，這些數據反映了鈾礦勘探區地層巖性、含礦性和其他寶貴信息，有助于確定地質結構、地層屬性以及鈾礦資源分布。

2、完整的測井數據集是確保地質解釋準確性和資源評估可靠性的關鍵因素之一，但是在測井數據采集的過程中，由于測井儀器、地質條件、操作失誤、數據傳輸或記錄問題，測井數據可能出現缺失、異常或錯誤，這些問題會影響測井數據的質量和可靠性，進而影響礦產資源的評價和開發，因此通過合理的方法填補缺失的測井數據，使其盡可能接近真實情況，提高數據的完整性和準確性，是測井數據質量控制的重要環節。

3、隨著計算機科學和人工智能技術的迅速發展，更多機器學習方法被用于數據的缺失值填補任務。相較于傳統的統計學方法，機器學習模型通過捕捉數據中復雜的關系和模式，能準確、全面地預測缺失值，特別是在數據之間存在非線性、復雜關系的情況下表現更佳。在數據動態學習方面，機器學習模型不依賴先驗假設，能根據數據的特點和變化進行自適應捕獲特征間的關系，從而更好地填補缺失值，在面對不同類型的數據和缺失模式時提供更靈活、更準確的解決方案。

4、然而，目前將機器學習用于測井數據缺填補的研究較少，一方面歸因于地質行業在智能化應用方面起步相對較晚，地質學數據的標注和清洗工作相對復雜，數據質量和標準化程度不高，使得機器學習不能直接應用于測井數據的缺失值

技術實現思路

1、本專利技術為解決上述現有技術中存在的問題，提供了一種基于cevae的屬性域測井數據缺失值填補方法，本專利技術能夠為測井數據的缺失值填補問題提供一種填補精度更高、更有效的解決方案，為測井數據的完整性與穩定性提供了保障。

2、為實現上述目的，本專利技術提供的技術方案為：一種基于cevae的屬性域測井數據缺失值填補方法，按如下步驟進行操作：

3、(1)數據輸入：獲取同井異屬性測井數據，將同井異屬性的測井數據以列為單位進行組織，然后將同井異屬性進行組織的測井數據輸入到cevae模型中作為輸入的初始數據；

4、(2)通道擴增層計算：基于測井地質知識將步驟(1)中的單通道測井數據擴增為多通道測井數據，把未直接相鄰的特征屬性列，進行排列組合形成不同結構的特征圖，使不相鄰的特征屬性列相鄰，利用cevae模型學習測井數據不同屬性之間的相關關系，作為編碼器網絡設計的數據基礎；

5、(3)編碼器網絡設計與采樣隱變量：根據步驟(2)中多通道測井數據的二維特點，采用卷積神經網絡設計編碼器的神經網絡，并引入通道注意力機制使編碼器對擴增后的多通道測井數據有不同的關注，提升編碼器神經網絡對復雜高緯度測井數據的學習能力，并從編碼器輸出的潛在空間分布中采樣隱變量z0；

6、(4)隱變量表征增強層計算：利用planarflow對cevae模型改進，使采樣獲得的服從高斯分布的隱變量z0轉換為服從概率分布的隱變量z3，增強cevae模型對復雜高緯度測井數據的表征能力；

7、(5)解碼器網絡設計與輸出完整測井數據：根據設計的編碼器，選用相對稱的轉置卷積神經網絡來構建解碼器的神經網絡，轉置卷積神經網絡包括轉置卷積層、激活函數和批量歸一化；解碼器神經網絡對planarflow輸出的隱變量z3進行上采樣計算，將隱變量z3重構輸出為完整測井數據；

8、(6)填補缺失數據：利用步驟(5)中解碼器輸出的完整測井數據結果對測井數據缺失值進行數據填補。

9、對上述技術方案進一步的改進為：

10、步驟(1)中將同井異屬性的測井數據以列為單位進行組織具體包括：根據cevae模型對輸入數據的要求，以512的維度對同井異屬性測井數據進行數據分割，當剩余的數據不足512維時，用0進行填充至512維，保證數據集的一致性。

11、步驟(2)中形成不同結構的特征圖具體包括：

12、1)確定需要填補的測井數據的6個特征屬性為密度、自然γ、電阻率、自然電位、三側向電壓和三側向電流；

13、2)依據6個特征屬性所屬的測井類型和先驗的測井屬性相關性知識進行兩兩組合，得到組合后的特征屬性組分別為密度與自然γ、電阻率與自然電位和三側向電壓與三側向電流；

14、3)將兩兩組合后的特征屬性組再經過特征交叉產生6個不同結構的特征圖。

15、步驟(3)具體包括：

16、1)根據測井數據的多屬性特點，測井數據表現出的二維特性，選用卷積神經網絡構建編碼器的神經網絡；測井數據表現出的二維特性是橫向上為屬性維度、縱向上為空間深度維度；編碼器的神經網絡包括輸入層、卷積層、池化層、全連接層和輸出層；

17、2)引入eca通道注意力機制，通道注意力機制通過學習計算，賦予每個通道不同的重要性權重，使編碼器的神經網絡能夠自適應地關注輸入多通道測井數據中更有用的通道，提高模型的性能和泛化能力；

18、3)編碼器輸出256維的均值向量μ和256維的標準差向量σ，cevae模型從編碼器輸出的潛在空間分布中采樣隱變量，即z0＝μ+σ⊙ε，ε是從先驗分布中采樣的噪聲，⊙表示逐元素相乘。

19、步驟(4)中planarflow的數學表現式具體為：

20、f(z)＝z+u·tanh(wtz+b)

21、式中，u是平面的法向量，w是縮放參數向量，b是偏置項，tanh是激活函數。該變換函數f是一個可逆的，即存在一個函數f-1，使得f-1(f(z))＝z，對于任意的z成立，這樣能保證變換后的概率密度q(z)與變換前的概率密度p(z)有一致的信息量，沒有信息的損失或增益。

22、步驟(4)中對隱變量表征增強層計算具體包括：在cevae模型中設置三層planarflow，將從編碼器輸出的潛在空間分布中采樣的隱變量z0輸入到三層planarflow中，從編碼器輸出的潛在空間分布中采樣的隱變量z0經過三層planarflow標準化流計算后，輸出隱變量定義為z3。

23、步驟(5)中轉置卷積層中首先對原始特征圖采用零值進行填充，擴展特征圖的尺寸；在解碼器神經網絡的每一個轉置卷積層加入歸一化層，加速訓練過程，降低填充零值導致的數據內部協變量偏移，并提高模型的泛化能力；解碼器神經網絡中的激活函數采用tanh函數；解碼器神經網絡中加入eca通道注意力機制，增強解碼器神經網絡對于更有價值的通道測井數據的關注，提升解碼器輸出填補數據的精度。

24、步驟(5)中將隱變量z3重構輸出為完整測井數據具體包括：

25、對經過三層planarflow標準化流計算后輸出的隱變量z3經過多層轉置卷積生成一本文檔來自技高網...

【技術保護點】

1.一種基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于按如下步驟進行操作：

2.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(1)中將同井異屬性的測井數據以列為單位進行組織具體包括：根據CEVAE模型對輸入數據的要求，以512的維度對同井異屬性測井數據進行數據分割，當剩余的數據不足512維時，用0進行填充至512維，保證數據集的一致性。

3.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(2)中形成不同結構的特征圖具體包括：

4.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(3)具體包括：

5.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(4)中PlanarFlow的數學表現式具體為：

6.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(4)中對隱變量表征增強層計算具體包括：在CEVAE模型中設置三層PlanarFlow，將從編

7.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于：步驟(5)中轉置卷積層中首先對原始特征圖采用零值進行填充，擴展特征圖的尺寸；在解碼器神經網絡的每一個轉置卷積層加入歸一化層，加速訓練過程，降低填充零值導致的數據內部協變量偏移，并提高模型的泛化能力；解碼器神經網絡中的激活函數采用Tanh函數；解碼器神經網絡中加入ECA通道注意力機制，增強解碼器神經網絡對于更有價值的通道測井數據的關注，提升解碼器輸出填補數據的精度。

8.根據權利要求1所述的基于CEVAE的屬性域測井數據缺失值填補方法，其特征在于，步驟(5)中將隱變量z3重構輸出為完整測井數據具體包括：

...

【技術特征摘要】

1.一種基于cevae的屬性域測井數據缺失值填補方法，其特征在于按如下步驟進行操作：

2.根據權利要求1所述的基于cevae的屬性域測井數據缺失值填補方法，其特征在于，步驟(1)中將同井異屬性的測井數據以列為單位進行組織具體包括：根據cevae模型對輸入數據的要求，以512的維度對同井異屬性測井數據進行數據分割，當剩余的數據不足512維時，用0進行填充至512維，保證數據集的一致性。

3.根據權利要求1所述的基于cevae的屬性域測井數據缺失值填補方法，其特征在于，步驟(2)中形成不同結構的特征圖具體包括：

4.根據權利要求1所述的基于cevae的屬性域測井數據缺失值填補方法，其特征在于，步驟(3)具體包括：

5.根據權利要求1所述的基于cevae的屬性域測井數據缺失值填補方法，其特征在于，步驟(4)中planarflow的數學表現式具體為：

6.根據權利要求1所述的基于cevae的屬性域測井數據缺失值填補方法，其特征在于，...

【專利技術屬性】
技術研發人員：張夏林，王震江，張明林，周琦，袁良軍，李章林，劉洋，張遂，翁正平，蔡國榮，吳沖龍，田宜平，徐凱，
申請(專利權)人：武漢地大坤迪科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術