本發明專利技術公開一種基于高光譜影像數據的楊樹葉片氮含量反演方法和系統,所述方法包括:S1、獲取楊樹種植區無人機高光譜影像數據和葉片樣本氮含量數據;S2、對所述高光譜影像數據進行預處理,根據葉片樣本位置和預處理后的高光譜影像數據提取對應的波段反射率數據,構建數據集,所述數據集包括葉片樣本氮含量和對應的波段反射率數據,并劃分訓練集和驗證集;S3、使用深度神經網絡DNN結合SHAP算法,確定楊樹葉片氮含量反演的初始波段集合;S4、使用序列浮動后向選擇算法,確定楊樹葉片氮含量反演的最優波段集合,并進而確定最終的楊樹葉片氮含量反演模型。采用本發明專利技術,對不同氮含量的葉片樣本均可以實現較高精度的反演。
【技術實現步驟摘要】
本專利技術涉及林業生理生化表型參數反演,特別是指一種基于高光譜影像數據的楊樹葉片氮含量反演方法和系統。
技術介紹
1、楊樹是中國溫帶平原地區廣泛栽培的重要速生木材樹種之一,該樹種生長迅速,在生態保護林業和工業木材種植方面具有廣泛的應用。楊樹具有多種基因型,展示出不同的表型性狀。了解不同基因型的表型性狀不僅為其育種提供了堅實基礎,還為開發、改良其品種提供了重要信息。葉片氮含量是一種重要的生理生化表型參數,與楊樹光合作用密切相關,影響其生長速率、生物量累計與抗逆性等。近些年來無人機高光譜遙感技術迅速發展,為單木尺度的葉片氮含量反演(預測)提供了豐富的光譜信息,已成為當前低空尺度農林業生理生化參數反演的重要方法。
2、雖然高光譜影像數據具有豐富的冠層反射信息,但由于波段之間的相關性較高,容易產生休斯現象,嚴重影響反演模型精度與計算效率。當前相關研究主要基于嵌入式特征選擇算法得到波段重要性排序,通過預定義模型所用的波段數量或根據預定義步長進行降維。但上述方法對回歸模型進行了預定義,導致模型算法形式的選擇受限。其次,上述方法忽略了動態集合條件下特征貢獻度的變化,增加了波段剔除過程中的誤差。此外,嵌入式特征選擇算法無法實現最優子集搜索,無法消除因波段間相互作用產生的反演誤差。上述因素對楊樹葉片氮含量反演的精度與運算速度造成了影響,數據挖掘程度嚴重不足。
3、因此,研究設計一種合理、高精度的基于無人機高光譜影像數據的楊樹葉片氮含量反演方法是目前亟需解決的問題。
技術實現思路
<
p>1、本專利技術提供了一種基于高光譜影像數據的楊樹葉片氮含量反演方法和系統,用以解決上述現有技術存在的問題。所述技術方案如下:2、一方面,提供了一種基于高光譜影像數據的楊樹葉片氮含量反演方法,包括:
3、s1、獲取楊樹種植區無人機高光譜影像數據和葉片樣本氮含量數據;
4、s2、對所述高光譜影像數據進行預處理,根據葉片樣本位置和預處理后的高光譜影像數據提取對應的波段反射率數據,構建數據集,所述數據集包括葉片樣本氮含量和對應的波段反射率數據,并劃分訓練集和驗證集;
5、s3、使用深度神經網絡dnn結合shap算法,確定楊樹葉片氮含量反演的初始波段集合;
6、s4、使用序列浮動后向選擇算法,確定楊樹葉片氮含量反演的最優波段集合,并進而確定最終的楊樹葉片氮含量反演模型。
7、可選地,所述s2中對所述高光譜影像數據進行預處理,具體包括:
8、對獲取的所述高光譜影像數據進行輻射定標、幾何校正及正射校正,得到波段反射率數據;
9、將低于400nm和高于900nm的波段剔除,并將光譜數據進行savitzky-golay濾波平滑處理,得到400-900nm范圍內的平滑光譜曲線,共250個波段,計算公式如下:
10、
11、其中是濾波后的反射率值,y(t+i)是滑動窗口內的原始信號值,ci是濾波器的系數,基于最小二乘法擬合的多項式決定,m是窗口大小的一半,窗口長度為2m+1,m取值為5。
12、可選地,所述s3,具體包括:
13、s31、構建初始反演模型:
14、基于訓練集數據,使用深度神經網絡dnn,構建楊樹葉片氮含量初始反演模型,結合shap算法,計算每個波段對模型輸出的貢獻,輸出每個波段的shap值,根據所述shap值對波段進行排序,確定各波段在反演過程中的重要性,并使用驗證集驗證模型性能,計算并輸出驗證集精度作為模型的評估指標;
15、s32、逐步去除低重要性波段:
16、設置步長為10,開始去除排名后10位的波段,構建新的反演模型,使用去除后的波段重新訓練模型,并計算新的shap值及驗證集精度,根據更新后的shap值對剩余波段進行排序;
17、s33、循環迭代直到波段數量為0:
18、迭代重復上一步驟,持續去除排名后10位的波段,構建新的反演模型,計算新的shap值及驗證集精度,在每次迭代中,監控模型性能的變化,記錄各次迭代的驗證集精度,直到波段數量降為0,結束迭代;
19、s34、確定初始波段集合:
20、對比每次迭代過程中的驗證集精度,找出精度最高的模型所對應的波段集合,將所述精度最高的模型所對應的波段集合,確定為所述楊樹葉片氮含量反演的初始波段集合。
21、可選地,所述shap值的計算公式如下:
22、
23、其中φi表示shap值,n是所有波段的集合;s是一個子集,表示在當前計算shap值時考慮的波段集合,代表了不包含波段i的所有子集;f(s)是波段子集s的模型預測;|s|是子集s中波段的數量;|n|是波段總數,|n|-|s|≥1;f(s∪{i})表示波段集合s與波段i的并集作為輸入得到的模型預測輸出;是一個組合系數,用于計算波段i加入波段集合s時的邊際貢獻的權重,這個權重考慮了所有可能的波段組合方式,確保每個波段的貢獻被公平地評估。
24、可選地,所述s4,具體包括:
25、s41、波段子集后向選擇:
26、依次從當前初始波段集合中移除每一個波段,并重新訓練模型,計算并記錄每個移除后的波段子集的驗證集精度,比較并保留精度最高的波段子集;
27、s42、波段子集前向浮動:
28、在移除波段之后,通過將已移除的波段依次分別添加回當前的波段子集,并重新訓練反演模型,評估其驗證集精度,如果重新添加某個波段后,模型精度提升,則這個波段被重新加入波段子集;
29、s43、算法迭代與模型確定:
30、通過后向選擇和前向浮動步驟的交替進行,不斷優化波段子集,當無任何波段可以通過移除或添加來改善模型驗證集精度時,迭代過程停止,精度最優模型作為最終的楊樹葉片氮含量反演模型。
31、另一方面,提供了一種基于高光譜影像數據的楊樹葉片氮含量反演系統,所述系統包括:
32、獲取模塊,用于獲取楊樹種植區無人機高光譜影像數據和葉片樣本氮含量數據;
33、處理模塊,用于對所述高光譜影像數據進行預處理,根據葉片樣本位置和預處理后的高光譜影像數據提取對應的波段反射率數據,構建數據集,所述數據集包括葉片樣本氮含量和對應的波段反射率數據,并劃分訓練集和驗證集;
34、第一確定模塊,用于使用深度神經網絡dnn結合shap算法,確定楊樹葉片氮含量反演的初始波段集合;
35、第二確定模塊,用于使用序列浮動后向選擇算法,確定楊樹葉片氮含量反演的最優波段集合,并進而確定最終的楊樹葉片氮含量反演模型。
36、可選地,所述處理模塊,具體用于:
37、對獲取的所述高光譜影像數據進行輻射定標、幾何校正及正射校正,得到波段反射率數據;
38、將低于400nm和高于900nm的波段剔除,并將光譜數據進行savitzky-golay濾波平滑處理,得到400-900n本文檔來自技高網
...
【技術保護點】
1.一種基于高光譜影像數據的楊樹葉片氮含量反演方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述S2中對所述高光譜影像數據進行預處理,具體包括:
3.根據權利要求1所述的方法,其特征在于,所述S3,具體包括:
4.根據權利要求3所述的方法,其特征在于,所述SHAP值的計算公式如下:
5.根據權利要求1所述的方法,其特征在于,所述S4,具體包括:
6.一種基于高光譜影像數據的楊樹葉片氮含量反演系統,其特征在于,所述系統包括:
7.根據權利要求6所述的系統,其特征在于,所述處理模塊,具體用于:
8.根據權利要求6所述的系統,其特征在于,所述第一確定模塊,具體用于:
9.根據權利要求8所述的系統,其特征在于,所述SHAP值的計算公式如下:
10.根據權利要求6所述的系統,其特征在于,所述第二確定模塊,具體用于:
【技術特征摘要】
1.一種基于高光譜影像數據的楊樹葉片氮含量反演方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述s2中對所述高光譜影像數據進行預處理,具體包括:
3.根據權利要求1所述的方法,其特征在于,所述s3,具體包括:
4.根據權利要求3所述的方法,其特征在于,所述shap值的計算公式如下:
5.根據權利要求1所述的方法,其特征在于,所述s4,具體包括:<...
【專利技術屬性】
技術研發人員:陳珠琳,徐昇,龐麗峰,陶果豐,
申請(專利權)人:中國林業科學研究院資源信息研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。