【技術實現步驟摘要】
本專利技術屬于環境科學與氣象科學領域,尤其涉及一種基于集成學習的多源降水產品融合方法。
技術介紹
1、降水是水循環中重要的一個環節,同時也是地表水文過程的基本驅動因子,其本身受到地形和氣候等因素的影響,在時空上有很大的變異性,如何精確獲取降水信息對于區域水資源管理、生產活動、災害預防等領域都有重要作用。傳統方式是通過氣象站點觀測,其不足在于獲取的降水信息在空間上是離散的,尤其在人口稀疏的邊遠地區,觀測站點稀少,很難獲得詳細的空間上連續的降水信息。隨著衛星技術和反演算法的發展,柵格降水產品(簡稱:降水產品)開始出現,降水產品具有空間上連續分布的優勢,但其準確性不如站點觀測資料高。從1997年熱帶降水計劃trmm開始,出現了一系列衛星降水產品和再分析降水產品。
2、當下降水產品種類也較多,但不同降水產品在不同統計評估指標上體現的優劣性也不同,如何以站點觀測資料為基準,將具有不同優勢的降水產品融合在一起,進而獲得具備綜合優勢的降水產品具有重要意義。
技術實現思路
1、專利技術目的:針對現有技術中存在的技術問題,本專利技術提供了一種基于集成學習的多源降水產品融合方法,以站點實測降水量為基準,通過機器學習來融合不同降水產品,進而獲得精度更好的降水產品。
2、技術方案:為實現上述專利技術目的,本專利技術采用以下技術方案:一種基于集成學習的多源降水產品融合方法,包括以下步驟:
3、s1,數據準備:按照研究區域,準備氣象站點降水數據和多源降水產品,并提取氣象站點
4、s2,建立多維評估指標:以站點降水數據作為真值,采用相關系數r、平均絕對相對偏差mare,均方根偏差rmse,探測率pod,誤報率far,臨界成功指數csi六種評估指標對多源降水產品分別計算得到評估值;
5、s3,綜合得分計算:對于同一評估指標,不同降水產品按評估值性能從優到劣依次排序,排名名次作為該降水產品在該評估指標下的得分,并通過下式計算得到不同降水產品的綜合得分scorej,
6、,
7、式中,scorej表示第j類降水產品的綜合得分;skj表示j類降水產品在第k項評估指標得分,m取值為6;
8、s4,降水產品優選:基于步驟s3得到不同降水產品的綜合得分,對不同降水產品按綜合得分從小到大依次排序,并擇優選擇前n名的降水產品,n取值范圍為3~5;
9、s5,集成學習模型構建
10、(1)采用多種機器學習模型,以站點實測降水量數據為基準,以步驟s4優選的降水產品和若干輔助因子作為輸入,對機器學習模型分別進行訓練優化,實現降水量擬合;
11、(2)將訓練優化后的機器學習模型生成的降水產品,按評估指標進行性能評估,從而確定機器學習模型的性能優劣,擇優選擇若干個機器學習模型進行組合,以stacking方法構建集成學習模型;
12、(3)運用集成學習模型進行降水量擬合,在集成學習模型優化的基礎上,生成研究區降水產品。
13、進一步的,步驟s1所述多源降水產品包含衛星降水產品、再分析降水產品。
14、進一步的,步驟s2所述六種評估指標的評估值計算方法如下:
15、(1)相關系數rj,用來衡量降水產品和站點觀測降水數據間的相關性,數值越大表示線性相關性越強,并通過下式計算,
16、,
17、式中,rj為第j類降水產品的相關系數;gi為站點i觀測降水值;表示站點觀測降水值的平均值,pij為站點i對應的第j類降水產品值,?為第j類降水產品值的平均值;n為站點數;
18、(2)?均方根偏差rmsej,反映降水產品與站點觀測值之間偏差的離散程度,均方根偏差越小表示偏差的離散程度越小,并通過下式計算,
19、,
20、式中,rmsej為第j類降水產品的均方根偏差;gi為站點i觀測降水值,?pij為站點i對應的第j類降水產品值;
21、(3)?平均絕對相對偏差marej,反映降水產品與站點觀測值之間的平均偏離程度,越接近于0,代表平均偏離程度越小,降水產品數據更為準確,并通過下式計算,
22、,
23、式中,marej為第j類降水產品的平均絕對相對偏差;gi為站點i觀測降水值,?pij為站點i對應的第j類降水產品值;
24、(4)探測率podj,反映降水產品能正確反映降水日數的比例,范圍為[0,1],越高代表降水產品對真實降水事件探測比例越高,并通過下式計算,
25、,
26、式中,podj為第j類降水產品的探測率;hj表示研究時段內日站點觀測值和與其對應第j類降水產品值同時大于或等于0.1mm的總日數;mj表示研究時段內日站點觀測值小于0.1mm,但其對應j類降水產品值大于或等于0.1mm的總日數;
27、(5)誤報率farj,反映降水產品沒能正確反映降水日數的比例,取值范圍為[0,1],最優為0,越小表示降水產品反映降水事件的錯誤率越低,并通過下式計算,
28、,
29、式中,farj為第j類降水產品的誤報率;hj表示研究時段內日站點觀測值和與其對應第j類降水產品值同時大于或等于0.1mm的總日數;fj表示研究時段內日站點觀測值大于或等于0.1mm,但與其對應j類降水產品值小于0.1mm的總日數,
30、(6)?臨界成功指數csij,反映在有雨日數中降水產品對降水探測成功的比例,取值范圍為[0,1],越接近于1,表示降水產品探測成功并且誤報較少。
31、,
32、式中,csij為第j類降水產品的臨界成功指數;hj表示研究時段內日站點觀測值和與其對應第j類降水產品值同時大于或等于0.1mm的總日數;fj表示研究時段內日站點觀測值大于或等于0.1mm,但與其對應第j類降水產品值小于0.1mm的總日數;mj表示研究時段內日站點觀測值小于0.1mm,但其對應第j類降水產品值大于或等于0.1mm的總日數。
33、進一步的,步驟s5中所述若干輔助因子為:經度、緯度、高程、海陸距離與云量。
34、進一步的,步驟s5中所述機器學習模型包括rf,catboost,knn,lasso,dtree,xgboost,hgbr和etree。
35、進一步的,步驟s5中所述對機器學習模型分別進行訓練優化,是對每個機器學習模型進行單獨訓練優化。
36、進一步的,步驟s5所述站點實測降水量數據,基于站點空間分布均勻的原則,按6:2:2的比例分為訓練集、驗證集和測試集。
37、進一步的,步驟s5中所述機器學習模型進行訓練優化時,采用randomizedsearchcv尋找最優超參數。
38、有益效果:與現有技術相比,本專利技術運用多種機器學習模型及其不同組合的集成學習模型,融合多源降水產品,并考慮多個輔助因子為輸入,以多種評估指標為依據,生成質量更優的降水產品。本文檔來自技高網...
【技術保護點】
1.一種基于集成學習的多源降水產品融合方法,其特征在于包括以下步驟:
2.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S1所述多源降水產品包含衛星降水產品、再分析降水產品。
3.基于集成學習的多源降水產品融合方法,其特征在于:步驟S2所述六種評估指標的評估值計算方法如下:
4.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S5中所述若干輔助因子為:經度、緯度、高程、海陸距離與云量。
5.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S5中所述機器學習模型包括RF,CatBoost,KNN,Lasso,DTREE,XGBoost,HGBR和ETREE。
6.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S5中所述對機器學習模型分別進行訓練優化,是對每個機器學習模型進行單獨訓練優化。
7.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S5所述站點實測降水量數據,基于站點空間分布均勻的原則,按6
8.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟S5中所述機器學習模型進行訓練優化時,采用RandomizedSearchCV尋找最優超參數。
...【技術特征摘要】
1.一種基于集成學習的多源降水產品融合方法,其特征在于包括以下步驟:
2.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟s1所述多源降水產品包含衛星降水產品、再分析降水產品。
3.基于集成學習的多源降水產品融合方法,其特征在于:步驟s2所述六種評估指標的評估值計算方法如下:
4.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟s5中所述若干輔助因子為:經度、緯度、高程、海陸距離與云量。
5.根據權利要求1所述基于集成學習的多源降水產品融合方法,其特征在于:步驟s5中所述機器學習模型包括rf,catboost,k...
【專利技術屬性】
技術研發人員:曾燕,薛順奎,邱新法,朱曉晨,陳兵,許金萍,王珂清,吳昊,
申請(專利權)人:南京氣象科技創新研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。