本發(fā)明專利技術公開了一種基于Bi?GRU的PM2.5數(shù)據(jù)處理與預測方法,包括以下步驟:構建PM2.5數(shù)據(jù)的預測模型;利用訓練集數(shù)據(jù),對所述PM2.5數(shù)據(jù)的預測模型進行訓練;將測試集數(shù)據(jù)輸入訓練完畢的PM2.5數(shù)據(jù)的預測模型中,計算獲得PM2.5的預測值;所述預測模型包括Bi?GRU層、第一全連接層、第二全連接層和第三全連接層,各層之間依次順序連接,前一層的輸出為后一層的輸入。本發(fā)明專利技術中Bi?GRU是一種改進的GRU模型,通過連接兩個GRU模型形成的一個雙向結構,在GRU的基礎上能夠更加充分的獲取序列數(shù)據(jù)的上下文信息,用于對PM2.5數(shù)據(jù)的處理和預測有較好的效果。
A PM2.5 data processing and prediction method based on Bi Gru
【技術實現(xiàn)步驟摘要】
一種基于Bi-GRU的PM2.5數(shù)據(jù)處理與預測方法
本專利技術屬于空氣污染數(shù)據(jù)處理與預測
,具體涉及一種基于Bi-GRU(Bidirectional-GatedRecurrentUnit,雙向門控循環(huán)單元)的PM2.5數(shù)據(jù)處理與預測方法。
技術介紹
空氣污染問題已經(jīng)成為了社會普遍關注的重要問題之一。每年空氣污染會導致300萬人死亡,并且這個人數(shù)還在不斷上升。在中國,霧霾的影響日益增大,其中最為關鍵的PM2.5及以下的微粒。由于PM2.5在吸入人體以后,其中75%會在肺泡內沉積,導致呼吸系統(tǒng)感染,胎兒發(fā)育等嚴重健康問題。政府一直致力于如何減少空氣污染以及對人們健康的影響。一方面,政府通過限制污染企業(yè)、提倡綠色清潔能源的使用,努力治理減少空氣污染物排放的同時,另一方面通過提前預測未來PM2.5濃度信息發(fā)布公眾,提醒人們在極端惡劣的條件下減少戶外活動,能夠給人們的身體健康給與最大限度的保護。因此,對于PM2.5污染濃度的預測研究尤為重要。目前對于PM2.5污染濃度的預測精度仍然不夠,難以滿足人們的需求。主要采用的方法有基于回歸的預測、基于隨機森林的預測、基于SVM的預測以及基于神經(jīng)網(wǎng)絡的預測。近年來,隨著人工智能技術的發(fā)展,越來越多的人發(fā)現(xiàn)基于神經(jīng)網(wǎng)絡的預測方法優(yōu)勢較為突出,能夠取得較好效果。大量學者采用了LSTM、Con-LSTM方法對空氣污染濃度進行了預測,然而精度不夠理想。并且實驗證明,單純的增加LSTM或者Con-LSTM單元的個數(shù)并不能對預測精度進行提高。
技術實現(xiàn)思路
有鑒于此,本專利技術的目的在于提供一種基于Bi-GRU的PM2.5數(shù)據(jù)處理與預測方法,通過連接兩個GRU(GatedRecurrentUnit,門控循環(huán)單元)模型(正向GRU和反向GRU)形成的一個雙向結構,在GRU的基礎上能夠更加充分的獲取序列數(shù)據(jù)的上下文信息,用于對PM2.5數(shù)據(jù)的預測有較好的效果。本專利技術的目的是這樣實現(xiàn)的,包括以下步驟:步驟1,構建PM2.5數(shù)據(jù)的預測模型;步驟2,利用訓練集數(shù)據(jù),對所述PM2.5數(shù)據(jù)的預測模型進行訓練;步驟3,將測試集數(shù)據(jù)輸入訓練完畢的PM2.5數(shù)據(jù)的預測模型中,計算獲得PM2.5的預測值;所述預測模型包括Bi-GRU層、第一全連接層、第二全連接層和第三全連接層,各層之間依次順序連接,前一層的輸出為后一層的輸入,所述Bi-GRU層由一個正向GRU模型和一個反向GRU模型并聯(lián)形成一個雙向結構,所述Bi-GRU層輸出兩個合并的GRU信號,所述的第一全連接層的輸出層為100,所述的第二全連接層的輸出層為10,所述的第三全連接層的輸出層為1;所述訓練集數(shù)據(jù)包括影響因素數(shù)據(jù)和已知的PM2.5觀測數(shù)據(jù);所述的測試集數(shù)據(jù)為待預測的PM2.5數(shù)據(jù)的影響因素數(shù)據(jù)。具體地,所述影響因素數(shù)據(jù)包括predictionHours前歷史PM2.5數(shù)據(jù)、光照強度、露點溫度、空氣濕度、氣壓、溫度、風速、每小時降雨量、8小時歷史總降雨量、時間、季節(jié)、風向共20欄數(shù)據(jù);所述時間分為白天和黑夜2欄;所述的季節(jié)分為春季、夏季、秋季、冬季4欄,風向分為東風、南風、西風、北風、無風5欄;其中,predictionHours是一個預設參數(shù),代表預測未來predictionHours小時的PM2.5濃度。優(yōu)選地,對所述訓練集數(shù)據(jù)根據(jù)不同時間或季節(jié)進行分類,使用不同類別的訓練集分別訓練不同類型下的PM2.5數(shù)據(jù)的預測模型;預測模型訓練完成以后,針對當前測試集數(shù)據(jù),利用測試集數(shù)據(jù)對應類型的預測模型,計算獲得PM2.5的預測值。具體地,所述的BI-GRU層中正向GRU模型的中間輸出反向GRU模型的中間輸出對正向GRU模型和反向GRU模型的中間輸出的聚合操作,得到輸出表示將正向GRU模型的輸出與反向GRU模型輸出進行合并連接,作為所述的BI-GRU層的輸出;其中z1t、為正向GRU模型的中間值,z2t、為反向GRU模型的中間值。具體地,步驟1中所述預測模型的輸出值為所述輸出值為未來predictionHours后的PM2.5濃度,W12o和B12o為模型參數(shù),通過訓練可得。優(yōu)選地,所述預測模型中的損失函數(shù)采用標準歸一化MSE,激活函數(shù)采用Relu函數(shù),步驟2的訓練過程中,通過Adam函數(shù)進行學習,得到參數(shù)神經(jīng)網(wǎng)絡參數(shù)模型。本專利技術方法中的Bi-GRU層是一種改進的GRU模型,通過連接兩個GRU模型(正向GRU和反向GRU)形成的一個雙向結構,在GRU的基礎上能夠更加充分的獲取序列數(shù)據(jù)的上下文信息,用于對PM2.5的預測有較好的效果。附圖說明圖1為本專利技術方法的流程示意圖;圖2為本專利技術方法的預測模型結構圖;圖3為本專利技術實施例中GRU的結構圖;圖4為本專利技術實施例中Bi-GRU模型的結構示意圖。具體實施方式下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本專利技術一部分實施例,而不是全部的實施例?;诒緦@夹g中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。如圖1所示,一種基于Bi-GRU的PM2.5數(shù)據(jù)處理與預測方法,包括以下步驟:步驟1,構建PM2.5數(shù)據(jù)的預測模型;步驟2,利用訓練集數(shù)據(jù),對所述PM2.5數(shù)據(jù)的預測模型進行訓練;步驟3,將測試集數(shù)據(jù)輸入訓練完畢的PM2.5數(shù)據(jù)的預測模型中,計算獲得PM2.5的預測值;如圖2所示,所述預測模型包括Bi-GRU層、第一全連接層、第二全連接層和第三全連接層,各層之間依次順序連接,前一層的輸出為后一層的輸入,所述Bi-GRU層由一個正向GRU模型和一個反向GRU模型并聯(lián)形成一個雙向結構,所述Bi-GRU層輸出兩個合并的GRU信號,所述的第一全連接層的輸出層為100,所述的第二全連接層的輸出層為10,所述的第三全連接層的輸出層為1;所述訓練集數(shù)據(jù)包括影響因素數(shù)據(jù)和已知的PM2.5觀測數(shù)據(jù);所述的測試集數(shù)據(jù)為待預測的PM2.5數(shù)據(jù)的影響因數(shù)數(shù)據(jù)。具體地,所述影響因素數(shù)據(jù)包括predictionHours前歷史PM2.5數(shù)據(jù)、光照強度、露點溫度、空氣濕度、氣壓、溫度、風速、每小時降雨量、8小時歷史總降雨量、時間、季節(jié)、風向共20欄數(shù)據(jù);所述時間分為白天和黑夜2欄;所述的季節(jié)分為春季、夏季、秋季、冬季4欄,風向分為東風、南風、西風、北風、無風5欄;其中,predictionHours是一個預設參數(shù),代表預測未來predictionHours小時的PM2.5濃度。優(yōu)選地,對所述訓練集數(shù)據(jù)根據(jù)不同時間或季節(jié)進行分類,使用不同類別的訓練集分別訓練不同類型下的PM2.5數(shù)據(jù)的預測模型;預測模型訓練完成以后,針對當前測試集數(shù)據(jù),利用測試集數(shù)據(jù)對應類型的預測模型,計算獲得PM2.5的預測值。GRU模型是傳統(tǒng)的在LSTM模型上的一個改進版,其基本結構如圖3所示,其中包含了遺忘門和更新門兩個主要處理本文檔來自技高網(wǎng)...
【技術保護點】
1.一種基于Bi-GRU的PM2.5數(shù)據(jù)處理與預測方法,其特征在于,包括以下步驟:/n步驟1,構建PM2.5數(shù)據(jù)的預測模型;/n步驟2,利用訓練集數(shù)據(jù),對所述PM2.5數(shù)據(jù)的預測模型進行訓練;/n步驟3,將測試集數(shù)據(jù)輸入訓練完畢的PM2.5數(shù)據(jù)的預測模型中,計算獲得PM2.5的預測值;/n所述預測模型包括Bi-GRU層、第一全連接層、第二全連接層和第三全連接層,各層之間依次順序連接,前一層的輸出為后一層的輸入,所述Bi-GRU層由一個正向GRU模型和一個反向GRU模型并聯(lián)形成一個雙向結構,所述Bi-GRU層輸出兩個合并的GRU信號,所述的第一全連接層的輸出層為100,所述的第二全連接層的輸出層為10,所述的第三全連接層的輸出層為1;/n所述訓練集數(shù)據(jù)包括影響因素數(shù)據(jù)和已知的PM2.5觀測數(shù)據(jù);/n所述的測試集數(shù)據(jù)為待預測的PM2.5數(shù)據(jù)的影響因數(shù)數(shù)據(jù)。/n
【技術特征摘要】
1.一種基于Bi-GRU的PM2.5數(shù)據(jù)處理與預測方法,其特征在于,包括以下步驟:
步驟1,構建PM2.5數(shù)據(jù)的預測模型;
步驟2,利用訓練集數(shù)據(jù),對所述PM2.5數(shù)據(jù)的預測模型進行訓練;
步驟3,將測試集數(shù)據(jù)輸入訓練完畢的PM2.5數(shù)據(jù)的預測模型中,計算獲得PM2.5的預測值;
所述預測模型包括Bi-GRU層、第一全連接層、第二全連接層和第三全連接層,各層之間依次順序連接,前一層的輸出為后一層的輸入,所述Bi-GRU層由一個正向GRU模型和一個反向GRU模型并聯(lián)形成一個雙向結構,所述Bi-GRU層輸出兩個合并的GRU信號,所述的第一全連接層的輸出層為100,所述的第二全連接層的輸出層為10,所述的第三全連接層的輸出層為1;
所述訓練集數(shù)據(jù)包括影響因素數(shù)據(jù)和已知的PM2.5觀測數(shù)據(jù);
所述的測試集數(shù)據(jù)為待預測的PM2.5數(shù)據(jù)的影響因數(shù)數(shù)據(jù)。
2.根據(jù)權利要求1所述的PM2.5數(shù)據(jù)處理與預測方法,其特征在于,所述影響因素數(shù)據(jù)包括predictionHours前歷史PM2.5數(shù)據(jù)、光照強度、露點溫度、空氣濕度、氣壓、溫度、風速、每小時降雨量、8小時歷史總降雨量、時間、季節(jié)、風向共20欄數(shù)據(jù);所述時間分為白天和黑夜2欄;所述的季節(jié)分為春季、夏季、秋季、冬季4欄,風向分為東風、南風、西風、北風、無風5欄;其中,predictionHours是一個預設參...
【專利技術屬性】
技術研發(fā)人員:馬武彬,魯贏,吳繼冰,鄧蘇,黃宏斌,吳亞輝,劉麗華,李璇,
申請(專利權)人:中國人民解放軍國防科技大學,
類型:發(fā)明
國別省市:湖南;43
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。