本發明專利技術公開了一種基于二類支持向量機和粒子群算法的近海水質評價方法,其包括以下步驟:選擇近海水質評價因素作為特征信息,建立樣本數據集,并對特征信息進行歸一化處理,完成特征信息的預處理,將所有的特征信息組成特征向量;確定近海水質評價等級,對近海水質評價等級進行二進制編碼,并構造支持向量機網絡;采用粒子群優化算法進行參數尋優并得到最優向量參數;采用最優向量參數對支持向量機網絡中的每個二類支持向量機進行訓練;S5、利用訓練完成的支持向量機網絡,輸入待分類的樣本集,獲得對其預測的結果,完成近海水質的等級評價。本發明專利技術實現了根據選定的近海海域的污染物特征進行多類近海水質等級的評價。
【技術實現步驟摘要】
本專利技術屬于模式識別與質量評價
,特別是涉及一種基于二類支持向量機和粒子群算法的近海水質評價方法。
技術介紹
海洋是地球賴以生存的重要水資源,但是目前面臨著越來越嚴重的水質污染問題。水環境質量評價作為環境質量評價的一項重要內容,是進行環境管理的重要手段之一。對于海水水質綜合評價的方法,早期國內外學者大多使用如綜合指數法、模糊綜合評價法、模糊聚類法等方法,但是這些方法都要事先假定模式或主觀規定的一些參數如模糊綜合評價法要給定水質參數的權值;模糊聚類分析要給定隸屬函數等,評價結果具有很強的主觀性。近年來,國內外都在努力探索更為合理的評價方法,其中人工神經網絡評價法被廣泛 使用,但用其建立水質評價模型存在兩個問題訓練樣本不足,計算精度不夠。由于神經網絡結構太大而出現“過擬合”現象,這樣建立的模型就無法保證其具有較好的泛化能力和預測能力,所以迫切需要更加精確的水質評價模型。支持向量機(Support Vetor Machine, SVM)算法是目前在模式識別領域研究的熱點,其是Vapnik及其合作者在統計學習理論的基礎上,于1995年提出的一種新型機器學習方法,其基本思想是通過事先選擇的線性/非線性映射將輸入向量X映射到一個高維特征空間Z,然后在這個特征空間中構造最優化的數據分類/數據回歸超平面。支持向量機是一種非參數機器學習方法,以結構風險最小化為基本原則,具有嚴格的理論基礎,它根據有限的樣本信息在模型的復雜性和學習能力之間尋找最佳折中,以期獲得最好的泛化能力,解決了困擾以往機器學習方法的許多問題。但早期的支持向量機只能對線性可分的二類問題進行分類,本專利技術提出的核函數技巧可以改變這個狀況。所謂核函數技巧就是通過一個核函數將線性不可分的樣本特征向量映射到一個高維空間中,在這個高維空間類樣本能夠線性可分;而本專利技術通過由多個二類支持向量機構造的支持向量機網絡,可以解決多類劃分問題。但支持向量機的學習能力和泛化能力很大程度上取決于參數的選擇,本專利技術采用的粒子群優化算法是一種群體智能優化算法,可以解決支持向量機的參數尋優問題。粒子群優化算法初始化為一群隨機粒子,即隨機的初始解,然后粒子們根據自身的飛行經驗和群體的飛行經驗來調整自己的飛行軌跡,參照最優粒子的位置在解空間中搜索,并通過迭代找到最優解。
技術實現思路
本專利技術所要解決的技術問題是提供一種基于二類支持向量機和粒子群算法的近海水質評價方法,其通過多個利用核函數方法的二類支持向量機構造了支持向量機網絡,并使用粒子群優化算法進行參數的優化,實現了根據選定的近海海域的污染物特征進行多類近海水質等級的評價。本專利技術是通過下述技術方案來解決上述技術問題的一種基于二類支持向量機和粒子群算法的近海水質評價方法,其特征在于,其包括以下步驟SI、選擇近海水質評價因素作為特征信息,建立樣本數據集,并對特征信息進行歸一化處理,完成特征信息的預處理,將所有的特征信息組成特征向量;S2、確定近海水質評價等級,對近海水質評價等級進行二進制編碼,并構造支持向量機網絡;S3、為了能夠在更大范圍內尋找二類支持向量機的懲罰參數和核函數參數的最佳值,采用粒子群優化算法進行參數尋優并得到最優向量參數;S4、采用步驟S3所得的最優向量參數對支持向量機網絡中的每個二類支持向量機進行訓練;S5、利用步驟S4訓練完成的支持向量機網絡,輸入待分類的樣本集,獲得對其預測的結果,完成近海水質的等級評價。 優選地,所述步驟SI具體還包括以下兩個步驟步驟SI. 1,選取有效的近海水質特征信息,特征信息的選擇主要根據已經檢測獲得的近海海域的污染物特征,包括溶解氧、化學需氧量、活性磷酸鹽、無機氮和石油類五項污染指標,收集至少一百種樣本作為樣本數據集并組成特征信息;步驟S I. 2,選定特征信息后進行歸一化處理,根據每項特征信息的最大值和最小值,完成特征信息的歸一化后,將所有的特征信息組成特征向量。優選地,所述歸一化處理中使用的公式如下式 , j - mini X),、 . X=-:-, max(.v)本 mm(..V)max(.v)- min(.v)x' = l, niax(.v) = 111111(1-)其中,X為歸一化前的特征信息值,max (X)和min (X)分別表示對x取最大值和最小值,X’為歸一化后的特征信息值。優選地,所述步驟S2具體還包括以下兩個步驟步驟S2. 1,確定近海水質評價等級;步驟S2. 2,對近海水質等級進行二進制編碼,具體是指為每個近海水質等級分配一個二進制編號;步驟S2. 3,根據二進制編碼的形式,構造出兩層的支持向量機網絡。優選地,所述支持向量機均采用徑向基函數,其公式為以下式所示[(xf,x) = e-K其中,x,xi為數據樣本,是η個d維特征向量,Y是核函數參數。優選地,所述步驟S3具體還包括以下兩個步驟步驟S3. I,初始化種群;步驟S3. 2,計算各粒子的適應度;步驟S3. 3,評價種群,比較各適應度大小,計算出個體極值和全局極值;步驟S3. 4,更新粒子的速度和位置的公式,產生新種群;步驟S3. 5,設置尋優結束條件為尋優達到最大進化代數,或評價值小于給定精度;檢查結束條件,若滿足結束條件,則結束尋優;否則轉至步驟S3. 2。本專利技術的積極進步效果在于一、高效率利用二進制編碼方式進行支持向量機網絡的構造,減少了支持向量機網絡中的向量機數目,提高了得出評價等級的速度,這樣可提高效率。二、準確性高使用粒子群優化算法對二類支持向量機的參數進行優化,降低了參數選擇的盲目性和不準確性,提高了預測精度和穩定性,這樣可提高準確性。附圖說明圖I為本專利技術基于二類支持向量機和粒子群算法的近海水質評價方法的流程圖。圖2為近海污染物分界值樣本和近海水質等級對應關系示意圖。圖3 (a)是近海水質等級的二進制編碼示意圖。圖3 (b)是利用二進制編碼構造的支持向量網絡的示意圖。圖4是粒子群算法進行參數尋優的方法流程圖。具體實施例方式為了使本專利技術所要解決的技術問題、技術方案更加清楚,以下結合附圖以實施例,對本專利技術進一步詳細說明。如圖I所示,本專利技術基于二類支持向量機和粒子群算法的近海水質評價方法包括以下步驟步驟1,選擇近海水質評價因素作為特征信息,建立樣本數據集,并對特征信息進行歸一化處理,完成特征信息的預處理,將所有的特征信息組成特征向量。步驟I具體還包括以下兩個小步驟步驟I. 1,選取有效的近海水質特征信息。特征信息的選擇主要根據已經檢測獲得的近海海域的污染物特征,包括溶解氧、化學需氧量、活性磷酸鹽、無機氮和石油類五項污染指標,收集至少一百種(或組)樣本作為樣本數據集并組成特征信息。本實施例中選取渤海灣近岸海域五個測試點在2004— 2007年枯水期和豐水期的實測數據作為實驗,選取其中至少一百組作為樣本數據集并組成特征信息。隨機選擇約三分之二的樣本數據作為訓練樣本數據,用于建立預測模型;剩余的約三分之一的樣本數據作為預測樣本數據,用于對所建模型進行評價和驗證。步驟I. 2,選定特征信息后進行歸一化處理,根據每項特征信息的最大值和最小值,將每項特征信息的所有數據線性地轉化到區間內。歸一化處理中使用的公式(轉化公式)如下式(I):本文檔來自技高網...
【技術保護點】
一種基于二類支持向量機和粒子群算法的近海水質評價方法,其特征在于,其包括以下步驟:S1、選擇近海水質評價因素作為特征信息,建立樣本數據集,并對特征信息進行歸一化處理,完成特征信息的預處理,將所有的特征信息組成特征向量;S2、確定近海水質評價等級,對近海水質評價等級進行二進制編碼,并構造支持向量機網絡;S3、為了能夠在更大范圍內尋找二類支持向量機的懲罰參數和核函數參數的最佳值,采用粒子群優化算法進行參數尋優并得到最優向量參數;S4、采用步驟S3所得的最優向量參數對支持向量機網絡中的每個二類支持向量機進行訓練;S5、利用步驟S4訓練完成的支持向量機網絡,輸入待分類的樣本集,獲得對其預測的結果,完成近海水質的等級評價。
【技術特征摘要】
1.一種基于二類支持向量機和粒子群算法的近海水質評價方法,其特征在于,其包括以下步驟 51、選擇近海水質評價因素作為特征信息,建立樣本數據集,并對特征信息進行歸一化處理,完成特征信息的預處理,將所有的特征信息組成特征向量; 52、確定近海水質評價等級,對近海水質評價等級進行二進制編碼,并構造支持向量機網絡; 53、為了能夠在更大范圍內尋找二類支持向量機的懲罰參數和核函數參數的最佳值,采用粒子群優化算法進行參數尋優并得到最優向量參數; 54、采用步驟S3所得的最優向量參數對支持向量機網絡中的每個二類支持向量機進行訓練; 55、利用步驟S4訓練完成的支持向量機網絡,輸入待分類的樣本集,獲得對其預測的結果,完成近海水質的等級評價。2.如權利要求I所述的基于二類支持向量機和粒子群算法的近海水質評價方法,其特征在于,所述步驟SI具體還包括以下兩個步驟步驟SI. I,選取有效的近海水質特征信息,特征信息的選擇主要根據已經檢測獲得的近海海域的污染物特征,包括溶解氧、化學需氧量、活性磷酸鹽、無機氮和石油類五項污染指標,收集至少一百種樣本作為樣本數據集并組成特征信息;步驟SI. 2,選定特征信息后進行歸一化處理,根據每項特征信息的最大值和最小值,完成特征信息的歸一化后,將所有的特征信息組成特征向量。3...
【專利技術屬性】
技術研發人員:倪彤光,顧曉清,張艷慧,
申請(專利權)人:常州大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。