本發明專利技術涉及一種機器嗅覺同時確定氣味類別與強度的方法,所述的方法由n個函數逼近模型集合體來代表n種氣味,一一對應;其中:每一個函數逼近模型集合體,由一個多元對數線性回歸模型、一個多元對數二次回歸模型、一個單輸出感知器和一個支持向量機4個專家所組成,代表著一種特定的氣味。一個函數逼近模型集合體內各個專家的結構和參數通過學習來自所代表氣味的訓練樣本集所確定。一個氣味樣本的最終類別與強度由預測相對標準差最小的函數逼近模型集合體所確定。利用本發明專利技術,機器嗅覺裝置解決了高維多類別海量樣本集的學習問題,具有對成千上萬種氣味類別與強度的同時確定能力。
【技術實現步驟摘要】
本專利技術涉及一種機器嗅覺同時確定氣味類別與強度的方法,具體地說,涉及一種面向高維、大樣本、多類別學習問題的,基于函數逼近模型集合體的機器嗅覺氣味類別與強度同時確定的方法。
技術介紹
經驗豐富的專家能識別4000多種氣味,但難以定量確定氣味的強度。與之相比,機器嗅覺對氣味的分析能力還十分有限。到目前為止,機器嗅覺方法只能識別一、二十種氣味,或估計簡單成分氣體的濃度,幾乎沒有用該方法同時確定多種氣味類別與強度的報道。由此看來,機器嗅覺方法與裝置目前的發展水平與人們的期望還存在很大的距離。從長遠來看,人們將不可避免地要求機器嗅覺裝置能執行多種氣味類別與濃度同時確定的任務。但是,一個主要障礙是現有模式識別和函數逼近方法的性能不能滿足機器嗅覺的要求。在機器嗅覺技術發展初期,常用的數據處理方法有多元回歸、偏最小二乘、聚類分析、主成分分析、判別函數分析、模板匹配等。今天,人工神經網絡、支持向量機、獨立成分分析等方法應用較多。對多種氣味類別與濃度的同時確定問題實際上就是要確定一個氣味樣品的類別歸屬及其濃度大小。由于機器嗅覺方法用氣敏傳感器陣列來感知氣味,這一問題從數學上可以被看成是高維測量空間的分類或函數估計問題。因此,有下列兩種解決方法。(A).將多種氣味類別與濃度的同時確定問題看成分類問題。也就是說,用一個多輸入多輸出分類器或多個多輸入單輸出分類器來解決這一問題。采用一個多輸入多輸出分類器意味著將這一問題看成一個整體。如果有n1種氣味,每一種氣味有n2種濃度,則該分類器應有n1×n2個輸出單元。當氣味類別與濃度較多時,將之看成整體的缺點是多輸出分類器學習時間長,分類精度低。若用多個多輸入單輸出分類器來解決這一問題,則一個單輸出分類器代表一種氣味的某個固定濃度點。這種做法的主要缺點是需要太多的分類器,當氣味類別與濃度很多時,該方法是不實際的。(B).將多種氣味類別與濃度的同時確定問題看成函數逼近問題。這就是說,用一個多輸入多輸出或多個多輸入單輸出函數逼近模型來解決這一問題。我們知道,函數逼近模型的一個輸出單元對任意一個輸入會給出一個對應的輸出,不管這個預測輸出多么荒謬,這相當于函數逼近模型不知道說“不”。因此,這兩種方法的效果并不理想。例如,可能會出現這樣一種矛盾的現象,對一個氣味樣品,一個輸出單元預測結果可能是100ppm(百萬之一)甲醇,而另一個輸出單元的預測結果可能是1000ppm乙醇。面對這種窘迫的境地我們是無能為力的。這一窘境同時也告訴我們,單一類型的函數逼近模型是無法解決多種氣味類別與濃度的同時確定問題的,分析兩個輸出單元中哪一個預測精度高是沒有意義的。因為單一類型分類器的分類能力有限,人們于20世紀90年代初提出了分類器組合的概念。其基本思想是通過若干個簡單分類器預測結果的組合以達到與單個復雜分類器相同甚至更好的推廣性能。為了解決大規模學習問題,人們又提出了各種任務分解方法和模塊化分類器模型。常用的任務分解方法不外乎一對一和一對多兩種,現有組合策略包括最大值、最小值、平均值、大多數投票、和、積、自提升、裝袋等。從理論上講,現有分類器組合策略都可以用于函數逼近模型集成之中,但實際上,沒有一個可以直接應用。為了實現對多種氣味類別與濃度的同時確定,本專利技術提出一種新的函數模型集合體及其組合策略。本專利技術的基本想法如下。一個函數逼近模型可以是一個多元對數線性回歸模型、一個多元對數二次回歸模型、一個單輸出多層感知器和一個支持向量機。我們將一個模型看成一個專家,一個函數模型集合體由上述4個專家組成,代表著一種特定的氣味。組內所有專家都用來自所代表的氣味的樣本進行訓練。如果一個樣本確實屬于某個專家組代表的氣味,則該專家組內所有成員的預測結果將是相當接近的,否則是相當分散的。換句話說,一個樣本的類別由那個意見最一致的專家組所確定,其濃度等于該組內所有專家的平均預測值。這里,“意見最一致”由組內專家平均預測結果的相對標準差來度量。單純考慮單個專家組的預測精度是沒有意義的。與此同時,一個專家組的結構復雜性不受所代表的氣味濃度點增多的影響。根據多元對數線性回歸模型和多元對數二次回歸模型的特點,它們對一個氣味樣本的實際預測輸出或者可能非常之大,甚至遠遠超過100%這一最高極限值,或者可能非常之小,遠遠小于濃度為0這一最低極限值。這些實際上并不存在的預測輸出正好可以用來確定該樣本不屬于一個專家組所代表的氣味的依據。相對而言,由于Sigmoid活化函數和Gaussian核的有界特性,感知器和支持向量機的預測輸出總是在這一范圍內?,F有一種嗅覺模擬裝置及其嗅覺模擬測試方法(參見專利申請號02111046.8),使用該套裝置檢測待測氣味,得到多維響應信號,需要經計算機數據處理,最終得到氣味的類別、整體強度或簡單成分氣味濃度估計值。申請號為02111046.8的專利技術沒有具體涉及如何實現計算機數據處理的問題。現有一種基于模塊化組合神經網絡的機器嗅覺氣味識別方法(參見專利申請號03141537.7)。該專利技術將濃度估計問題轉化為分類問題,沒有涉及氣味類別與濃度的同時快速估計問題和數據處理方法的結構簡化問題。
技術實現思路
本專利技術是在現有的一種機器嗅覺裝置及其嗅覺模擬測試方法(參見專利申請號02111046.8)和一種基于模塊化組合神經網絡的機器嗅覺氣味識別方法(參見專利申請號03141537.7)的基礎上,提出的一種基于函數逼近模型集合體和機器嗅覺的氣味類別與強度同時確定方法。一個函數逼近模型集合體僅需學習來自所代表的氣味的特征,專家組之間僅通過預測結果相對標準差的比較,就可使機器嗅覺裝置具有對成千上萬種氣味進行類別判斷和強度同時確定的能力。函數逼近模型集合體結構復雜性不因訓練子集中濃度點的增多而變化。本專利技術采用了下列技術方案機器嗅覺裝置通過對大量氣味的測量,得到大量學習樣本,函數逼近模型集合體通過學習這些樣本,確定了其最優結構和參數。在識別氣味時,機器嗅覺裝置將得到氣味的特征,與函數逼近模型集合體記憶的氣味特征比較,從而確定一個待定氣味的類別與強度。所述的一個函數逼近模型集合體或專家組由一個多元對數線性回歸模型、一個多元對數二次回歸模型、一個單輸出多層感知器和一個支持向量機等4個專家所組成,代表著一種特定的氣味,模擬氣敏傳感器陣列對所代表氣味的響應。如果有n種氣味,則有n個專家組。相應地,組內各專家均學習來自所代表氣味的樣本子集以確定其結構與參數。所述的多元對數線性回歸模型通過以下步驟確定其結構和參數a、將一個復雜的多輸入多輸出函數逼近問題轉化為多個多輸入單輸出函數逼近問題。如果有n種氣味,則有n個多輸入單輸出對數線性回歸模型。b、一個訓練子集僅由來自于同一種氣味的樣本所組成。c、輸入特征分量的大小等于對應的氣敏傳感器的響應,期望輸出dp1為氣味已知濃度cp(ppm,百萬分之一)的常用對數值lg(cp+0.1)。d、一個多輸入單輸出對數線性回歸模型j由對應于m個輸入特征分量的系數(α1(j),α2(j),...,αm(j))和一個常系數a0(j)所確定。數學表達式為yp1(j)=α0(j)+α1(j)xp1(j)+··&Cente本文檔來自技高網...
【技術保護點】
一種機器嗅覺同時確定氣味類別與強度的方法,其特征在于,所述的方法由n個函數逼近模型集合體來代表n種氣味,一一對應;其中:每一個函數逼近模型集合體,由一個多元對數線性回歸模型、一個多元對數二次回歸模型、一個單輸出感知器和一個支持向量機 4個專家所組成;代表一種特定的氣味,模仿氣敏傳感器陣列對所代表氣味的響應;所述的函數逼近模型集合體通過以下步驟同時確定氣味的類別與強度:a、將一個復雜的n種氣味類別與強度同時確定問題轉化為n個多輸入單輸出函數逼近問題,這里, 多輸入是指氣敏傳感器陣列對一個氣味樣品的響應向量,維數等于傳感器個數,單輸出是指對應于該氣味樣本的強度值;b、設來自氣味j的訓練樣本數為N↓[j],第p個氣味樣本x↓[p],函數逼近模型k的實際輸出為*,目標輸出為*,則模塊k對類別 j所有訓練樣本的均方根誤差為:***(1);c、將一個函數逼近模型集合體j內4個專家的實際輸出通過比例變換和指數變換轉化為各自的氣味強度預測值*,并在此基礎上求強度預測平均值*,*作為專家組j的一個實際輸出。專家組j對x ↓[p]的強度預測平均值為:***(2);d、計算一個專家組j中4個專家對x↓[p]的強度預測值的標準差,然后除以強度預測平均值*,得到相對標準差ζ↓[p]↑[(j)],相對標準差ζ↓[p]↑[(j)]作為專家組的另一個 實際輸出,函數逼近模型集合體j對x↓[p]的強度預測相對標準差為:***(3);因此,函數逼近模型集合體j的兩個實際輸出為強度預測平均值*和相對標準差ζ↓[p]↑[(j)];e、比較所有函數逼近模型集合體的強度預 測相對標準差的大小。一個待定樣本x↓[p]的類別由強度預測相對標準差最小的函數逼近模型集合體所確定,其強度為該函數逼近模型集合體的預測平均值,即x↓[p]∈ω↓[j]且***,如果***,j=1,2,…,n(4)。...
【技術特征摘要】
1.一種機器嗅覺同時確定氣味類別與強度的方法,其特征在于,所述的方法由n個函數逼近模型集合體來代表n種氣味,一一對應;其中每一個函數逼近模型集合體,由一個多元對數線性回歸模型、一個多元對數二次回歸模型、一個單輸出感知器和一個支持向量機4個專家所組成;代表一種特定的氣味,模仿氣敏傳感器陣列對所代表氣味的響應;所述的函數逼近模型集合體通過以下步驟同時確定氣味的類別與強度a、將一個復雜的n種氣味類別與強度同時確定問題轉化為n個多輸入單輸出函數逼近問題,這里,多輸入是指氣敏傳感器陣列對一個氣味樣品的響應向量,維數等于傳感器個數,單輸出是指對應于該氣味樣本的強度值;b、設來自氣味j的訓練樣本數為Nj,第p個氣味樣本xp,函數逼近模型k的實際輸出為ypk(j),目標輸出為dpk(j),則模塊k對類別j所有訓練樣本的均方根誤差為ϵk(j)=12Nj(dpk(j)-ypk(j))2---(1);]]>c、將一個函數逼近模型集合體j內4個專家的實際輸出通過比例變換和指數變換轉化為各自的氣味強度預測值cpk(j),并在此基礎上求強度預測平均值cp(j),cp(j)作為專家組j的一個實際輸出。專家組j對xp的強度預測平均值為c‾p(j)=14Σk=14cpk(j)---(2);]]>d、計算一個專家組j中4個專家對xp的強度預測值的標準差,然后除以強度預測平均值cp(j),得到相對標準差ζp(j),相對標準差ζp(j)作為專家組的另一個實際輸出,函數逼近模型集合體j對xp的強度預測相對標準差為ζp(j)=1c‾p(j)14-1Σk=14(cpk(j)-c‾p(j))2×100%---(3);]]>因此,函數逼近模型集合體j的兩個實際輸出為強度預測平均值cp(j)和相對標準差ζp(j);e、比較所有函數逼近模型集合體的強度預測相對標準差的大小。...
【專利技術屬性】
技術研發人員:高大啟,楊云帆,陳偉,朱尚明,
申請(專利權)人:華東理工大學,
類型:發明
國別省市:31[中國|上海]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。