本發明專利技術提供一種遙感圖像樣本智能采集方法。該樣本采集方法能夠有效的選擇圖像分類所需要的樣本集合,降低樣本采集的時間和金錢成本。該方法包括以下步驟:對于待分類的遙感圖像,首先由用戶隨機標記少量的樣本;用這些少量的樣本對圖像先進行圖像分類;將分類結果轉換為各類別的概率;選取圖像中最有信息量的一組未標記樣本;由用戶對這組未標記的樣本集合進行類別標記;新標記的樣本集合與已有的樣本集組成新的樣本集;使用新的樣本集對圖像重新進行訓練;迭代進行上述過程;當滿足一定的條件時,迭代停止,得到一組樣本。
【技術實現步驟摘要】
本專利技術涉及遙感圖像處理技術,具體的說,涉及一種遙感圖像樣本智能采集方法,該樣本采集方法能夠極大降低圖像分類所需要的樣本數目,從而降低樣本采集的成本。
技術介紹
遙感技術在很多領域得到廣泛應用,如森林資源規劃、農作物估產、環境監測等。遙感圖像分類技術是把遙感圖像從數據轉換為信息的關鍵步驟。從是否需要訓練樣本來分,遙感圖像分類方法分為監督分類和非監督分類。在遙感圖像分類中最常用的是監督分類方法。監督分類方法,需要人工地確定分類體系、各個類別的訓練樣本等。對監督分類方法而言,在分類器已經確定的情況下,分類效果的好壞很大程度上取決于訓練樣本的數量與質量。 目前遙感圖像分類中樣本采集的方法主要包括,隨機采樣和分層采樣。隨機采樣是指隨機地在整幅圖像上選取一些點,然后去實地或者通過圖像解譯確定這些點的類別信息。隨機采樣的最大優點在于其統計上和參數估計上的簡易性。當圖像中某些類別占的數量較少時,隨機采樣往往會丟掉這些類別。為了保證每個類別都能在采樣中出現,可以采用分層采樣,即分別對每個類別進行隨機采樣。上述兩種樣本采集策略的主要缺點是:不能確定獲得滿意的分類效果需要多少數目的樣本;不知道在已有數量樣本的情況下能否獲得好的分類效果。基本上可以認為,我們只是這樣設計了樣本采集的原則(可能耗費了很大的時間和金錢成本),但是能獲得什么樣的分類效果,只能聽“天”由命了。并且,這種樣本采集策略都是在圖像分類之前完成的。 本專利提出了一種新型的遙感圖像樣本采集方法;針對遙感圖像處理領域樣本采集費時費力等特點,本專利提出了一種能夠在分類過程中通過目前的分類結果預測出類別信息非常模糊的樣本,然后由樣本采集人員對這些樣本點進行類別標記,形成更新后的訓練樣本集,并進行重新分類的樣本采集方法。這種樣本采集方法是一種迭代的過程,能夠在初始有極少量樣本的情況下,始終選擇對分類最有效的樣本集,避免了過多冗余樣本的采集,從而很大程度上減少了樣本采集的總量,進而降低樣本采集的時間和金錢成本。
技術實現思路
本專利技術的目的是提供一種遙感圖像樣本智能采集方法。 本專利技術的基本思路為:對于待分類的遙感圖像,首先由用戶隨機標記少量的樣本;用這些少量的樣本對圖像先進行圖像分類;依據某種準則,選取圖像中分類效果最不準確的一組未標記的樣本點;由用戶對這組未標記的樣本集合進行類別標記;新標記的樣本集合與已有的樣本集組成新的樣本集;使用新的樣本集對圖像重新進行訓練;迭代進行上述過程,得到一組樣本。 本專利技術的技術方案提供的一種遙感圖像樣本智能采集的方法,其特征在于包括以下實施步驟: A?對于待分類的遙感圖像,首先由用戶隨機標記少量的樣本; B?使用已有的樣本集對圖像進行訓練,并使用分類器對圖像進行分類; C?對步驟B中每個像素的分類結果轉換為各類別的概率; D?對步驟C中每個像素的類別概率,按照從小到大升序排列; E?求取步驟D中計算出的每個像素最小的一組(小于類別數目)概率,并求和; F?對步驟E中每個像素最小的一組概率分別求和之后,對求和的值進行按照從小到大進行順序排列;并選擇出求和值最小的一組像素,作為未標記的樣本; G?由用戶對步驟F中獲得的一組未標記樣本進行樣本標記,與步驟A中的樣本組成新的樣本集合; H?重復步驟B-步驟G,直到獲得足夠多的樣本集合。 上述實施步驟的特征在于: 步驟A中待分類的遙感圖像主要是指光學圖像數據;用戶首先對待分類的遙感圖像,確認好分類體系,確認總共有幾個類別,假設為K個類別;對K個類別中的每一個類別首先選定少量(少于10個)樣本;樣本確認可以通過圖像解譯的方式或者實地樣本采集的方式。 步驟B中所述的選用分類器進行分類,是指選用遙感圖像分類中常用分類器,如最大似然分類器、支持向量機分類器等。 步驟C中所述的每個像素的分類結果轉換為各類別的概率,是對某像素x,計算出其屬于K個類別中各個類別的概率;對于某些分類器,如最大似然分類器,分類結果中就有屬于各個類別的概率;而對于另一些分類器,如支持向量機分類器,分類結果并不直接輸出各個類別的概率,需要通過一些計算過程把支持向量機輸出結果轉換為各個類別的概率。 步驟D是指,對于任意像素x,對應K個類別的概率按照從小到大進行排列,記為P(k),k=1,...,K,并且P(1)<P(2)<...<P(K)。 步驟E是指,對任意像素x,計算最小的c個概率的和其中1<c<K/2,c為整數。 步驟F是指對所有的Sx按照從小到大進行排列,并選擇出Sx值最小的m個像素,其中m為大于1的整數。 步驟G是指,由用戶對步驟F中所選的m個未標記樣本進行類別屬性的標記,標記過程同步驟A一樣,可以通過圖像解譯的方式,也可以通過實地樣本采集進行類別屬性的確認的方式。 步驟H是指,重復步驟B-步驟G,直到采集的樣本數目足夠多迭代停止,輸出總的采集的樣本。 本專利技術與現有技術相比有如下特點:該樣本采集方法是一個迭代的過程,當分類結果趨于穩定時,我們“確信”不需要采集更多的樣本了;另外,通過這種樣本采集方法,獲得相同的分類精度,所需要的訓練樣本要遠遠少于隨機樣本采集方法,從而大大降低樣本采集的時間和金錢的成本。 附圖說明: 圖1是一種遙感圖像樣本智能采集方法流程圖 具體實施方式: 采用本專利技術實現一種遙感圖像樣本智能采集策略的實施例如圖1所示,現結合圖1對其進行描述。 處理單元100利用現有的樣本信息,選用圖像的光譜特征,對選定的分類器(如支持向量機分類器)進行分類器的訓練,學習得到最佳的分類器參數。假設待分類的圖像包括如下地物類型:農田、林地、草地、裸土、水體、建成區,即地物類型數目K=6,各個類別的初始樣本數目都為5個。 處理單元101使用處理單元100訓練得到的分類器,對圖像中所有的像素進行分類,得到各個像素的類別信息。 處理單元102將分類結果轉換為各類別的概率。具體的轉換過程為: 對于K個類別,需要計算出對應各個類別的概率P(k),k=1,...,K,首先任意兩個類別之間的概率rij; r ij = 1 本文檔來自技高網...

【技術保護點】
一種遙感圖像樣本智能采集方法,其特征在于包括以下步驟:A?對于待分類的遙感圖像,首先由用戶隨機標記少量的樣本;B?使用已有的樣本集對圖像進行訓練,并使用分類器對圖像進行分類;C?對步驟B中每個像素的分類結果轉換為分類各類別的概率;D?對步驟C中每個像素的分類類別概率,按照從小到大升序排列;E?求取步驟D中計算出的每個像素最小的一組(小于類別數目)概率,并求和;F?對步驟E中每個像素最小的一組概率分別求和之后,對求和的值進行按照從小到大進行順序排列;并選擇出求和值最小的一組像素,作為未標記的樣本;G?由用戶對步驟F中獲得的一組未標記樣本進行樣本標記,與步驟A中的樣本組成新的樣本集合;H?重復步驟B?步驟G,直到獲得足夠多的樣本集合。
【技術特征摘要】
1.一種遙感圖像樣本智能采集方法,其特征在于包括以下步驟:
A?對于待分類的遙感圖像,首先由用戶隨機標記少量的樣本;
B?使用已有的樣本集對圖像進行訓練,并使用分類器對圖像進行分類;
C?對步驟B中每個像素的分類結果轉換為分類各類別的概率;
D?對步驟C中每個像素的分類類別概率,按照從小到大升序排列;
E?求取步驟D中計算出的每個像素最小的一組(小于類別數目)概率,并求和;
F?對步驟E中每個像素最小的一組概率分別求和之后,對求和的值進行按照從小到大進行順序排列;并
選擇出求和值最小的一組像素,作為未標記的樣本;
G?由用戶對步驟F中獲得的一組未標記樣本進行樣本標記,與步驟A中的樣本組成新的樣本集合;
H?重復步驟B-步驟G,直到獲得足夠多的樣本集...
【專利技術屬性】
技術研發人員:霍連志,趙理君,李騰,周增光,胡昌苗,鄭柯,
申請(專利權)人:中國科學院遙感與數字地球研究所,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。