本發明專利技術公開了一種基于半監督學習的晶圓圖批量分析方法,該方法包括以下步驟:對晶圓圖進行預處理;對預處理后的晶圓圖進行篩選;使用有標簽及無標簽晶圓圖訓練半監督模型;篩選無標簽晶圓圖優化半監督模型;進行晶圓圖分析。本發明專利技術能夠利用少量有標簽晶圓圖建立穩定高效的半監督模型,能在實際生產中準確地完成晶圓圖分析。
A Wafer Graph Batch Analysis Method Based on Semi-supervised Learning
The invention discloses a wafer diagram batch analysis method based on semi-supervised learning, which includes the following steps: pre-processing wafer diagrams; screening wafer diagrams after pre-processing; training semi-supervised models using labeled and unlabeled wafer diagrams; screening semi-supervised models for optimization of unlabeled wafer diagrams; and wafer diagram analysis. The invention can use a small number of labeled wafer diagrams to establish a stable and efficient semi-supervised model, and can accurately complete wafer diagram analysis in actual production.
【技術實現步驟摘要】
一種基于半監督學習的晶圓圖批量分析方法
本專利技術涉及半導體制造領域,特別是涉及一種基于半監督學習的晶圓圖批量分析方法。
技術介紹
近幾年,全球半導體市場需求逐步增大,集成電路產業快速發展。在集成電路產業中,晶圓生產是制造環節中耗時最多、工藝最為復雜的一環。晶圓的良率直接影響著生產成本和企業利潤。晶圓圖能將特定的晶圓測試數據根據對應的空間位置結合晶圓的形狀展示出來。分析晶圓圖時,工程師首先將需分類的晶圓圖篩選出來,再根據晶圓圖上的不同圖形進行分類,晶圓圖上不同的圖形可以幫助工程師追溯產品生產過程中出現的異常因素,找出可能導致低良率的原因,從而采取一些預防及更正措施。上述過程非常費時且人工成本很高,因此設計一種高效自動化的晶圓圖分析方法十分必須?,F有的晶圓圖分析算法主要分為兩種:基于有監督學習的方法和基于無監督學習的方法?;谟斜O督學習的方法需要大量的有標簽晶圓圖支持模型的訓練,晶圓圖的標記同樣費時費力,當生產過程的不斷推進,晶圓圖不斷累積,為海量晶圓圖打標簽變得尤為困難?;跓o監督學習的方法雖不需要任何有標簽晶圓圖,但由于缺乏標簽的指導,預測效果必然有所削弱,難以高效準確地完成晶圓圖分析。
技術實現思路
本專利技術的目的在于針對現有技術的不足,提供一種基于半監督學習的晶圓圖批量分析方法,綜合有監督學習和無監督學習的優勢,利用有標簽晶圓圖和無標簽晶圓圖同時訓練模型。本專利技術的目的是通過以下技術方案來實現的:一種基于半監督學習的晶圓圖批量分析方法,所述方法包括下列步驟:S1、對所有方形晶圓圖進行預處理;S2、對預處理后的晶圓圖進行篩選,篩選出圖中具有連通的缺陷芯片塊,且連通區域面積分數大于閾值K的晶圓圖。連通區域面積分數為連通區域面積占晶圓圖總面積的百分數;S3、使用有標簽及無標簽晶圓圖訓練半監督模型;S301、從步驟S2篩選出的晶圓圖中,挑選若干晶圓圖中作為訓練樣本,并根據連通區域的形狀類別,對部分訓練樣本進行標記作為有標簽樣本,其余的訓練樣本為無標簽樣本;利用訓練樣本進行半監督模型訓練。S302、利用已訓練完的Ladder網絡對訓練樣本中無標簽晶圓圖進行預測,獲得對應于不同標簽的概率向量;S303、計算各晶圓圖預測結果的信息熵,公式如下:其中,H(x)表示晶圓圖x的對應信息熵;pi表示晶圓圖x被分到形狀類別i的概率;S304、按照信息熵從大到小排序,篩選出前N%個晶圓圖進行人工標記,標記后作為有標簽樣本,按照步驟S301用于半監督模型訓練優化;或篩選出倒數M%個晶圓圖,使用其預測標簽標記后,作為有標簽樣本,按照步驟S301用于半監督模型訓練優化;S305、重復步驟S304,直到半監督模型的損失函數的數值小于預設值T。S4、利用步驟S305優化后半監督模型對剩余的晶圓圖進行分析。進一步地,所述步驟S1的預處理包括:S101、晶圓圖降噪;S102、統一晶圓圖尺寸并處理成便于分析的尺寸,晶圓圖尺寸包括晶圓圖寬度及長度;進一步地,所述步驟S2的篩選通過以下方法實現:將無明顯缺陷圖形的晶圓圖標記為0,存在明顯缺陷圖形的晶圓圖標記為1,其中存在明顯缺陷圖形的晶圓圖為:圖中具有連通的缺陷芯片塊,且連通區域面積大于閾值K的晶圓圖;訓練一個基于卷積神經網絡(CNN)的二分類器。使用訓練好的二分類器從大量晶圓圖中挑選出需預測的晶圓圖,即有明顯缺陷圖案的晶圓圖。進一步地,閾值K在2.5%以上。進一步地,N=20,M=20。進一步地,損失函數用交叉熵描述,預設值T不大于0.1。本專利技術的有益效果是,本專利技術能在較少有標簽晶圓圖的指導下,充分利用無標簽晶圓圖的信息,高效準確地完成晶圓圖分析。隨著生產過程的進行,晶圓圖數量逐漸增加,篩選具有較高信息量或較高預測準確度的無標簽樣本進行進一步的標記并用于優化模型,從而得到更優的性能。附圖說明圖1是本專利技術方法的流程圖;圖2是濾波前的晶圓圖;圖3是濾波后的晶圓圖;圖4是Ladder網絡的示意圖。具體實施方式為使本專利技術的目的、技術方案和優點更加清楚,下面將結合附圖及實例,對本專利技術做出進一步詳細清楚的描述,具體涉及一種基于半監督學習的晶圓圖批量分析方法,如圖1所示,具體實施步驟如下:S1、對所有方形晶圓圖進行預處理;S101、晶圓圖降噪,使用中值濾波去噪,圖2所示為中值濾波前的晶圓圖,圖3所示為中值濾波后的晶圓圖;S102、統一晶圓圖尺寸并處理成便于分析的尺寸,晶圓圖尺寸包括晶圓圖寬度及長度;S2、對預處理后的晶圓圖進行篩選,篩選出圖中具有連通的缺陷芯片塊,且連通區域面積分數大于閾值2.5%的晶圓圖。連通區域面積分數為連通區域面積占晶圓圖總面積的百分數;S201、將無明顯缺陷圖形的晶圓圖標記為0,存在明顯缺陷圖形的晶圓圖標記為1,其中存在明顯缺陷圖形的晶圓圖為:圖中具有連通的缺陷芯片塊,且連通區域面積大于閾值2.5%的晶圓圖;訓練一個基于卷積神經網絡(CNN)的二分類器。網絡結構為輸入層-卷積層-池化層-卷積層-池化層-全連接層-全連接層-Softmax輸出層,網絡的參數如下:第1卷積層,設置特征映射圖數目為6,濾波器尺寸為5*5;第2池化層,設置下采樣尺寸為2;第3卷積層,設置特征映射圖數目為16,濾波器尺寸為5*5;第4池化層,設置下采樣尺寸為2;第5全連接層,設置特征映射圖數目為120;第6全連接層,設置特征映射圖數目為2;第7Softmax層,設置特征映射圖數目為2;S202、使用訓練好的二分類器從大量晶圓圖中挑選出需預測的晶圓圖,即有明顯缺陷圖案的晶圓圖。S3、使用有標簽及無標簽晶圓圖訓練半監督模型,如圖4中所示Ladder網絡;S301、從步驟S2篩選出的晶圓圖中,挑選若干晶圓圖中作為訓練樣本,并根據連通區域的形狀類別,對部分訓練樣本進行標記作為有標簽樣本,其余的訓練樣本為無標簽樣本;利用訓練樣本進行半監督模型訓練。根據半監督模型損失函數優化求解,Ladder網絡總損失函數如下:Ctotal=Csupervised+Cunsupervised其中,Ctotal作為總損失函數;Csupervised表示有監督誤差,由有標簽晶圓圖的預測誤差構成;Cunsupervised表示無監督誤差,由網絡各層的重構特征誤差組成;N表示輸入晶圓圖數量;tn表示輸入第n個晶圓圖xn的目標標簽;y表示晶圓圖xn的預測標簽;P表示晶圓圖xn被正確預測的概率;L表示網絡的總層數;λl表示第l層網絡無監督誤差的權重;ml表示第l層網絡的節點數;zn(l)和表示晶圓圖xn在Ladder網絡中的編碼器和解碼器第l層對應的隱層特征。Ladder網絡包括編碼器,解碼器和加噪編碼器三個部分。編碼器和加噪編碼器共享參數,編碼器公式如下:z(l)=W(l)h(l-1)h(l)=φ(γ(l)(z(l)+β(l)))h(0)=xy=z(L)其中,z(l)和h(l)是編碼器第l層對應的隱層特征;z(L)是編碼器輸出層輸出的預測結果概率向量;W(l)是編碼器第l層和第l-1層之間的權重矩陣;γ(l),β(l)是編碼器第l層的可訓練參數;編碼器網絡層為輸出層或普通網絡層時,φ(·)分別對應Softmax函數或ReLU激活函數。加噪編碼器的每層網絡都加入了高斯噪聲n(l)~N(0,σn2),公式如下:其中,是高斯噪聲分布的方差;輸入晶圓本文檔來自技高網...
【技術保護點】
1.一種基于半監督學習的晶圓圖批量分析方法,其特征在于,所述方法包括下列步驟:S1、對所有方形晶圓圖進行預處理;S2、對預處理后的晶圓圖進行篩選,篩選出圖中具有連通的缺陷芯片塊,且連通區域面積分數大于閾值K的晶圓圖。連通區域面積分數為連通區域面積占晶圓圖總面積的百分數;S3、使用有標簽及無標簽晶圓圖訓練半監督模型;S301、從步驟S2篩選出的晶圓圖中,挑選若干晶圓圖中作為訓練樣本,并根據連通區域的形狀類別,對部分訓練樣本進行標記作為有標簽樣本,其余的訓練樣本為無標簽樣本;利用訓練樣本進行半監督模型訓練。S302、利用已訓練完的Ladder網絡對訓練樣本中無標簽晶圓圖進行預測,獲得對應于不同標簽的概率向量;S303、計算各晶圓圖預測結果的信息熵,公式如下:
【技術特征摘要】
1.一種基于半監督學習的晶圓圖批量分析方法,其特征在于,所述方法包括下列步驟:S1、對所有方形晶圓圖進行預處理;S2、對預處理后的晶圓圖進行篩選,篩選出圖中具有連通的缺陷芯片塊,且連通區域面積分數大于閾值K的晶圓圖。連通區域面積分數為連通區域面積占晶圓圖總面積的百分數;S3、使用有標簽及無標簽晶圓圖訓練半監督模型;S301、從步驟S2篩選出的晶圓圖中,挑選若干晶圓圖中作為訓練樣本,并根據連通區域的形狀類別,對部分訓練樣本進行標記作為有標簽樣本,其余的訓練樣本為無標簽樣本;利用訓練樣本進行半監督模型訓練。S302、利用已訓練完的Ladder網絡對訓練樣本中無標簽晶圓圖進行預測,獲得對應于不同標簽的概率向量;S303、計算各晶圓圖預測結果的信息熵,公式如下:其中,H(x)表示晶圓圖x的對應信息熵;pi表示晶圓圖x被分到形狀類別i的概率;S304、按照信息熵從大到小排序,篩選出前N%個晶圓圖進行人工標記,標記后作為有標簽樣本,按照步驟S301用于半監督模型訓練優化;或篩選出倒數M%個晶圓圖,使用其預測標簽標記后,作為有標簽樣本,按照步驟S301用于半監督模型訓練優化;S305、重復步驟S304,...
【專利技術屬性】
技術研發人員:倪東,孔煜婷,
申請(專利權)人:浙江大學,
類型:發明
國別省市:浙江,33
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。