• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種隨機強分類器的構建方法和系統技術方案

    技術編號:15691520 閱讀:83 留言:0更新日期:2017-06-24 04:47
    本發明專利技術公開了一種隨機強分類器的構建方法和系統,該方法包括以下步驟:根據預設的弱分類器個數n隨機構建n個弱分類器;在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。

    Method and system for constructing random strong classifier

    The invention discloses a construction of a random strong classifier method and system, the method comprises the following steps: according to the preset number of weak classifiers to construct n n random weak classifiers; in the original sample are randomly selected as training samples with the same number of original sample data set back; according to the preset random rate randomly selected the sample attribute in the value of training the N weak classifier to get the final prediction category n weak classifiers, a strong classifier for predicting class final prediction category each weak classifier of the voting method.

    【技術實現步驟摘要】
    一種隨機強分類器的構建方法和系統
    本專利技術涉及強分類器
    ,尤其涉及一種隨機強分類器的構建方法和系統。
    技術介紹
    決策樹是一個樹結構,其每個非葉節點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節點存放一個類別。使用決策樹進行決策的過程就是從根節點開始,測試待分類項中相應的特征屬性,并按照其值選擇輸出分支,直到到達葉子節點,將葉子節點存放的類別作為決策結果。決策樹的決策過程非常直觀,容易被人理解。目前決策樹已經成功運用于醫學、制造產業、天文學、分支生物學以及商業等諸多領域。決策樹算法有著訓練時間復雜度較低,預測的過程比較快速,模型容易展示等良好的特性;但是單個決策樹容易過擬合。目前,從現有的分類算法中找到一個好的強分類算法比較難,所以需要一種可以把若干個弱分類器整合成一個強分類器的方法,傳統的隨機森林算法是把多個決策樹組合起來,即在變量的使用和數據的使用上進行隨機化,生成很多分類樹,再匯總分類樹的結果,這種算法的弱分類器都相同,弱分類器只有決策樹,處理的方向單一效果不好。
    技術實現思路
    基于
    技術介紹
    存在的技術問題,本專利技術提出了一種隨機強分類器的構建方法和系統;本專利技術提出的一種隨機強分類器的構建方法,該方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。其中,在S3中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,具體包括:S31、根據預設隨機率隨機選取所述訓練樣本中屬性值;S32、用n個弱分類器分別對所述屬性值加噪聲干擾得到預測類別,將預測類別與訓練樣本的實際類別進行比較,得到每個屬性的重要性分數,根據所述每個屬性的重要性分數得到最終預測類別。其中,在S3中,所述用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別,具體包括:獲取所述n個弱分類器的最終預測類別中的眾數,并將所述眾數對應的最終預測類別作為強分類器的預測類別。其中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練過程是并行的,且n個弱分類器之間互不干擾。其中,還包括步驟S4,獲取測試樣本,對測試樣本進行步驟S3操作,得到強分類器的目標預測類別,將強分類器的目標預測類別與測試樣本的已知類別進行比較對強分類器進行誤差測試。一種隨機強分類器的構建系統,改系統包括:弱分類器構建模塊,用于根據預設的弱分類器個數n隨機構建n個弱分類器;訓練樣本創建模塊,用于在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;訓練模塊,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。其中,所述訓練模塊,包括屬性值獲取子模塊、預測類別獲取子模塊,屬性值獲取子模塊,用于根據預設隨機率隨機選取所述訓練樣本中屬性值;預測類別獲取子模塊,用于使用n個弱分類器分別對所述屬性值加噪聲干擾得到預測類別,將預測類別與訓練樣本的實際類別進行比較,得到每個屬性的重要性分數,根據所述每個屬性的重要性分數得到最終預測類別。其中,所述訓練模塊,具體用于:獲取所述n個弱分類器的最終預測類別中的眾數,并將所述眾數對應的最終預測類別作為強分類器的預測類別。其中,所述訓練模塊,具體用于:根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練過程是并行的,且n個弱分類器之間互不干擾。其中,還包括測試模塊,測試模塊用于獲取測試樣本,對測試樣本進行訓練模塊操作,得到強分類器的目標預測類別,將強分類器的目標預測類別與測試樣本的已知類別進行比較對強分類器進行誤差測試。本專利技術目的是提供一種對數據分類的強分類器方法,根據該方法可以在不降低分類效果的同時彌補單一弱分類器分類的不足,可以處理多維數的數據分類問題,對于多維數的分類問題可以不需要進行降維處理直接進行分類,用該方法可以得出每個屬性的重要性,在提高分類效果的基礎上還減少了時間的開銷。附圖說明圖1為本專利技術提出的一種隨機強分類器的構建方法流程圖;圖2為本專利技術提出的一種隨機強分類器的構建系統模塊示意圖;圖3為本專利技術提出的一種隨機強分類器的構建方法工作模式圖。具體實施方式參照圖1、圖3,本專利技術提出的一種隨機強分類器的構建方法,該方法包括以下步驟:步驟S1,根據預設的弱分類器個數n隨機構建n個弱分類器;本實施例中,隨機構建多個弱分類器,每個弱分類器均不相同,這些弱分類器包括SVM、決策樹、邏輯回歸分類器。步驟S2,在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;本實施例中,通過有放回的隨機選取與原始樣本個數相同的數據集,將這些數據集作為訓練樣本,供步驟S1中的n個弱分類器進行訓練。步驟S3,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別;在本步驟中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,具體包括:S31、根據預設隨機率隨機選取所述訓練樣本中屬性值;S32、用n個弱分類器分別對所述屬性值加噪聲干擾得到預測類別,將預測類別與訓練樣本的實際類別進行比較,得到每個屬性的重要性分數,根據所述每個屬性的重要性分數得到最終預測類別。在本步驟中,所述用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別,具體包括:獲取所述n個弱分類器的最終預測類別中的眾數,并將所述眾數對應的最終預測類別作為強分類器的預測類別。在本步驟中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練過程是并行的,且n個弱分類器之間互不干擾。本實施例中,通過給定的隨機率隨機的選取新樣本中屬性值,然后用這些樣本去訓練這個分類器,在每個弱分類器訓練的過程中,分別對每個屬性值加噪聲干得到預測類別,將預測類別跟已知的類別進行比較得到一個誤差,從而可以得到每個屬性的重要性分數,其中,每個分類器的訓練過程是并行進行的互不干擾的。該方法還包括步驟S4,獲取測試樣本,對測試樣本進行步驟S3操作,得到強分類器的目標預測類別,將強分類器的目標預測類別與測試樣本的已知類別進行比較對強分類器進行誤差測試。本實施例中,通過步驟S4,對強分類器進行誤差測試,測試通過強分類器得到目標預測類別與測試樣本的已知類別之間的誤差,評估強分類器的性能。一種隨機強分類器的構建系統,該系統包括:弱分類器構建模塊,用于根據預設的弱分類器個數n隨機構建n個弱分類器;本實施例中,隨機構建多個弱分類器,每個弱分類器均不相同,這些弱分類器包括SVM、決策樹、邏輯回歸分類器。訓練樣本創建模塊,用于在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;本實施例中,通過有放回的隨機選取與原始樣本個數相同的數據集,將這本文檔來自技高網...
    一種隨機強分類器的構建方法和系統

    【技術保護點】
    一種隨機強分類器的構建方法,其特征在于,所述方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。

    【技術特征摘要】
    1.一種隨機強分類器的構建方法,其特征在于,所述方法包括以下步驟:S1、根據預設的弱分類器個數n隨機構建n個弱分類器;S2、在原始樣本中有放回的隨機選取與原始樣本個數相同的數據集作為訓練樣本;S3、根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別。2.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練,得到n個弱分類器的最終預測類別,具體包括:S31、根據預設隨機率隨機選取所述訓練樣本中屬性值;S32、用n個弱分類器分別對所述屬性值加噪聲干擾得到預測類別,將預測類別與訓練樣本的實際類別進行比較,得到每個屬性的重要性分數,根據所述每個屬性的重要性分數得到最終預測類別。3.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,所述用投票法綜合每個弱分類器的最終預測類別得到強分類器的預測類別,具體包括:獲取所述n個弱分類器的最終預測類別中的眾數,并將所述眾數對應的最終預測類別作為強分類器的預測類別。4.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,在S3中,根據預設隨機率隨機選取所述訓練樣本中屬性值對所述n個弱分類器進行訓練過程是并行的,且n個弱分類器之間互不干擾。5.根據權利要求1所述的隨機強分類器的構建方法,其特征在于,還包括步驟S4,獲取測試樣本,對測試樣本進行步驟S3操作,得到強分類器的目標預測類別,將強分類器的目標預測類別與測試樣本的已知類別進行比較對強...

    【專利技術屬性】
    技術研發人員:馬陽玲楊周旺劉利剛王士瑋
    申請(專利權)人:合肥阿巴賽信息科技有限公司
    類型:發明
    國別省市:安徽,34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕精品无码一区二区| 亚洲中文字幕久久精品无码2021| 水蜜桃av无码一区二区| 精品人妻无码专区中文字幕| 一本加勒比hezyo无码专区| 亚洲av无码国产精品夜色午夜 | 国产精品午夜福利在线无码 | 性无码专区无码片| 亚洲日韩av无码中文| 国产精品无码不卡一区二区三区| 亚洲AV日韩AV永久无码下载| 精品无码久久久久久久久水蜜桃| 国产精品亚韩精品无码a在线| 日韩aⅴ人妻无码一区二区| 91精品日韩人妻无码久久不卡| 潮喷失禁大喷水aⅴ无码| 无码一区二区三区在线| 少妇人妻无码精品视频| 亚洲级αV无码毛片久久精品| 性色av无码免费一区二区三区| 99无码精品二区在线视频| 久久精品无码一区二区日韩AV| 无码少妇一区二区浪潮免费| 欧洲Av无码放荡人妇网站| 永久免费无码日韩视频| 亚洲AV无码一区二区三区鸳鸯影院| 久久久久亚洲av无码专区| 国产成人AV片无码免费| 亚洲va中文字幕无码久久不卡| 亚洲男人第一无码aⅴ网站| 特级无码a级毛片特黄| 国产精品无码一区二区在线观| 亚洲av无码专区在线观看亚| 中文字幕无码精品亚洲资源网久久 | 久久亚洲AV成人无码国产电影| 亚洲的天堂av无码| 中文字幕乱偷无码av先锋蜜桃| 无码人妻丰满熟妇区96| 亚洲中文字幕久久精品无码2021 | 无码办公室丝袜OL中文字幕| 亚洲av无码专区在线观看亚|