本發(fā)明專利技術(shù)涉及一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)及方法,系統(tǒng)包括服務(wù)終端和客戶前端;服務(wù)終端設(shè)置為存儲(chǔ)樣本,將樣本分發(fā)給客戶前端,接收并存儲(chǔ)客戶前端的處理結(jié)果,并根據(jù)處理結(jié)果生成統(tǒng)計(jì)展示;客戶前端設(shè)置為接收樣本,執(zhí)行修訂處理,將處理結(jié)果傳遞到服務(wù)終端。服務(wù)終端包括存儲(chǔ)模塊和統(tǒng)計(jì)模塊;客戶前端包括標(biāo)注模塊和審核模塊;標(biāo)注模塊包括預(yù)處理單元和精處理單元;審核模塊還可以設(shè)置為對(duì)修訂質(zhì)量進(jìn)行評(píng)分。本發(fā)明專利技術(shù)可以實(shí)現(xiàn)多個(gè)客戶前端同時(shí)對(duì)同一個(gè)數(shù)據(jù)集中的樣本進(jìn)行修訂,加快了樣本的修訂進(jìn)度,節(jié)省了時(shí)間成本;內(nèi)置自動(dòng)預(yù)處理單元,減少后續(xù)精處理的工作量;設(shè)立審核評(píng)分機(jī)制,既不打擊標(biāo)注者的積極性,又提升數(shù)據(jù)集樣本的可靠性。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)及方法
本專利技術(shù)涉及神經(jīng)網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)及方法。
技術(shù)介紹
神經(jīng)網(wǎng)絡(luò)是目前人工智能領(lǐng)域進(jìn)步最快、熱度最高的研究領(lǐng)域,其在搜索技術(shù)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、機(jī)器翻譯、自然語(yǔ)言處理和個(gè)性化推薦領(lǐng)域都有著廣泛應(yīng)用。其實(shí)是一個(gè)復(fù)雜的機(jī)器學(xué)習(xí)算法,通過(guò)學(xué)習(xí)海量樣本數(shù)據(jù)的內(nèi)在規(guī)律和表達(dá)層次,從而讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。隨著人工智能實(shí)際應(yīng)用范圍的增廣與應(yīng)用場(chǎng)景的深入,對(duì)深度學(xué)習(xí)模型預(yù)測(cè)準(zhǔn)確率的要求越來(lái)越高,同時(shí),隨著實(shí)際需求的逐漸明確,對(duì)深度模型輸出的結(jié)果種類或格式也有相應(yīng)變化。眾所周知,深度模型的訓(xùn)練需要依賴數(shù)萬(wàn)到數(shù)十萬(wàn)個(gè)經(jīng)過(guò)標(biāo)注的樣本,作為訓(xùn)練數(shù)據(jù)。收集和標(biāo)注如此大量的有效數(shù)據(jù),其時(shí)間成本與金錢成本都是極高的,而如上所說(shuō),需求一直在不斷變化,要滿足新的需求,就需要新的訓(xùn)練數(shù)據(jù),每次都重新收集與標(biāo)注樣本,成本顯然是無(wú)法接受的。另外,原始樣本集在標(biāo)注過(guò)程中總有或多或少的錯(cuò)誤,例如在圖像標(biāo)注樣本集中,沒(méi)有把所有人體區(qū)域標(biāo)注出來(lái),也就是漏標(biāo),或?qū)⒎侨梭w區(qū)域標(biāo)注為人體,也就是錯(cuò)標(biāo)。而訓(xùn)練樣本的質(zhì)量直接關(guān)系著最終訓(xùn)練出的模型的準(zhǔn)確率。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)的目的在于提供一種通用型神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)及方法,用以解決現(xiàn)有技術(shù)中存在的問(wèn)題。為實(shí)現(xiàn)上述目的,本專利技術(shù)公開(kāi)了一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),包括:服務(wù)終端和客戶前端;所述服務(wù)終端設(shè)置為存儲(chǔ)樣本,將所述樣本分發(fā)給所述客戶前端,接收并存儲(chǔ)所述客戶前端的處理結(jié)果,并根據(jù)所述處理結(jié)果生成統(tǒng)計(jì)展示;所述客戶前端設(shè)置為接收所述樣本,執(zhí)行修訂處理,將處理結(jié)果傳遞到所述服務(wù)終端。在一些較優(yōu)的實(shí)施例中,所述服務(wù)終端包括存儲(chǔ)模塊和統(tǒng)計(jì)模塊;所述存儲(chǔ)模塊設(shè)置為接收樣本,將其分為待修訂樣本和已修訂樣本分別存儲(chǔ);所述統(tǒng)計(jì)模塊設(shè)置為從所述存儲(chǔ)模塊加載已修訂樣本,統(tǒng)計(jì)樣本特征信息,并生成分析報(bào)告。在一些較優(yōu)的實(shí)施例中,所述客戶前端包括標(biāo)注模塊和審核模塊;所述標(biāo)注模塊設(shè)置為從所述存儲(chǔ)模塊加載待修訂樣本,預(yù)處理后進(jìn)行標(biāo)注,得到第一樣本,將所述第一樣本傳遞給所述審核模塊;所述審核模塊設(shè)置為接收所述第一樣本,審核標(biāo)注是否合格,若是,將所述第一樣本作為已修訂樣本傳遞給所述服務(wù)終端,若否,向所述標(biāo)注模塊傳遞審核意見(jiàn),并將所述第一樣本作為待修訂樣本傳遞給所述標(biāo)注模塊。在一些較優(yōu)的實(shí)施例中,所述標(biāo)注模塊包括預(yù)處理單元和精處理單元;所述預(yù)處理單元設(shè)置為從所述存儲(chǔ)模塊加載待修訂樣本,根據(jù)其修訂需求選擇匹配的預(yù)處理算法進(jìn)行預(yù)處理,得到第二樣本,將所述第二樣本傳遞給所述精確標(biāo)注單元;所述精處理單元設(shè)置為接收所述第二樣本進(jìn)行精確處理,得到所述第一樣本,將所述第一樣本傳遞給所述審核模塊。在一些較優(yōu)的實(shí)施例中,所述審核模塊還可以設(shè)置為對(duì)已修訂樣本的修訂質(zhì)量進(jìn)行評(píng)分。在一些較優(yōu)的實(shí)施例中,所述服務(wù)終端還包括展示模塊;所述展示模塊設(shè)置為從所述統(tǒng)計(jì)模塊加載分析報(bào)告并展示。本專利技術(shù)還公開(kāi)了一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂方法,包括以下步驟:步驟S1.標(biāo)注客戶前端從服務(wù)終端的存儲(chǔ)模塊加載待修訂樣本,標(biāo)注后作為第一樣本傳遞給審核客戶前端;步驟S2.所述審核客戶前端對(duì)所述第一樣本的標(biāo)注結(jié)果進(jìn)行審核,若審核合格,則將樣本存儲(chǔ)到服務(wù)器存儲(chǔ)模塊;若審核不合格,將所述第一樣本作為待修訂樣本傳遞給所述標(biāo)注客戶前端并反饋審核意見(jiàn);步驟S3.統(tǒng)計(jì)模塊從所述存儲(chǔ)模塊加載已修訂樣本,統(tǒng)計(jì)樣本特征信息,并生成分析報(bào)告。進(jìn)一步的是,步驟S1中所述標(biāo)注的具體方法為:從所述存儲(chǔ)模塊加載待修訂樣本,根據(jù)其修訂需求選擇匹配的預(yù)處理算法進(jìn)行預(yù)處理,得到第二樣本,然后對(duì)所述第二樣本進(jìn)行精確標(biāo)注,得到所述第一樣本。進(jìn)一步的是,步驟S2所述審核還包括:對(duì)已修訂樣本的修訂質(zhì)量進(jìn)行評(píng)分。進(jìn)一步的是,步驟S3還包括:將所述分析報(bào)告?zhèn)鬟f給展示模塊進(jìn)行展示。本專利技術(shù)與現(xiàn)有的技術(shù)相比,其有益的特點(diǎn)是:1、多個(gè)客戶前端可同時(shí)對(duì)同一個(gè)數(shù)據(jù)集中的樣本進(jìn)行修訂,大大加快了樣本的修訂進(jìn)度,節(jié)省了時(shí)間成本;2、內(nèi)置的自動(dòng)預(yù)處理單元,可以減少后續(xù)精處理的工作量,特別是精處理為人工標(biāo)注時(shí),該單元可以大大的降低人工工作量,進(jìn)一步的節(jié)約時(shí)間成本;3、通過(guò)提供易用的圖形界面控件,提高了客戶前端的修訂效率;4、通過(guò)有效的審核反饋機(jī)制,幫助人工標(biāo)注者更快地明確標(biāo)注問(wèn)題,提升標(biāo)注質(zhì)量;5、通過(guò)設(shè)立審核評(píng)分機(jī)制,既不打擊人工標(biāo)注者的積極性,又能提升數(shù)據(jù)集中樣本的可靠性;6、通過(guò)統(tǒng)計(jì)模塊生成分析報(bào)告并展示出來(lái),可以讓管理者更好的掌控修訂進(jìn)度。附圖說(shuō)明圖1為本專利技術(shù)一種較優(yōu)實(shí)施例中一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)的結(jié)構(gòu)圖;圖2為本專利技術(shù)一種較優(yōu)實(shí)施例中標(biāo)注模塊的結(jié)構(gòu)圖;圖3為本專利技術(shù)一種較優(yōu)實(shí)施例中服務(wù)終端的結(jié)構(gòu)圖;圖4為本專利技術(shù)一種較優(yōu)實(shí)施例中一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂方法的流程圖;圖5為本專利技術(shù)一種較優(yōu)實(shí)施例中統(tǒng)計(jì)模塊生成的分析報(bào)告示意圖;圖6為本專利技術(shù)一種較優(yōu)實(shí)施例中精處理單元提供的圖形界面和操作控件示意圖;具體實(shí)施方式為了使本專利技術(shù)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對(duì)本專利技術(shù)作進(jìn)一步闡述。在本專利技術(shù)的描述中,需要理解的是,術(shù)語(yǔ)“上”、“下”、“前”、“后”、“左”、“右”、“頂”、“底”、“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本專利技術(shù)和簡(jiǎn)化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對(duì)本專利技術(shù)的限制。如圖1所示,是本專利技術(shù)提供的一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng)的結(jié)構(gòu)圖,包括:服務(wù)終端和客戶前端。所述服務(wù)終端設(shè)置為存儲(chǔ)樣本,將所述樣本分發(fā)給所述客戶前端,接收并存儲(chǔ)所述客戶前端的處理結(jié)果,并根據(jù)所述處理結(jié)果生成統(tǒng)計(jì)展示;所述客戶前端設(shè)置為接收所述樣本,執(zhí)行修訂處理,將處理結(jié)果傳遞到所述服務(wù)終端。其中,所述服務(wù)終端可以是云端或本地服務(wù)器,所述客戶前端可以是通過(guò)網(wǎng)線或無(wú)線信號(hào)與服務(wù)終端連接,也可以是與本地服務(wù)終端共處同一個(gè)局域網(wǎng)。本專利技術(shù)所述樣本是神經(jīng)網(wǎng)絡(luò)模型所需處理對(duì)象的樣本數(shù)據(jù),根據(jù)處理對(duì)象的不同,樣本類別也不相同。例如,用于圖像分割的樣本為圖像數(shù)據(jù),用于語(yǔ)音識(shí)別的樣本為語(yǔ)音數(shù)據(jù),用于信息分析的樣本為信息數(shù)據(jù)。本專利技術(shù)所公開(kāi)的樣本處理系統(tǒng)對(duì)于各類樣本均可進(jìn)行處理,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知曉,各類型樣本的處理流程共同點(diǎn)在于對(duì)樣本的特征進(jìn)行標(biāo)注修訂,例如用于人像分割的樣本需要標(biāo)注人物和背景,用于目標(biāo)人物語(yǔ)音識(shí)別的樣本需要標(biāo)注目標(biāo)人物語(yǔ)音和背景雜音,用于天氣預(yù)測(cè)的樣本需要標(biāo)注影響天氣變化的要素和失真要素。而樣本的具體標(biāo)注方法不是本專利技術(shù)的重點(diǎn),可以采用本領(lǐng)域常用的標(biāo)注方法。基于同樣的專利技術(shù)構(gòu)思,本申請(qǐng)的技術(shù)方案還可以應(yīng)用于語(yǔ)本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),其特征在于,包括:服務(wù)終端和客戶前端;/n所述服務(wù)終端設(shè)置為存儲(chǔ)樣本,將所述樣本分發(fā)給所述客戶前端,接收并存儲(chǔ)所述客戶前端的處理結(jié)果,并根據(jù)所述處理結(jié)果生成統(tǒng)計(jì)展示;/n所述客戶前端設(shè)置為接收所述樣本,執(zhí)行修訂處理,將處理結(jié)果傳遞到所述服務(wù)終端。/n
【技術(shù)特征摘要】
1.一種神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),其特征在于,包括:服務(wù)終端和客戶前端;
所述服務(wù)終端設(shè)置為存儲(chǔ)樣本,將所述樣本分發(fā)給所述客戶前端,接收并存儲(chǔ)所述客戶前端的處理結(jié)果,并根據(jù)所述處理結(jié)果生成統(tǒng)計(jì)展示;
所述客戶前端設(shè)置為接收所述樣本,執(zhí)行修訂處理,將處理結(jié)果傳遞到所述服務(wù)終端。
2.如權(quán)利要求1所述的神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),其特征在于:所述服務(wù)終端包括存儲(chǔ)模塊和統(tǒng)計(jì)模塊;
所述存儲(chǔ)模塊設(shè)置為接收樣本,將其分為待修訂樣本和已修訂樣本分別存儲(chǔ);
所述統(tǒng)計(jì)模塊設(shè)置為從所述存儲(chǔ)模塊加載已修訂樣本,統(tǒng)計(jì)樣本特征信息,并生成分析報(bào)告。
3.如權(quán)利要求1所述的神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),其特征在于:所述客戶前端包括標(biāo)注模塊和審核模塊;
所述標(biāo)注模塊設(shè)置為從所述存儲(chǔ)模塊加載待修訂樣本,預(yù)處理后進(jìn)行標(biāo)注,得到第一樣本,將所述第一樣本傳遞給所述審核模塊;
所述審核模塊設(shè)置為接收所述第一樣本,審核標(biāo)注是否合格,若是,將所述第一樣本作為已修訂樣本傳遞給所述服務(wù)終端,若否,向所述標(biāo)注模塊傳遞審核意見(jiàn),并將所述第一樣本作為待修訂樣本傳遞給所述標(biāo)注模塊。
4.如權(quán)利要求3所述的神經(jīng)網(wǎng)絡(luò)訓(xùn)練用樣本的修訂系統(tǒng),其特征在于:所述標(biāo)注模塊包括預(yù)處理單元和精處理單元;
所述預(yù)處理單元設(shè)置為從所述存儲(chǔ)模塊加載待修訂樣本,根據(jù)其修訂需求選擇匹配的預(yù)處理算法進(jìn)行預(yù)處理,得到第二樣本,將所述第二樣本傳遞給所述精確標(biāo)注單元;
所述精處理單元設(shè)置為接收所述第二樣本進(jìn)行精確處理,得到所述第...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張靖淇,徐瀅,
申請(qǐng)(專利權(quán))人:成都品果科技有限公司,
類型:發(fā)明
國(guó)別省市:四川;51
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。