• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    對(duì)象分群方法、模型訓(xùn)練方法及裝置制造方法及圖紙

    技術(shù)編號(hào):15691518 閱讀:241 留言:0更新日期:2017-06-24 04:47
    本申請(qǐng)實(shí)施例公開(kāi)了對(duì)象分群方法、模型訓(xùn)練方法及裝置,以解決現(xiàn)有技術(shù)中的群劃分過(guò)程中因存在人為干預(yù)的因素,而影響最終群劃分的準(zhǔn)確性的問(wèn)題。所述對(duì)象分群方法包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的第一核心對(duì)象;確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且處于所述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的第二核心對(duì)象;將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。

    Object grouping method, model training method and device

    The embodiment of the invention discloses a method and a device for training object clustering method and model to solve the existing technology in the classification process due to factors of human intervention, and affect the final accuracy of classification problems. Including the object clustering method: according to the preset characteristic corresponding with each object sets the object to be clustering in the value of Euclidean distance between any set in the object of two objects; the set of objects in the object according to the Euclidean distance distribution in three-dimensional space; the set of objects based on the distribution of objects in the three-dimensional space, first determine the number of objects in the neighborhood of the core object within a predetermined radius is not less than the preset value; the preset radius to determine the number of objects in the neighborhood within a predetermined radius is not less than the preset value, and is the first core object within the field of the second core the object; the first object and the second core objects belonging to the same object group.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    對(duì)象分群方法、模型訓(xùn)練方法及裝置
    本申請(qǐng)涉及計(jì)算機(jī)技術(shù),特別涉及一種對(duì)象分群方法、模型訓(xùn)練方法及裝置。
    技術(shù)介紹
    目前,機(jī)器學(xué)習(xí)(MachineLearning,ML)應(yīng)用于人工智能的各個(gè)領(lǐng)域。例如:通過(guò)提取用戶的信用數(shù)據(jù)來(lái)進(jìn)行機(jī)器學(xué)習(xí),得到信用評(píng)分模型。以信用評(píng)分的應(yīng)用為例,一般是將所有用戶的信用數(shù)據(jù)來(lái)進(jìn)行機(jī)器學(xué)習(xí),得到一個(gè)統(tǒng)一的信用評(píng)分模型,并在這個(gè)統(tǒng)一的信用評(píng)分模型中完成所有用戶的信用評(píng)估。實(shí)踐證明,由于用戶群中存在不同的群體特性或人群分布,上述統(tǒng)一的信用評(píng)分模型往往很難達(dá)到令人滿意的信用評(píng)估效果。故,合理地對(duì)用戶群進(jìn)行人群劃分,并根據(jù)不同人群分別建立信用評(píng)估模型,已成為當(dāng)前信用評(píng)估過(guò)程的重要環(huán)節(jié)。現(xiàn)有技術(shù)中,一般可以利用監(jiān)督學(xué)習(xí)(SupervisedLearning)或半監(jiān)督學(xué)習(xí)(Semi-SupervisedLearning,SSL)來(lái)實(shí)現(xiàn)上述群劃分,例如:邏輯回歸(LogisticRegression)。其中,在監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)中,一般需要預(yù)先對(duì)群劃分進(jìn)行人為定義(如:預(yù)先確定群聚類(lèi)的個(gè)數(shù))。可見(jiàn),在現(xiàn)有技術(shù)中,由于在監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)的過(guò)程中,一般需要預(yù)先對(duì)群劃分進(jìn)行人為定義,使得群劃分過(guò)程中因存在人為干預(yù)的因素,而影響最終群劃分的準(zhǔn)確性。
    技術(shù)實(shí)現(xiàn)思路
    本申請(qǐng)實(shí)施例的目的是提供一種對(duì)象分群方法、模型訓(xùn)練方法及裝置,以解決現(xiàn)有技術(shù)中的群劃分過(guò)程中因存在人為干預(yù)的因素,而影響最終群劃分的準(zhǔn)確性的問(wèn)題。為解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例提供的對(duì)象分群方法、模型訓(xùn)練方法及裝置是這樣實(shí)現(xiàn)的:一種對(duì)象分群方法,包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的第一核心對(duì)象;確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且處于所述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的第二核心對(duì)象;將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。一種對(duì)象分群方法,包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的核心對(duì)象,得到由核心對(duì)象組成的核心對(duì)象集合;若所述核心對(duì)象集合中的第一核心對(duì)象處于第二核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi),將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。一種模型訓(xùn)練方法,包括:利用上述對(duì)象分群方法將待分群的對(duì)象集合中的對(duì)象進(jìn)行分群;以及根據(jù)預(yù)先確定的與分群得到的各個(gè)對(duì)象群對(duì)應(yīng)的待選取特征,提取與各個(gè)對(duì)象群中包含的對(duì)象對(duì)應(yīng)的所述待選取特征;利用提取的各個(gè)對(duì)象群中包含的對(duì)象的所述待選取特征進(jìn)行模型訓(xùn)練,得到與各個(gè)對(duì)象群對(duì)應(yīng)的模型。一種對(duì)象分群裝置,包括:第一確定單元,用于根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;分布單元,用于將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;第二確定單元,用于基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的第一核心對(duì)象;第三確定單元,用于確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且處于所述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的第二核心對(duì)象;分群?jiǎn)卧糜趯⑺龅谝缓诵膶?duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。一種對(duì)象分群裝置,包括:第一確定單元,用于根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;分布單元,用于將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;核心對(duì)象確定單元,用于基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的核心對(duì)象,得到由核心對(duì)象組成的核心對(duì)象集合;分群?jiǎn)卧糜谠谒龊诵膶?duì)象集合中的第一核心對(duì)象處于第二核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)時(shí),將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。一種模型訓(xùn)練裝置,包括:上述對(duì)象分群裝置;以及訓(xùn)練特征提取單元,用于根據(jù)預(yù)先確定的與分群得到的各個(gè)對(duì)象群對(duì)應(yīng)的待選取特征,提取與各個(gè)對(duì)象群中包含的對(duì)象對(duì)應(yīng)的所述待選取特征;模型訓(xùn)練單元,用于利用提取的各個(gè)對(duì)象群中包含的對(duì)象的所述待選取特征進(jìn)行模型訓(xùn)練,得到與各個(gè)對(duì)象群對(duì)應(yīng)的模型。由以上本申請(qǐng)各實(shí)施例提供的技術(shù)方案可見(jiàn),通過(guò)將待分群的對(duì)象集合中的各個(gè)對(duì)象按照預(yù)先確定的歐式距離在三維空間內(nèi)進(jìn)行分布,此后基于上述分布,在某個(gè)對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的對(duì)象數(shù)量(即在預(yù)設(shè)半徑的領(lǐng)域內(nèi)的對(duì)象濃度)不小于預(yù)設(shè)數(shù)值時(shí),將該對(duì)象確定為第一核心對(duì)象;隨后,繼續(xù)基于上述分布,在上述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi),確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量(即在預(yù)設(shè)半徑的領(lǐng)域內(nèi)的對(duì)象濃度)不小于預(yù)設(shè)數(shù)值的第二核心對(duì)象;最終,將確定的上述第一核心對(duì)象和第二核心對(duì)象歸屬于同一個(gè)對(duì)象群中。通過(guò)重復(fù)上述過(guò)程,可以實(shí)現(xiàn)上述待分群的對(duì)象集合中的對(duì)象的群劃分。在上述過(guò)程中,由于并不需要預(yù)先對(duì)群劃分進(jìn)行人為定義,從而避免群劃分過(guò)程受到過(guò)多人為干預(yù)因素的影響,提升群劃分的準(zhǔn)確性。附圖說(shuō)明為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請(qǐng)一實(shí)施例提供的對(duì)象分群方法的流程圖;圖2為待分群的對(duì)象集合中的各對(duì)象在三維空間內(nèi)的分布示意圖;圖3為分群得到的各對(duì)象群在三維空間內(nèi)的分布示意圖;圖4為本申請(qǐng)另一實(shí)施例提供的對(duì)象分群方法的流程圖;圖5為本申請(qǐng)一實(shí)施例提供的模型訓(xùn)練方法的流程圖;圖6為本申請(qǐng)一實(shí)施例提供的對(duì)象分群裝置的模塊示意圖;圖7為本申請(qǐng)另一實(shí)施例提供的對(duì)象分群裝置的模塊示意圖;圖8為本申請(qǐng)一實(shí)施例提供的模型訓(xùn)練裝置的模塊示意圖。具體實(shí)施方式為了使本
    的人員更好地理解本申請(qǐng)中的技術(shù)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。為解決現(xiàn)有技術(shù)的群劃分過(guò)程中的問(wèn)題,本申請(qǐng)?zhí)峁┮环N基于密度的空間聚類(lèi)算法(Density-BasedSpatialClusteringofApplicationswithNoise,DBSCAN)來(lái)實(shí)現(xiàn)群劃分。本文將以信用評(píng)分的場(chǎng)景為例對(duì)本技術(shù)方案進(jìn)行敘述。圖1為本申請(qǐng)一實(shí)施例提供的對(duì)象分群方法的流程,包括:S101:根據(jù)與待分群的對(duì)象集合Q1中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合Q1中的任意兩個(gè)對(duì)象之間的歐式距離。在信用評(píng)分的場(chǎng)景中,上述對(duì)象集合Q1可以是待分群的用本文檔來(lái)自技高網(wǎng)
    ...
    對(duì)象分群方法、模型訓(xùn)練方法及裝置

    【技術(shù)保護(hù)點(diǎn)】
    一種對(duì)象分群方法,其特征在于,包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的第一核心對(duì)象;確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且處于所述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的第二核心對(duì)象;將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。

    【技術(shù)特征摘要】
    1.一種對(duì)象分群方法,其特征在于,包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的第一核心對(duì)象;確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且處于所述第一核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi)的第二核心對(duì)象;將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群之后,還包括:將所述對(duì)象集合中未歸屬于任何一個(gè)對(duì)象群的對(duì)象確定為離群對(duì)象;確定與所述離群對(duì)象距離最近的最近對(duì)象群;將所述離群對(duì)象歸屬于所述最近對(duì)象群。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述第二核心對(duì)象,包括:確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的、且從所述第一核心對(duì)象直接密度可達(dá)或密度可達(dá)的第二核心對(duì)象。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述第一核心對(duì)象之后,還包括:判斷所述第一核心對(duì)象是否可以歸屬于已經(jīng)存在的任何一個(gè)對(duì)象群;若否,則新建一個(gè)對(duì)象群并將該第一核心對(duì)象歸屬于該新建的對(duì)象群。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述預(yù)設(shè)特征值確定所述歐式距離之前,還包括:提取與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的至少一個(gè)預(yù)設(shè)特征數(shù)據(jù);對(duì)提取的所述預(yù)設(shè)特征數(shù)據(jù)進(jìn)行歸一化處理,得到預(yù)設(shè)特征值。6.一種對(duì)象分群方法,其特征在于,包括:根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的預(yù)設(shè)特征值,確定所述對(duì)象集合中的任意兩個(gè)對(duì)象之間的歐式距離;將所述對(duì)象集合中的對(duì)象按照所述歐式距離在三維空間內(nèi)進(jìn)行分布;基于所述對(duì)象集合中的對(duì)象在所述三維空間內(nèi)的分布,確定在預(yù)設(shè)半徑的鄰域內(nèi)的對(duì)象數(shù)量不小于預(yù)設(shè)數(shù)值的核心對(duì)象,得到由核心對(duì)象組成的核心對(duì)象集合;若所述核心對(duì)象集合中的第一核心對(duì)象處于第二核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi),將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群之后,還包括:將所述對(duì)象集合中的不是核心對(duì)象的對(duì)象確定為離群對(duì)象;確定與所述離群對(duì)象距離最近的最近對(duì)象群;將所述離群對(duì)象歸屬于所述最近對(duì)象群。8.根據(jù)權(quán)利要求6所述的方法,其特征在于,若所述核心對(duì)象集合中的第一核心對(duì)象處于第二核心對(duì)象的預(yù)設(shè)半徑的領(lǐng)域內(nèi),將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群,包括:若所述核心對(duì)象集合中的第一核心對(duì)象從所述第二核心對(duì)象直接密度可達(dá)或密度可達(dá),將所述第一核心對(duì)象和所述第二核心對(duì)象歸屬于同一個(gè)對(duì)象群。9.一種模型訓(xùn)練方法,其特征在于,包括:利用所述權(quán)利要求1-8中任意一項(xiàng)所述的對(duì)象分群方法將待分群的對(duì)象集合中的對(duì)象進(jìn)行分群;根據(jù)預(yù)先確定的與分群得到的各個(gè)對(duì)象群對(duì)應(yīng)的待選取特征,提取與各個(gè)對(duì)象群中包含的對(duì)象對(duì)應(yīng)的所述待選取特征;利用提取的各個(gè)對(duì)象群中包含的對(duì)象的所述待選取特征進(jìn)行模型訓(xùn)練,得到與各個(gè)對(duì)象群對(duì)應(yīng)的模型。10.一種對(duì)象分群裝置,其特征在于,包括:第一確定單元,用于根據(jù)與待分群的對(duì)象集合中的各個(gè)對(duì)象對(duì)應(yīng)的...

    【專(zhuān)利技術(shù)屬性】
    技術(shù)研發(fā)人員:席炎王曉光隋宛辰漆遠(yuǎn)張柯姜曉燕王少萌俞吳杰施興
    申請(qǐng)(專(zhuān)利權(quán))人:阿里巴巴集團(tuán)控股有限公司
    類(lèi)型:發(fā)明
    國(guó)別省市:開(kāi)曼群島,KY

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 青春草无码精品视频在线观| 亚洲日韩av无码中文| 免费无码又黄又爽又刺激| 少妇人妻偷人精品无码视频| 久久AV无码精品人妻糸列| 国产成人无码a区在线观看视频免费 | 精品无码久久久久久久久久| 国精品无码一区二区三区在线| 无码精品A∨在线观看十八禁| 国产成人无码午夜视频在线观看| 人妻丰满熟妞av无码区| 蜜芽亚洲av无码一区二区三区 | 无码人妻久久一区二区三区蜜桃| 国产成A人亚洲精V品无码| 特黄熟妇丰满人妻无码| 亚洲一本到无码av中文字幕| 性无码专区无码片| 日日摸夜夜爽无码毛片精选 | 精品无码久久久久久国产| 亚洲av无码潮喷在线观看| 国产精品无码久久久久| 日韩电影无码A不卡| 无码射肉在线播放视频| AV无码久久久久不卡蜜桃| 亚洲综合无码一区二区三区| 亚洲精品无码国产| 国产色无码专区在线观看| 亚洲精品97久久中文字幕无码| 无码精品不卡一区二区三区| 亚洲AV无码成人精品区狼人影院 | av色欲无码人妻中文字幕| 久久久久亚洲AV片无码下载蜜桃| 亚洲精品无码成人AAA片| 国产午夜片无码区在线播放| 在线a亚洲v天堂网2019无码| 精选观看中文字幕高清无码| 国产成人无码精品久久久免费| 无码精品人妻一区二区三区影院 | julia无码人妻中文字幕在线| 国产精品无码一本二本三本色| 国产成人无码午夜视频在线观看 |