【技術實現步驟摘要】
本專利技術涉及軟件開發,尤其涉及一種人工智能的數據建模方法、裝置、介質和設備。
技術介紹
1、現有的數據建模過程中,需要用戶根據模型主題逐個補充完善模型屬性,包括屬性名稱(表字段)和屬性類型。對于同一個行業的不同項目,數據模型存在相似性和重復性,用戶需要在不同的項目之間重復建模,即重復輸入模型的各個屬性,極大地增加了開發人員的工作量,數據建模效率較低。
技術實現思路
1、有鑒于此,本專利技術實施例的目的在于提供一種人工智能的數據建模方法、裝置、介質和設備,以減少模型開發人員的工作量,提高建模效率。
2、為達到上述目的,第一方面,本專利技術提供一種人工智能的數據建模方法,所述方法包括:
3、獲取用戶輸入的目標模型屬性的名稱,根據所述目標模型屬性的名稱從歷史模型庫中篩選出與所述目標模型屬性相關的歷史模型屬性信息列表,所述歷史模型屬性信息包括字段名稱、字段代碼和數據類型;
4、提取所述歷史模型屬性信息列表中的字段名稱的單詞字典;
5、按照所述單詞字典將所述歷史模型屬性信息列表中的每個歷史模型屬性的字段名稱轉換為第一向量,將所述目標模型屬性的名稱轉換為第二向量;
6、使用余弦相似度算法計算所述第二向量與所述第一向量之間的相似度值,輸出相似度值大于預設的相似度閾值的第一向量對應的字段名稱;
7、按照輸出的所述字段名稱自動生成所述目標模型屬性的名稱對應的模型。
8、在一些可能的實施方式中,所述的提取所述歷史模型
9、將所述歷史模型屬性信息列表中的字段名稱合并為一個中文文檔;
10、提取所述中文文檔中出現的所有單詞,按照所述單詞出現的先后順序標注每個所述單詞的索引;
11、根據所述單詞和所述單詞對應的所述索引生成所述單詞字典。
12、在一些可能的實施方式中,所述單詞字典中還包括未登錄詞,所述未登錄詞是指所述目標模型屬性的名稱中未出現的詞;
13、所述未登錄詞位于所述單詞字典中末尾,按照所述單詞的索引標注所述未登錄詞的索引。
14、在一些可能的實施方式中,所述的按照所述單詞字典將所述歷史模型屬性信息列表中的每個模型屬性的字段名稱轉換為第一向量,將所述目標模型屬性的名稱轉換為第二向量,具體包括:
15、計算所述單詞字典中每個單詞和所述未登錄詞的詞頻,其中,每個所述單詞的詞頻為所述單詞在所述中文文檔中出現的次數與所述中文文檔的總字數的比值,所述未登錄詞的詞頻記為0;
16、按照單詞字典的索引和詞頻將所述字段名稱轉換為n維的第一向量;
17、按照單詞字典的索引和詞頻將所述目標模型屬性的名稱轉換為n維的第二向量;其中,n為單詞字典的單詞數加1。
18、在一些可能的實施方式中,所述余弦相似度算法的計算公式如下:
19、;
20、其中,similarity為第二向量與每個第一向量之間的相似度值;a為第二向量,b為第一向量,||a||為第二向量的模長,||b||為第一向量的模長,i表示第一向量和第二向量的維度,ai表示第二向量的第i個維度值,bi表示第一向量的第i個維度值。
21、在一些可能的實施方式中,所述的按照輸出的所述字段名稱自動生成所述目標模型屬性的名稱對應的模型,具體包括:
22、根據輸出的所述字段名稱調取與所述字段名稱對應的字段代碼和數據類型;
23、按照所述相似度值的大小對所述字段名稱進行排序后自動生成所述目標模型屬性的名稱對應的模型。
24、在一些可能的實施方式中,在所述獲取用戶輸入的目標模型屬性的名稱,根據所述目標模型屬性的名稱從歷史模型庫中篩選出與所述目標模型屬性相關的歷史模型屬性信息列表歷史模型屬性信息列表之前,還包括:
25、建立歷史模型庫;
26、將所述歷史模型庫中的每條模型屬性信息以tab鍵進行分割,將所述歷史模型屬性信息劃分為字段名稱、字段代碼和數據類型三個屬性,并以文本的形式存儲在本地磁盤中。
27、第二方面,本專利技術實施例提供了一種人工智能的數據建模裝置,所述裝置包括:
28、獲取與篩選模塊,用于獲取用戶輸入的目標模型屬性的名稱,根據所述目標模型屬性的名稱從歷史模型庫中篩選出與所述目標模型屬性相關的歷史模型屬性信息列表,所述歷史模型屬性信息包括字段名稱、字段代碼和數據類型;
29、提取模塊,用于提取所述歷史模型屬性信息列表中的字段名稱的單詞字典;
30、轉換模塊,用于按照所述單詞字典將所述歷史模型屬性信息列表中的每個歷史模型屬性的字段名稱轉換為第一向量,將所述目標模型屬性的名稱轉換為第二向量;
31、計算并輸出模塊,用于使用余弦相似度算法計算所述第二向量與所述第一向量之間的相似度值,輸出相似度值大于預設的相似度閾值的第一向量對應的字段名稱;
32、自動生成模塊,用于按照輸出的所述字段名稱自動生成所述目標模型屬性的名稱對應的模型。
33、第三方面,本專利技術實施例提供了一種電子設備,包括:
34、一個或多個處理器;
35、存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如第一方面任意一種所述的方法。
36、第四方面,本專利技術實施例提供了一種計算機可讀介質,其上存儲有計算機程序,該程序被處理器執行時實現如第一方面任意一種所述的方法。
37、上述技術方案具有如下有益效果:
38、本專利技術提供了一種人工智能的數據建模方法、裝置、介質和設備,該方法包括:獲取用戶輸入的目標模型屬性的名稱,根據目標模型屬性的名稱從歷史模型庫中篩選出與目標模型屬性相關的歷史模型屬性信息列表,模型屬性信息包括字段名稱、字段代碼和數據類型;提取歷史模型屬性信息列表中的字段名稱的單詞字典;按照單詞字典將歷史模型屬性信息列表中的每個模型屬性的字段名稱轉換為第一向量,將目標模型屬性的名稱轉換為第二向量;使用余弦相似度算法計算第二向量與第一向量之間的相似度值,輸出相似度值大于預設的相似度閾值的第一向量對應的字段名稱;按照輸出的字段名稱自動生成目標模型屬性的名稱對應的模型。本專利技術實施例通過智能推薦方法,從歷史模型庫中自動提取出相似的模型屬性列表,使用推薦的模型屬性自動生成新模型,減少模型開發人員的工作量,提高建模效率,降低建模門檻,可以一鍵生成模型,避免重復勞動。
本文檔來自技高網...【技術保護點】
1.一種人工智能的數據建模方法,其特征在于,所述方法包括:
2.根據權利要求1所述的數據建模方法,其特征在于,所述的提取所述歷史模型屬性信息列表中的字段名稱的單詞字典,具體包括:
3.根據權利要求2所述的數據建模方法,其特征在于,所述單詞字典中還包括未登錄詞,所述未登錄詞是指所述目標模型屬性的名稱中未出現的詞;
4.根據權利要求3所述的數據建模方法,其特征在于,所述的按照所述單詞字典將所述歷史模型屬性信息列表中的每個歷史模型屬性的字段名稱轉換為第一向量,將所述目標模型屬性的名稱轉換為第二向量,具體包括:
5.根據權利要求1所述的數據建模方法,其特征在于,所述余弦相似度算法的計算公式如下:;
6.根據權利要求1所述的數據建模方法,其特征在于,所述的按照輸出的所述字段名稱自動生成所述目標模型屬性的名稱對應的模型,具體包括:
7.根據權利要求2所述的數據建模方法,其特征在于,在獲取用戶輸入的目標模型屬性的名稱,根據所述目標模型屬性的名稱從歷史模型庫中篩選出與所述目標模型屬性相關的歷史模型屬性信息列表之前,還包括:<
...【技術特征摘要】
1.一種人工智能的數據建模方法,其特征在于,所述方法包括:
2.根據權利要求1所述的數據建模方法,其特征在于,所述的提取所述歷史模型屬性信息列表中的字段名稱的單詞字典,具體包括:
3.根據權利要求2所述的數據建模方法,其特征在于,所述單詞字典中還包括未登錄詞,所述未登錄詞是指所述目標模型屬性的名稱中未出現的詞;
4.根據權利要求3所述的數據建模方法,其特征在于,所述的按照所述單詞字典將所述歷史模型屬性信息列表中的每個歷史模型屬性的字段名稱轉換為第一向量,將所述目標模型屬性的名稱轉換為第二向量,具體包括:
5.根據權利要求1所述的數據建模方法,其特征在于,所述余弦相似度算...
【專利技術屬性】
技術研發人員:王建林,肖姝,賈永強,全愛巧,
申請(專利權)人:北京宇信科技集團股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。