一種基于全局索引表的快速特征采集方法技術

技術編號：36694948 閱讀：39 留言：0更新日期：2023-02-27 20:05

本發明專利技術公開了一種基于全局索引表的快速特征采集方法，該方法包括如下步驟：剖析內存使用，確定可用于緩存分配的最大GPU內存量；在離線狀態下，按出度數對頂點進行預排序。并在運行時選擇高出度的頂點來填充GPU緩存；確定mini

全部詳細技術資料下載

【技術實現步驟摘要】
一種基于全局索引表的快速特征采集方法

[0001]本專利技術屬于機器學習中神經網絡算法應用領域，尤其涉及一種基于全局索引表的快速特征采集方法。

技術介紹

[0002]圖神經網絡（GNN）是針對圖這一數據結構的深度學習模型，它在多項基于圖的機器學習任務中表現出色，并且具有較高的可解釋性，近年來已成為一種廣泛應用的圖表示學習方法。GNN在廣義上是指以圖結構為輸入的所有神經網絡，其核心思想是學習一種映射，將圖結構中的節點及其鄰居節點的特征映射為該節點的低維隱特征表示。為了在GPU內存容量有限的場景下實現大規模圖神經網絡訓練，基于采樣的圖神經網絡訓練被提出。圖神經網絡采樣流程中的每一次迭代過程主要分為三個階段，即采樣、數據加載和GPU計算。
[0003]快速特征采集是指將緩存在GPU顯存上的節點特征數據進行快速查找的過程（節點特征數據是圖結構中的節點所對應的特征數據，圖結構中每個節點都有其對應的特征數據），通過快速查找訓練所需的節點特征數據來提高性能。圖神經網絡采樣流程中的快速特征采集是數據加載過程能否快速進行的關鍵。
[0004]目前在學術界對于現有的圖神經網絡系統采用的訓練算法有兩大陣營，即全批訓練和小批訓練。全批訓練的最主要代表有北京大學Ma等人提出的NeuGraph和斯坦福大學Jia等人提出的ROC。小批訓練的最主要代表有IBM研究所Chen等人提出的FastGCN和南加州大學zeng等人提出的GraphSAINT。然而，對于像Facebook友誼圖這樣的非常大的圖形，使用全批訓練對GPU內存容量的要...

【技術保護點】

【技術特征摘要】
1.一種基于全局索引表的快速特征采集方法，其特征在于，所述的基于全局索引表的快速特征采集方法包括如下步驟：步驟一、剖析內存使用，確定可用于緩存分配的最大GPU內存量；步驟二、在離線狀態下，按出度數對頂點進行預排序。并在運行時選擇高出度的頂點來填充GPU緩存；步驟三、確定mini
?
batch輸入的頂點數；步驟四、確定全局索引表中局部頂點的位置；步驟五、從GPU緩存數據中獲取輸入特征；步驟六、當前批次特征采集結束；如權利要求1所述的基于全局索引表的快速特征采集方法，其特征在于，所述的步驟一通過剖析第一個mini
?
batch訓練之后，在訓練期間檢查空閑GPU內存的大小，來確定可用于緩存分配的最大GPU內存量；如權利要求1所述的基于全局索引表的快速特征采集方法，其特征在于，步驟二所述的在離線狀態下，按出度數對頂點進行預排序。并在運行時選擇高出度的頂點來填充GPU緩存：步驟一、依據neighbor sampling算法的獨特訪問模式，頂點的出度程度表示了它在整個epoch中被選擇的概率，且頂點的出度越高，它就越有可能成為其他頂點...

【專利技術屬性】
技術研發人員：王耀彬，申超，唐蘋蘋，劉歡，楊梁，從明，陳俊仕，安虹，
申請(專利權)人：西南科技大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術