【技術實現步驟摘要】
本申請涉及智能醫療領域,具體涉及一種基于召回的腎癌預測方法、設備、程序產品及計算機可讀存儲介質。
技術介紹
1、腎癌是泌尿系統中常見的惡性腫瘤之一,腎癌在早期往往沒有明顯的癥狀,很多患者是在晚期才被發現,這時癌癥可能已經擴散到身體其他部位,提高早期診斷率、改善患者預后以及減少過度篩查的需求增大,目前,臨床上對于腎癌預后的評估多依賴于傳統的統計方法和醫生的經驗判斷,但腎癌預后受多種因素影響,包括病理類型、臨床分期、治療方案及患者個體特征等,傳統的統計方法存在主觀性強、準確性不足的問題。隨著人工智能技術的快速發展,特別是在自然語言處理和深度學習領域的突破,為腎癌預后的精準預測提供了新的可能。但現有的人工智能預測系統大多基于單一數據源,缺乏多源信息的綜合利用。
技術實現思路
1、針對上述問題,本專利技術提出一種基于召回的腎癌預測方法,具體包括:
2、s1、獲取臨床數據;
3、s2、將所述臨床數據輸至rag模塊中得到召回向量;所述rag模塊包括召回模塊、存儲模塊,所述召回模塊包括文本召回單元、模型召回單元,臨床數據通過所述文本召回單元將臨床數據與存儲模塊中的文本進行相似性計算得到相似文本數據,所述相似文本數據通過模型召回單元將相似文本數據輸至召回模型得到召回向量;
4、s3、將所述召回向量輸至大語言模型中進行腎癌預測得到預測結果。
5、進一步,所述召回模型的訓練過程為:
6、s101、獲取第一訓練集、第二訓練集,所述第一訓練集和第
7、s102、初始化待訓練召回模型的參數得到第一召回模型;
8、s103、復制第一召回模型的參數和模型結構得到第二召回模型;
9、s104、將所述第一訓練集輸至第二召回模型中進行訓練得到梯度更新數據;
10、s105、基于所述梯度更新數據更新第一召回模型并通過第二訓練集進行訓練得到召回模型。
11、可選地,所述梯度更新數據是第二召回模型依次進行n個任務數據訓練得到的梯度數據,第n個任務數據訓練是在第n-1任務數據訓練完成的基礎上進行訓練。
12、可選地,所述梯度更新數據是第二召回模型并列執行n個任務數據訓練得到n個梯度數據,將n個梯度數據進行梯度融合后得到梯度更新數據。
13、可選地,所述梯度融合包括下列的一種或幾種:加權求和、加和。
14、所述s105替換為:基于所述梯度更新數據和第二訓練集訓練第二召回模型得到第二梯度更新數據,獲取測試數據并通過測試數據訓練基于第二梯度更新數據更新的第一召回模型,得到召回模型。
15、所述rag模塊包括還包括向量化模塊,相似文本數據通過所述向量化模塊進行向量化轉換得到文本向量,所述文本向量通過模型召回單元將文本向量輸至召回模型得到召回向量。
16、可選地,所述召回模塊還包括向量召回單元,所述臨床數據通過向量化模塊轉換為臨床向量,所述臨床向量通過向量召回單元將臨床向量與存儲模塊中的向量進行相似性計算得到計算向量,所述計算向量通過模型召回單元將相似文本數據輸至召回模型得到召回向量。
17、可選地,所述計算向量與相似文本數據進行融合再輸至召回模型中得到召回向量。
18、可選地,所述計算向量與文本向量通融合后再輸至召回模型中得到召回向量。
19、所述召回模型包括下列的一種或幾種:卷積神經網絡、空洞卷積神經網絡、殘差網絡、transformer。
20、可選地,所述召回模型包括輸入層、隱藏層、自注意力層、前饋層、歸一化層、輸出層,輸入數據依次通過輸入層和隱藏層后得到隱藏向量,隱藏向量分別輸至自注意力層和前饋層,再將自注意力層的輸出向量、前饋層的輸出向量、隱藏向量融合后輸至歸一化層中得到召回向量,并由輸出層輸出。
21、對文本的相似度進行排序得到前l個相似文本,對向量的相似度進行排序得到前l個計算向量,將前l個相似文本與前l個計算向量融合后輸至召回模型得到召回向量,l為大于1的自然數;
22、可選地,對文本的相似度進行排序得到前三個相似文本,對向量的相似度進行排序得到前三個計算向量,將前三個相似文本與前三個計算向量融合后輸至召回模型得到召回向量。
23、所述大語言模型包括下列的一種或幾種:bert、xlnet、gpt-2、chatgpt、gpt-3、百度文心大模型、阿里通義大模型、華為盤古大模型、騰訊混元大模型。
24、可選地,所述方法還包括數據預處理,包括:數據去重、數據特殊字符處理、數據標準化。
25、可選地,所述存儲模塊包括文本存儲模塊、向量存儲模塊,其中所述文本存儲模塊中的數據通過向量化模塊中的向量模型轉換為向量并存儲得到向量存儲模塊。
26、本專利技術的目的在于提供一種計算機程序產品,其上有計算機程序或指令,包括:所述計算機程序或指令被處理器執行實現上述的基于召回的腎癌預測方法。
27、本專利技術的目的在于提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上的計算機程序或指令,所述計算機程序或指令被處理器執行實現上述的基于召回的腎癌預測方法。
28、本專利技術的目的在于提供一種計算機可讀存儲介質,其上存儲有計算機程序或指令,計算機程序或指令被處理器執行實現上述的基于召回的腎癌預測方法。
29、本專利技術的優勢:
30、1.本專利技術通過構建文本召回、向量召回、模型召回的結構對不同類型的臨床數據進行數據特征處理,提高對臨床數據特征的捕捉能力,提高模型對于重要特征的學習,提高整體模型的預測準確率和可信度。
31、2.本專利技術的召回模型基于數據類型的不同采用區別于現有的訓練策略,獨立對不同的數據進行特征提取,并將特征進行融合后才更新召回模型,避免不同數據對模型產生噪音影響,提高模型的特征提取能力,進而得到優質的特征數據。
32、3.本專利技術在進行特征提取前對文本進行相似度篩選,加快模型對于重要數據的學習,節約模型的訓練時間,具有實際應用價值。
本文檔來自技高網...【技術保護點】
1.一種基于召回的腎癌預測方法,其特征在于,包括:
2.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述召回模型的訓練過程為:
3.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述S105替換為:基于所述梯度更新數據和第二訓練集訓練第二召回模型得到第二梯度更新數據,獲取測試數據并通過測試數據訓練基于第二梯度更新數據更新的第一召回模型,得到召回模型。
4.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述rag模塊包括還包括向量化模塊,相似文本數據通過所述向量化模塊進行向量化轉換得到文本向量,所述文本向量通過模型召回單元將文本向量輸至召回模型得到召回向量;
5.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述召回模型包括下列的一種或幾種:卷積神經網絡、空洞卷積神經網絡、殘差網絡、Transformer;
6.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,對文本的相似度進行排序得到前L個相似文本,對向量的相似度進行排序得到前L個計算向量,將前L個相似文本與前L個計算向量
7.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述大語言模型包括下列的一種或幾種:BERT、XLNet、GPT-2、ChatGPT、GPT-3、百度文心大模型、阿里通義大模型、華為盤古大模型、騰訊混元大模型;
8.一種計算機程序產品,其上有計算機程序或指令,其特征在于,包括:所述計算機程序或指令被處理器執行實現權利要求1-7所述的基于召回的腎癌預測方法。
9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上的計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執行實現權利要求1-7所述的基于召回的腎癌預測方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序或指令,其特征在于,計算機程序或指令被處理器執行實現權利要求1-7所述的基于召回的腎癌預測方法。
...【技術特征摘要】
1.一種基于召回的腎癌預測方法,其特征在于,包括:
2.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述召回模型的訓練過程為:
3.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述s105替換為:基于所述梯度更新數據和第二訓練集訓練第二召回模型得到第二梯度更新數據,獲取測試數據并通過測試數據訓練基于第二梯度更新數據更新的第一召回模型,得到召回模型。
4.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述rag模塊包括還包括向量化模塊,相似文本數據通過所述向量化模塊進行向量化轉換得到文本向量,所述文本向量通過模型召回單元將文本向量輸至召回模型得到召回向量;
5.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,所述召回模型包括下列的一種或幾種:卷積神經網絡、空洞卷積神經網絡、殘差網絡、transformer;
6.根據權利要求1所述的基于召回的腎癌預測方法,其特征在于,對文本的相似度...
【專利技術屬性】
技術研發人員:龔侃,楊良志,周煜東,劉碩,張澤丹,王藝宙,劉昊德,何天一,
申請(專利權)人:北京大學第一醫院北京大學第一臨床醫學院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。