• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于特征值進行前列腺癌復發預測的系統和方法技術方案

    技術編號:15501098 閱讀:68 留言:0更新日期:2017-06-03 22:37
    本發明專利技術涉及一種前列腺癌復發預測的系統和方法,包括醫生工作站和服務器,醫生工作站用于接收輸入信息和顯示預測結果;服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、前列腺癌復發預測器。信息獲取模塊獲取訓練集合;預處理模塊提取特征信息,對特征信息進行預處理,生成特征詞集合,并為特征詞生成特征值;模型訓練模塊訓練聚類分析模型,得到前列腺癌復發預測器;信息接收模塊接收用戶輸入信息,并將信息傳輸到預處理模塊;經過訓練的前列腺癌復發預測器根據用戶輸入信息的特征值,得到前列腺癌復發的預測結果。本方法解決了現有方法耗費人力、且依賴醫生主觀判斷,缺乏統一標準,容易造成誤診的問題。

    A system and method for predicting prostate cancer recurrence based on eigenvalues

    The invention relates to a system and a method for predicting prostate cancer recurrence, including doctor workstation and server, workstation for receiving the input information and display the prediction results; the server comprises an information acquisition module, preprocessing module, model training module, information receiving module, the predictor of prostate cancer recurrence. The information acquisition module acquires the training set; preprocessing module of feature information extraction, feature information preprocessing, feature generation word sets, and features of word generation characteristic value; model training module training model of cluster analysis, get the predictor of prostate cancer recurrence; information receiving module receives the user input information, and transmit information to the pretreatment module; prostate cancer recurrence after predictor training according to the characteristics of user input information, get the forecasting result of prostate cancer recurrence. The method solves the problems that the existing method consumes manpower, relies on subjective judgment of doctors, lacks uniform standards and is easy to cause misdiagnosis.

    【技術實現步驟摘要】
    一種基于特征值進行前列腺癌復發預測的系統和方法
    本專利技術涉及疾病預測的
    ,尤其涉及一種基于特征值進行前列腺癌復發預測的系統和方法。
    技術介紹
    目前,正處于大數據時代,各行各業都有大規模的數據量,現有技術中的簡單規則處理難以發揮這些數據的價值。硬件的高速發展給大數據的分析和應用提供了條件。高性能計算使得基于大規模數據的數據學習時間和數據處理代價大大降低了;大規模數據存儲,使得能夠更快、代價更小地處理大規模數據。由于硬件和算法的發展,使得在使用機器學習解決數據分析的問題后,能獲得更加豐厚收益。現有的機器學習技術主要運用到新聞、電子商務等互聯網領域,在傳統領域,尤其是醫學領域的應用十分匱乏。因此,本專利技術提供一種將機器學習方法運用到醫學領域中,進行前列腺癌復發的預測,以彌補現有技術中,前列腺癌復發的預測主要依賴醫生的主觀判斷,判斷的準確性取決于醫生的主觀經驗,不同的醫生對患者病情的判斷結果可能回不一致,這容易導致誤診,甚至可能會延誤患者病情的問題。
    技術實現思路
    鑒于上述的分析,本專利技術旨在提供一種基于特征值進行前列腺癌復發預測的系統和方法,用以解決現有方法耗費人力、且依賴醫生主觀判斷,缺乏統一標準,容易造成誤診的問題。本專利技術的目的主要是通過以下技術方案實現的:提供一種基于特征值進行前列腺癌復發預測的系統,包括醫生工作站和服務器。醫生工作站用于接收輸入信息和顯示預測結果。服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、前列腺癌復發預測器。信息獲取模塊,用于獲取前列腺癌病例的電子數據,從中獲得訓練集合;預處理模塊,用于提取訓練集合中的每個病例的特征信息,對提取的特征信息進行預處理,生成訓練用特征詞集合,并為集合中的特征詞生成對應的特征值,將特征值輸入到模型訓練模塊;預處理模塊還用于對用戶輸入信息進行特征信息提取、預處理和生成特征值的處理,并將該特征值輸入到經過訓練的前列腺癌復發預測器。模型訓練模塊,用于利用特征值訓練聚類分析模型,得到前列腺癌復發預測器;信息接收模塊,用于接收用戶通過醫生工作站輸入的信息,并將接收的信息傳輸到預處理模塊;經過訓練的前列腺癌復發預測器根據預處理模塊處理用戶輸入信息得到的特征值,得到前列腺癌復發的預測結果,并輸出到醫生工作站。其中,預處理模塊中提取的特征信息包括:前列腺癌的術前psa,術前fpsa,腫瘤級別、淋巴轉移、骨轉移、評分、是否生化復發。預處理模塊中的預處理包括:對提取的特征信息進行分詞;對噪聲詞進行剔除處理。進一步的,在分詞和噪聲詞剔除處理之后,還包括對特征詞集合中的同義詞進行替換。進一步的,預處理模塊還包括對訓練用特征詞集合中的特征詞進行特征選擇的過程。優選的,預處理模塊采用Hash算法為特征詞生成對應的特征值,或者基于預先建立賦值表給特征詞生成對應的特征值。優選的,系統中的聚類分析模型基于K-means算法。進一步的,服務器還包括測試模塊,用于對經過訓練的前列腺癌復發預測器進行測試。在前列腺癌復發預測器的測試結果不理想的情況下,更改聚類分析算法或更改特征選擇的數量,以對前列腺癌復發預測器進行調整;基于重新獲得的前列腺癌復發預測器,再進行測試;通過不斷調整前列腺癌復發預測器,不斷重新測試,直到測試結果達標。本專利技術還提供一種基于特征值進行前列腺癌復發預測的方法,包括以下步驟:步驟S1.獲取前列腺癌病例的電子數據,從電子數據獲得用于預測前列腺癌復發用的訓練集合;步驟S2.提取訓練集合中的每個病例的特征信息;步驟S3.對提取的特征信息進行預處理,生成訓練用特征詞集合;步驟S4.為訓練用特征詞集合中的特征詞生成對應的特征值;步驟S5.利用上一步生成的特征值,訓練聚類分析模型,得到前列腺癌復發預測器;步驟S6.接收用戶輸入的、對前列腺癌的描述信息;步驟S7.對用戶的輸入信息進行特征信息提取、預處理和生成特征值的處理,處理方法同步驟S2~S4,得到待預測信息的特征值;步驟S8.前列腺癌復發預測器根據待預測信息的特征值,得到前列腺癌復發的預測結果。本專利技術有益效果如下:通過構建前列腺癌復發預測器,節約人工對數據進行分析的成本,直接通過計算機程序進行前列腺癌復發預測,得到相應的預測結果;在應對海量數據的情況下,采用本專利技術能大幅降低人工成本,提高標準化程度,減少醫生主觀意見對預測結果的影響,以此預測結果給醫生的診斷提供參考,更加有利于疾病診斷的準確性。本專利技術的其他特征和優點將在隨后的說明書中闡述,并且,部分的從說明書中變得顯而易見,或者通過實施本專利技術而了解。本專利技術的目的和其他優點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。附圖說明附圖僅用于示出具體實施例的目的,而并不認為是對本專利技術的限制,在整個附圖中,相同的參考符號表示相同的部件。圖1為前列腺癌復發預測系統的示意圖;圖2為前列腺癌復發預測方法的流程圖。具體實施方式下面結合附圖來具體描述本專利技術的優選實施例,其中,附圖構成本申請一部分,并與本專利技術的實施例一起用于闡釋本專利技術的原理。本專利技術的一個具體實施例,公開了一種基于特征值進行前列腺癌復發預測的系統,如圖1所示,包括醫生工作站和服務器。醫生工作站用于接收輸入信息和顯示預測結果;服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、前列腺癌復發預測器。信息獲取模塊,用于獲取前列腺癌病例的電子數據,從電子數據獲得用于預測前列腺癌復發用的訓練集合,并存儲到存儲單元。所述電子數據來源于過往紙質病歷的電子化文本、現有電子病歷和醫院內部的統計文本。具體地,從電子數據獲得訓練集合具體是:將電子數據劃分為訓練集合和測試集合。測試集合用于在得到前列腺癌復發預測器后,進行預測器準確性的測試實驗。預處理模塊,用于提取訓練集合中的每個病例的特征信息,對提取的特征信息進行預處理,生成訓練用特征詞集合,并為集合中的特征詞生成對應的特征值,將特征值輸入到模型訓練模塊;預處理模塊還用于對用戶輸入信息進行特征信息提取、預處理和生成特征值的處理,并將該特征值輸入到經過訓練的前列腺癌復發預測器。其中,具體提取的特征信息包括:病例中前列腺癌的術前psa(Prostate-SpecificAntigen,前腺癌的特異性標志物),術前fpsa,腫瘤級別、淋巴轉移、骨轉移、評分、是否生化復發等內容的特征信息。優選的,在提取電子數據中的每個病例對應的前列腺癌信息之后,還去除不符合要求的問題數據,例如空值、明顯有問題的數據、不符合邏輯的數據等。預處理模塊中,對特征信息進行的預處理是將提取的特征信息解析成詞條,其中每一個病例對應多個詞條。上述詞條可以是詞匯、短語、句子、數值和數值范圍。優選的,預處理具體包括分詞、噪聲詞剔除、同義詞處理等操作,具體為:1.使用分詞工具對提取的特征信息中的信息進行分詞,獲得文本詞集。如果文本是中文,則采用中文分詞器;如果是英文,則使用空格進行分詞,且在英文分詞完成后使用詞干提取的方式歸一化時態和單復數。2.對分詞結果進行噪聲詞剔除處理,具體包括去除沒有實際意義的字或詞,如“的、了、不但、而且、雖然、但是”等,以及一些生僻字和特殊符號,并去除與要提取的信息無關的詞匯。優選的,噪聲詞剔除處理可以通過建立噪聲詞表的方式進行匹配和剔除。3.使用預先建立的同義本文檔來自技高網...
    一種基于特征值進行前列腺癌復發預測的系統和方法

    【技術保護點】
    一種基于特征值進行前列腺癌復發預測的系統,其特征在于,包括醫生工作站和服務器,醫生工作站用于接收輸入信息和顯示預測結果;服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、前列腺癌復發預測器;信息獲取模塊獲取前列腺癌病例的電子數據,從中獲得訓練集合;預處理模塊提取訓練集合中的每個病例的特征信息,對提取的特征信息進行預處理,生成訓練用特征詞集合,并為集合中的特征詞生成對應的特征值,將特征值輸入到模型訓練模塊;預處理模塊還用于對用戶輸入信息進行特征信息提取、預處理和生成特征值的處理,并將該特征值輸入到經過訓練的前列腺癌復發預測器;模型訓練模塊利用特征值,訓練聚類分析模型,得到前列腺癌復發預測器;信息接收模塊接收用戶通過醫生工作站輸入的信息,并將接收的信息傳輸到預處理模塊;經過訓練的前列腺癌復發預測器根據預處理模塊處理用戶輸入信息得到的特征值,得到前列腺癌復發的預測結果,并輸出到醫生工作站。

    【技術特征摘要】
    1.一種基于特征值進行前列腺癌復發預測的系統,其特征在于,包括醫生工作站和服務器,醫生工作站用于接收輸入信息和顯示預測結果;服務器包括信息獲取模塊、預處理模塊、模型訓練模塊、信息接收模塊、前列腺癌復發預測器;信息獲取模塊獲取前列腺癌病例的電子數據,從中獲得訓練集合;預處理模塊提取訓練集合中的每個病例的特征信息,對提取的特征信息進行預處理,生成訓練用特征詞集合,并為集合中的特征詞生成對應的特征值,將特征值輸入到模型訓練模塊;預處理模塊還用于對用戶輸入信息進行特征信息提取、預處理和生成特征值的處理,并將該特征值輸入到經過訓練的前列腺癌復發預測器;模型訓練模塊利用特征值,訓練聚類分析模型,得到前列腺癌復發預測器;信息接收模塊接收用戶通過醫生工作站輸入的信息,并將接收的信息傳輸到預處理模塊;經過訓練的前列腺癌復發預測器根據預處理模塊處理用戶輸入信息得到的特征值,得到前列腺癌復發的預測結果,并輸出到醫生工作站。2.根據權利要求1所述的基于特征值進行前列腺癌復發預測的系統,其特征在于,所述預處理模塊中提取的特征信息包括:前列腺癌的術前psa,術前fpsa,腫瘤級別、淋巴轉移、骨轉移、評分、是否生化復發。3.根據權利要求1所述的基于特征值進行前列腺癌復發預測的系統,其特征在于,所述預處理模塊中的預處理包括:對提取的特征信息進行分詞;對噪聲詞進行剔除處理。4.根據權利要求3所述的基于特征值進行前列腺癌復發預測的系統,其特征在于,在分詞和噪聲詞剔除處理之后,還包括對特征詞集合中的同義詞進行替換。5.根據權利要求1或3或4所述的基于特征值進行前列腺癌復發預測的系統,其特征在于,預處理模塊還包括對訓練用特征詞...

    【專利技術屬性】
    技術研發人員:榮小輝張洋高彥回劉為
    申請(專利權)人:思派北京網絡科技有限公司
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 成人无码区免费A∨直播| 超清无码无卡中文字幕| 亚洲av永久无码| 亚洲精品无码少妇30P| 亚洲一级特黄大片无码毛片| 国产精品无码无需播放器| 在线观看无码AV网址| 丰满少妇人妻无码| 国产精品无码一区二区在线观| 亚洲成AV人在线播放无码 | 中文字幕精品三区无码亚洲| 性色AV一区二区三区无码| 久久亚洲精品无码VA大香大香| 九九久久精品无码专区| 无码av大香线蕉伊人久久| 精品无码国产一区二区三区AV| 中文成人无码精品久久久不卡 | 无码av不卡一区二区三区| 亚洲日韩国产AV无码无码精品| 亚洲中文字幕无码不卡电影 | 无码AV岛国片在线播放| 国产成人无码一区二区在线播放| 无码av专区丝袜专区| 亚洲日韩中文字幕无码一区| 人妻少妇伦在线无码专区视频| 日韩精品无码一区二区三区AV | 人妻少妇偷人精品无码| 十八禁无码免费网站| 无码国产伦一区二区三区视频| 亚洲男人在线无码视频| 亚洲?v无码国产在丝袜线观看| 无码人妻丰满熟妇区毛片18| 精品无码久久久久久国产| 亚洲欧洲AV无码专区| 激情射精爆插热吻无码视频| 久久久久无码精品国产app| 精品无码中出一区二区| 亚洲综合最新无码专区| 国产成人亚洲综合无码精品| 免费无码毛片一区二区APP| 91精品无码久久久久久五月天|