• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>中南大學專利>正文

    一種基于先驗知識和網絡拓撲特性的關鍵蛋白預測方法技術

    技術編號:8366870 閱讀:207 留言:0更新日期:2013-02-28 05:45
    本發明專利技術公開了一種基于先驗知識和網絡拓撲特性的關鍵蛋白預測方法。基于對已知關鍵蛋白之間拓撲關系的分析發現關鍵蛋白之間聯系緊密,將邊聚集系數作為評估兩個關鍵蛋白緊密程度的參數,并利用部分已知關鍵蛋白,以及其鄰居節點與這些已知關鍵蛋白之間的共簇系數來預測新的關鍵蛋白。本發明專利技術實現簡單,只需根據PPI信息和部分已知關鍵蛋白信息就能夠較準確地預測未知關鍵蛋白,既能用于非加權PPI網絡,也能用于加權PPI網絡,解決了化學實驗方法成本昂貴、耗時等問題。

    【技術實現步驟摘要】

    本專利技術涉及基于網絡水平的關鍵蛋白預測領域,特別是一種基于部分已知關鍵蛋白和生物網絡拓撲特性預測新關鍵蛋白的方法。
    技術介紹
    蛋白質是構成一切細胞和組織結構必不可少的成分,它是生理功能的執行者,也是生命現象的體現者。不同的蛋白執行不同的生理功能。其中,存在一部分蛋白,通過基因剔除式突變將其移除后會造成有關蛋白質復合物功能喪失,并導致生物體無法生存,這類蛋白被稱為關鍵蛋白。有效的預測關鍵蛋白對研究細胞的生長調控過程具有重要意義,對病原生物學的研究以及藥物設計同樣也具有重要價值。在生物學領域,一般利用基因敲除、RNA干擾等實驗方法,通過觀察生物體是否能 正常生存來辨別一個蛋白是否是關鍵的。依靠生物實驗預測關鍵蛋白的方法雖然準確有效,但是成本高且效率低。近年來,隨著酵母雙雜交、串聯親和純化、質譜分析等高通量的蛋白組技術的發展,可獲得的蛋白相互作用(protein-protein interaction, PPI)數據越來越多,為從網絡水平上預測關鍵蛋白提供了條件。研究表明,一個蛋白的關鍵性與它在生物網絡中所對應節點的拓撲特性密切相關。Jeong等人在2001年Nature上發表的文章中提出“中心性-致死性”法則(centrality-lethality rule),該法則表明一個蛋白參與的相互作用越多,這個蛋白對細胞的生存也就越重要。近年來,出現了一系列網絡中心性預測方法,典型的中心性測度有度中心性(degree centrality, DC),介數中心性(betweenness centrality, BC),接近度中心性(closeness centrality, CC),子圖中心性(subgraph centrality, SC),特征向量中心性(eigenvector centrality, EC)和信息中心性(information centrality, IC)等。節點的度中心性DC定義為網絡中與該節點直接相連節點的個數。節點的介數中心性BC表示網絡中所有最短路徑中經過該節點的數目占所有最短路徑數的比例。節點的接近度中心性CC為反比于該節點到網絡中其它所有節點的最短路徑之和。節點的子圖中心性SC是該節點參與網絡閉合回路的總數。節點的特征向量中心性EC被定義為網絡鄰接矩陣的主特征向量該節點的分量。節點的信息中心性IC是測量以該節點為端點的路徑的調和平均長度。除了這六種經典的中心性測度,還有一些基于其他拓撲特性的預測關鍵蛋白質的方法,比如瓶頸(Bottle Neck, BN)和最大稠密鄰居子圖(Density ofMaximumNeighborhood Component, DMNC)等。瓶頸法將網絡中所有節點分別作為根節點建立最短路徑樹集合。對于以節點V為根節點的最短路徑樹Tv,定義Tv中節點w的權重為其子孫節點的個數,若節點w的權重小于等于η/4(η是Tv的節點數目),則w節點被定義為瓶頸節點。BN(w)為節點w作為瓶頸節點出現在最短路徑樹集合中的次數。最大稠密鄰居子圖針對每個節點u的鄰居節點構建鄰居子網絡N(u),DMNC(u)為EN%其中E為子網絡N(U)中邊的條數,N為節點的個數,調和系數e —般設定為I. 7。已有大量研究表明,任何一種中心性測度的預測結果都遠遠好于隨機選擇的結果,這說明蛋白的關鍵性與其對應節點的拓撲中心性存在較為顯著的相關性。雖然對基于PPI網絡拓撲特性的關鍵蛋白預測方法的研究已經有了較大進展,但是預測的準確度依然存在很大的提升空間。考慮到目前每個物種都存在一定數量的已知關鍵蛋白,例如DEG數據庫搜集了多個物種的關鍵蛋白信息,如表I所示,是否可以利用部分已知的關鍵蛋白和PPI網絡的拓撲特性進一步提高關鍵蛋白預測的準確性是一項非常有意義的探索。表IDEG數據庫中一些物種的已知關鍵蛋白數目Organism(Prokaryotes)Essential genes Organism(Eukaryotes)Essential genesAcinetobacter baylyi ADPl499Arabidopsis thaliana356 Bacillus subtilis168Aspergillus fumigatus 35Escherichia coli MG1655712Caenorhabditis elegans 294Francisella novicida U112392Danio rerio288Haemophilus influenzae Rd KW20 642Drosophila melanogaster 339Helicobacter pylori26695323Homo sapiens118Mycobacterium tuberculosis H37Rv 614Mus musculus2114Mycoplasma genitalium G37381Saccharomyces cerevisiae 1110
    技術實現思路
    本專利技術所要解決的技術問題是,針對現有技術不足,提供一種實現簡單的基于先驗知識和網絡拓撲特性的關鍵蛋白預測方法,利用部分已知關鍵蛋白信息,通過評估其他蛋白與這些已知關鍵蛋白在拓撲上的密切程度來預測其他蛋白的關鍵性,解決化學實驗方法成本昂貴和耗時等問題,提高關鍵蛋白預測準確度。為解決上述技術問題,本專利技術所采用的技術方案是,只需根據PPI信息和部分已知關鍵蛋白信息就能夠較準確地預測未知關鍵蛋白,既能用于非加權PPI網絡,也能用于加權PPI網絡,該方法的步驟為I)輸入蛋白相互作用/[目息,用k表不已知的關鍵蛋白節點,η表不PPI網絡中關鍵蛋白的數量(k個已知關鍵蛋白加上預測出來的關鍵蛋白);2)根據蛋白相互作用信息構建無向圖G :輸入一組蛋白相互作用信息,過濾其中重復的相互作用和自相互作用,構建無向圖G;其中G=(V,E),V代表蛋白節點集合,E代表蛋白相互作用集合;3)生成初始的關鍵蛋白候選集合Nk :用候選關鍵節點集合P存儲預測的關鍵蛋白質,初始化所述關鍵節點集合P為空集;用集合K存儲k個已知的關鍵蛋白,關鍵蛋白候選集合Nk = Nv n (V-K), V e K ;NV為節點v的所有鄰居節點的集合;4)計算共簇系數并以此擴展所述候選關鍵節點集合P :若所述關鍵蛋白候選集合Nk為非空集,分別計算所述關鍵蛋白候選集合Nk中的節點與所述集合K的共簇系數,取出共簇系數最大的一個節點V,放入所述集合K和所述候選關鍵節點集合P中,同時更新所述關鍵蛋白候選集合Nk ;若所述關鍵蛋白候選集合Nk為空集,分別計算集合V-K中的節點與所述集合K的共簇系數,取出共簇系數最大的一個節點U,放入所述集合K和所述候選關鍵節點集合P中,同時更新所述關鍵蛋白候選集合Nk ;5)判斷|P是否等于(n-k),則是,進入步驟6),若否,返回步驟4),其中|P表示擴展后的候選關鍵節點集合P中的元素個數;6)輸出擴展后的候選關鍵節點集合P中的所有節點。 與現有技術相比,本專利技術所具有的有益效果為本專利技術在考慮蛋白相互作用網絡的拓撲特性的基礎上,以k個已知的關鍵蛋白作為種子節點,以該集合中每個節點的鄰居節點與集合K的共簇系數作為判斷條件不斷擴充候選關鍵蛋白節點集合,直至得到給定預測個本文檔來自技高網
    ...

    【技術保護點】
    一種基于先驗知識和網絡拓撲特性的關鍵蛋白預測方法,其特征在于,該方法的步驟為:?1)輸入蛋白相互作用信息,用k表示已知的關鍵蛋白節點數,n表示蛋白相互作用信息網絡中關鍵蛋白的數量,即k個已知關鍵蛋白加上預測出來的關鍵蛋白;?2)根據蛋白相互作用信息構建無向圖G:輸入一組蛋白相互作用信息,過濾其中重復的相互作用和自相互作用,構建無向圖G;其中G=(V,E),V代表蛋白節點集合,E代表蛋白相互作用集合;?3)生成初始的關鍵蛋白候選集合NK:用候選關鍵節點集合P存儲預測的關鍵蛋白質,初始化所述關鍵節點集合P為空集;用集合K存儲k個已知的關鍵蛋白,關鍵蛋白候選集合NK=Nv∩(V?K),v∈K;Nv為節點v的所有鄰居節點的集合;?4)計算共簇系數并以此擴展所述候選關鍵節點集合P:若所述關鍵蛋白候選集合NK為非空集,分別計算所述關鍵蛋白候選集合NK中的節點與所述集合K的共簇系數,取出共簇系數最大的一個節點v,放入所述集合K和所述候選關鍵節點集合P中,同時更新所述關鍵蛋白候選集合NK;若所述關鍵蛋白候選集合NK為空集,分別計算集合V?K中的節點與所述集合K的共簇系數,取出共簇系數最大的一個節點u,放入所述集合K和所述候選關鍵節點集合P中,同時更新所述關鍵蛋白候選集合NK;?5)判斷|P|是否等于(n?k),則是,進入步驟6),若否,返回步驟4),其中|P|表示擴展后的候選關鍵節點集合P中的元素個數;?6)輸出擴展后的候選關鍵節點集合P中的所有節點。...

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:李敏張含會王建新
    申請(專利權)人:中南大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久人妻内射无码一区三区| 欧洲精品无码一区二区三区在线播放| 亚洲av无码一区二区乱子伦as| 亚洲中文字幕无码中文字在线| 亚洲A∨无码一区二区三区| 人妻少妇偷人精品无码| 一夲道dvd高清无码| 亚洲av无码乱码在线观看野外| 亚洲国产精品无码AAA片| 亚洲av无码专区在线| 亚洲成?Ⅴ人在线观看无码| 久久精品aⅴ无码中文字字幕| 午夜无码性爽快影院6080| 日韩aⅴ人妻无码一区二区| 人妻av无码一区二区三区| 国产高清无码视频| 亚洲中文字幕无码中文| 国产成人无码区免费网站| 无码人妻aⅴ一区二区三区| 色AV永久无码影院AV| 久久久91人妻无码精品蜜桃HD| 亚洲日韩乱码中文无码蜜桃臀| 亚洲精品无码专区2| 精品久久久久久无码中文野结衣 | 无码精品一区二区三区在线| 成人免费无码视频在线网站| 无码国内精品久久人妻| 人妻丰满熟妇AV无码区HD| 精品无码国产自产拍在线观看蜜 | 国产V片在线播放免费无码| 亚洲AV无码国产精品永久一区| 亚洲av福利无码无一区二区 | 久久久无码精品人妻一区| 亚洲Av无码精品色午夜| 国产AⅤ无码专区亚洲AV| 狠狠躁狠狠爱免费视频无码| 亚洲一本大道无码av天堂| 狠狠躁狠狠爱免费视频无码| 波多野结衣AV无码久久一区| 丰满熟妇人妻Av无码区| 国产精品va无码一区二区|