• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當(dāng)前位置: 首頁 > 專利查詢>陜西師范大學(xué)專利>正文

    采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法技術(shù)

    技術(shù)編號:15691301 閱讀:140 留言:0更新日期:2017-06-24 04:23
    本發(fā)明專利技術(shù)公開了一種采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖、獲取蛋白質(zhì)對應(yīng)的核糖核酸基因表達(dá)值、對蛋白質(zhì)相互作用網(wǎng)絡(luò)邊和結(jié)點(diǎn)預(yù)處理、構(gòu)建動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)、選取已知關(guān)鍵蛋白質(zhì)作為蜜源、采蜜蜂搜索蜜源鄰域、跟隨蜂搜索采蜜蜂鄰域、更新蜜源、偵查蜂全局搜索新蜜源、更新蜜源、產(chǎn)生關(guān)鍵蛋白質(zhì)。本發(fā)明專利技術(shù)方法能準(zhǔn)確地識別關(guān)鍵蛋白質(zhì);仿真實(shí)驗(yàn)結(jié)果表明,敏感度、特異性、陽性預(yù)測值、陰性預(yù)測值等指標(biāo)性能較優(yōu);與其他關(guān)鍵蛋白識別方法相比,結(jié)合人工蜂群的優(yōu)化特性與蛋白質(zhì)相互作用網(wǎng)絡(luò)的特征實(shí)現(xiàn)關(guān)鍵蛋白質(zhì)的識別過程,提高了關(guān)鍵蛋白質(zhì)的識別準(zhǔn)確率。

    A method for identifying key proteins using foraging mechanism artificial bee colony optimization algorithm

    The invention discloses a method for using the foraging mechanism of artificial bee colony optimization algorithm to identify the key proteins, the protein interaction network into DNA undirected graph, the corresponding expression values for protein, and construct dynamic protein interaction network, select the known proteins as nectar, honey bees, follow the neighborhood search the bee bees search neighborhood, honey, bee investigation update global search and update new nectar, nectar of key protein protein interaction network of nodes and edges pretreatment. The method of the invention can accurately identify the key proteins; simulation results show that the sensitivity, specificity, positive predictive value and negative predictive value of index performance is better; compared with other key protein identification methods, combined with the characteristics and optimization of protein interaction process of artificial bee colony identification of key proteins with the characteristics of network implementation, improve the accuracy of identification of essential proteins.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法
    本專利技術(shù)屬于生物信息領(lǐng)域,涉及一種動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的識別方法,具體涉及采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法。
    技術(shù)介紹
    關(guān)鍵蛋白質(zhì)是生物體生存和繁殖所必須的蛋白質(zhì),關(guān)鍵蛋白質(zhì)的缺失會導(dǎo)致有關(guān)蛋白質(zhì)復(fù)合物功能喪失,并導(dǎo)致生物體無法生存。由于關(guān)鍵蛋白質(zhì)在生命活動中扮演重要角色,因此對于關(guān)鍵蛋白質(zhì)的預(yù)測與識別成為一項(xiàng)重要研究工作。在生物學(xué)上,關(guān)鍵蛋白質(zhì)的識別主要是依靠生物實(shí)驗(yàn)方法,例如單基因挑出和條件性基因剔除等。通過這些實(shí)驗(yàn)技術(shù)得到的結(jié)果雖然是明確和有效的,但代價(jià)高,效率低,試用范圍有限。因此,利用計(jì)算生物學(xué)的方法來預(yù)測關(guān)鍵蛋白質(zhì)成為一個(gè)新的發(fā)展方向。目前,通過計(jì)算方法實(shí)現(xiàn)關(guān)鍵蛋白質(zhì)的識別主要基于兩種措施,拓?fù)渲行男苑椒ê彤愵愒慈诤戏椒ā?001年提出的“中心性-致死性”法則指出蛋白質(zhì)的關(guān)鍵性與蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)緊密相關(guān),具體表現(xiàn)為擁有較多相鄰結(jié)點(diǎn)的蛋白質(zhì)的缺失更易于影響整個(gè)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),進(jìn)而產(chǎn)生致死的效應(yīng)。也就是說,蛋白質(zhì)網(wǎng)絡(luò)中度越高的蛋白質(zhì)結(jié)點(diǎn)越傾向于表現(xiàn)關(guān)鍵性。該理論成為了基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的關(guān)鍵蛋白質(zhì)識別的基礎(chǔ)。此后,許多研究人員提出了基于拓?fù)渲行男缘年P(guān)鍵蛋白質(zhì)識別方法,其中包括度中心性(DegreeCentrality,DC),介數(shù)中心性(BetweennessCentrality,BC),緊密度中心性(ClosenessCentrality,CC),特征向量中心性(EigenvectorCentrality,EC),信息中心性(InformationCentrality,IC),子圖中心性(SubgraphCentrality,SC)。通過計(jì)算蛋白質(zhì)相互作用網(wǎng)絡(luò)中所有蛋白質(zhì)結(jié)點(diǎn)在網(wǎng)絡(luò)中某個(gè)中心性的值的大小來判斷其為關(guān)鍵蛋白質(zhì)的可能性。這些中心性方法高度依賴蛋白質(zhì)相互作用網(wǎng)絡(luò)的精確性。但蛋白質(zhì)相互作用網(wǎng)絡(luò)是通過高通量生物實(shí)驗(yàn)獲得,包含了很多假陽性,很大地影響了關(guān)鍵蛋白質(zhì)識別的準(zhǔn)確率。針對中心性拓?fù)涮卣髯R別關(guān)鍵蛋白質(zhì)的缺點(diǎn),研究人員提出一些新的識別方法進(jìn)一步提高關(guān)鍵蛋白質(zhì)的識別準(zhǔn)確率。如PeC關(guān)鍵蛋白質(zhì)識別方法將蛋白質(zhì)相互作用網(wǎng)絡(luò)與基因表達(dá)譜整合起來,ION關(guān)鍵蛋白質(zhì)識別方法主要結(jié)合了蛋白質(zhì)的同源特性和蛋白質(zhì)相互作用網(wǎng)絡(luò)。基于邊的聚集系數(shù)的關(guān)鍵蛋白質(zhì)識別方法。通過考慮蛋白質(zhì)本身及其周圍鄰居的聚集狀況來識別蛋白質(zhì)。此外,還有一些通過融合其他信息進(jìn)行關(guān)鍵蛋白質(zhì)識別的方法,如基于結(jié)構(gòu)域的關(guān)鍵蛋白質(zhì)識別方法,基于基因共表達(dá)的關(guān)鍵蛋白質(zhì)識別方法等。近年來,有研究指出生物網(wǎng)絡(luò)存在顯著的模塊化特性,在蛋白質(zhì)網(wǎng)絡(luò)中表現(xiàn)為存在大量的蛋白質(zhì)復(fù)合物功能模塊。Hart等人提出關(guān)鍵性是蛋白質(zhì)復(fù)合物的一種屬性,并通過實(shí)驗(yàn)數(shù)據(jù)顯示出關(guān)鍵蛋白質(zhì)往往大量集中在某些復(fù)合物中。隨后Zotenko等人提出了關(guān)鍵復(fù)合物模塊的概念,并指出具有相同功能或相近生物功能的高度聯(lián)通的蛋白質(zhì)網(wǎng)絡(luò)功能模塊中具有大量關(guān)鍵蛋白質(zhì)。因此許多研究者提出基于蛋白質(zhì)復(fù)合物及功能模塊的關(guān)鍵蛋白質(zhì)識別方法。盡管關(guān)鍵蛋白質(zhì)的識別問題越來越引起人們的關(guān)注,但目前結(jié)合網(wǎng)絡(luò)信息的識別方法的準(zhǔn)確率依舊較低,而且大多數(shù)方法都是孤立或者零碎地使用少數(shù)參數(shù)或特征分析關(guān)鍵蛋白質(zhì),對于結(jié)點(diǎn)缺乏從整體和全局上的把握。另外,當(dāng)前的關(guān)鍵蛋白識別方法大多基于靜態(tài)的蛋白質(zhì)相互作用網(wǎng)絡(luò)識別的,而生物體中蛋白質(zhì)的活性是隨著生物體的生命周期而變化的,因此構(gòu)建一個(gè)更能真實(shí)模仿生物體的動態(tài)生命的蛋白質(zhì)相互作用網(wǎng)絡(luò)能幫助進(jìn)一步提升關(guān)鍵蛋白質(zhì)識別準(zhǔn)確率。綜合上述關(guān)鍵蛋白質(zhì)識別方法的缺陷,主要有沒考慮蛋白質(zhì)相互作用網(wǎng)絡(luò)的動態(tài)性,只考慮局部特征而忽視了網(wǎng)絡(luò)的全局性以及蛋白質(zhì)相互作用網(wǎng)絡(luò)數(shù)據(jù)的假陽性,關(guān)鍵蛋白質(zhì)識別準(zhǔn)確率低。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,能真實(shí)地模擬蛋白質(zhì)相互作用網(wǎng)絡(luò)的動態(tài)性,關(guān)鍵蛋白質(zhì)識別準(zhǔn)確度高。為達(dá)到上述目的,本專利技術(shù)采用如下技術(shù)方案:采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,包括以下步驟:(1)將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化成一個(gè)無向圖G=(V,E),其中,V={vi,i=1,2,…,n}為結(jié)點(diǎn)vi的集合,E為邊e的集合,結(jié)點(diǎn)vi表示蛋白質(zhì),邊e表示蛋白質(zhì)之間的相互作用;(2)對蛋白質(zhì)相互作用網(wǎng)絡(luò)邊和結(jié)點(diǎn)的預(yù)處理對結(jié)點(diǎn)vi預(yù)處理:按式(1)計(jì)算結(jié)點(diǎn)vi的介數(shù)中心性:式中ρ(s,v,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間經(jīng)過結(jié)點(diǎn)v的最短路徑的條數(shù),ρ(s,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間的最短路徑的條數(shù);按式(2)計(jì)算邊的聚集系數(shù):式中,Z(vi,vj)表示包含邊(vi,vj)的三角形個(gè)數(shù),di,dj分別是點(diǎn)vi,vj的度;按式(3)計(jì)算邊的皮爾森相關(guān)系數(shù):式中,xi,yi表示蛋白質(zhì)vx,vy在時(shí)間點(diǎn)t時(shí)的基因表達(dá)值,μ(x),μ(y)是蛋白質(zhì)vx,vy的平均基因表達(dá)值,T為時(shí)間點(diǎn)的最大值;(3)構(gòu)建動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)在時(shí)間點(diǎn)t時(shí),蛋白質(zhì)vi的基因表達(dá)值GEit若大于基因表達(dá)閾值A(chǔ)T(i),則被認(rèn)為蛋白質(zhì)vi在時(shí)間點(diǎn)t具有活性;否則認(rèn)為該結(jié)點(diǎn)在時(shí)間點(diǎn)t不具有活性;將所有時(shí)間點(diǎn)的活性蛋白質(zhì)組合在一起,對應(yīng)到原靜態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)中形成一個(gè)新的蛋白質(zhì)相互作用網(wǎng)絡(luò),即動態(tài)蛋白質(zhì)網(wǎng)絡(luò);GEit為蛋白質(zhì)vi在時(shí)間點(diǎn)t處的基因表達(dá)值;基因表達(dá)閾值A(chǔ)T(i)由式(4)得到:AT(i)=μ(i)+3σ(i)(1-F(i))式(4)式中μ(i)是蛋白質(zhì)vi平均基因表達(dá)值,σ(i)是基因表達(dá)值的標(biāo)準(zhǔn)差,F(xiàn)(i)=1/(1+σ2(i))是權(quán)函數(shù);(4)選取已知關(guān)鍵蛋白質(zhì)作為蜜源令N為蜜源中包含的已知關(guān)鍵蛋白質(zhì)的數(shù)量,在目前已知的關(guān)鍵蛋白質(zhì)中隨機(jī)選取N個(gè)關(guān)鍵蛋白質(zhì)作為先驗(yàn)知識的蜜源;Ep_set表示蜜源包含的蛋白質(zhì)的集合;iter,maxiter分別表示當(dāng)前迭代次數(shù)和最大迭代次數(shù),iter=1,matxiter∈[100,800];(5)采蜜蜂搜索蜜源鄰域蜜源的鄰域即與蜜源蛋白質(zhì)有相互作用的蛋白質(zhì)結(jié)點(diǎn)集合niber_set1,每一個(gè)鄰域結(jié)點(diǎn)看作一只采蜜蜂;按照score1(i)=relevant(vi,,Ep_set)確定采蜜蜂當(dāng)前所在位置的蜜源收益度及該鄰域結(jié)點(diǎn)成為新蜜源的可能性,式中score1(i)為采蜜蜂當(dāng)前位置的蜜源收益度,vi是采蜜蜂所代表的蛋白質(zhì)結(jié)點(diǎn),relevant表示蛋白質(zhì)結(jié)點(diǎn)vi與當(dāng)前蜜源集合Ep_set之間的關(guān)聯(lián)度;(6)跟隨蜂搜索采蜜蜂鄰域設(shè)采蜜蜂vi的鄰域即與采蜜蜂所代表的蛋白質(zhì)有相互作用且不在當(dāng)前蜜源集合Ep_set內(nèi)的蛋白質(zhì)結(jié)點(diǎn)集合為niber_set2;跟隨蜂接收采蜜蜂的信息并且對采蜜蜂的鄰域進(jìn)行搜索,即跟隨蜂根據(jù)公式score2(i)=fitness(vi,,niber_set2,Ep_set)確定當(dāng)前位置成為新蜜源的可能性,式中vi是采蜜蜂所代表的蛋白質(zhì)結(jié)點(diǎn),niber_set2表示采蜜蜂的鄰域蛋白質(zhì)結(jié)點(diǎn),fitness表示當(dāng)前位置成為蜜源的適應(yīng)度;(7)更新蜜源對蛋白質(zhì)結(jié)點(diǎn)集合niber_set1中的結(jié)點(diǎn)按照其score2本文檔來自技高網(wǎng)
    ...
    采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法

    【技術(shù)保護(hù)點(diǎn)】
    采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,其特征在于包括以下步驟:(1)將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化成一個(gè)無向圖G=(V,E),其中,V={v

    【技術(shù)特征摘要】
    1.采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,其特征在于包括以下步驟:(1)將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化成一個(gè)無向圖G=(V,E),其中,V={vi,i=1,2,…,n}為結(jié)點(diǎn)vi的集合,E為邊e的集合,結(jié)點(diǎn)vi表示蛋白質(zhì),邊e表示蛋白質(zhì)之間的相互作用;(2)對蛋白質(zhì)相互作用網(wǎng)絡(luò)邊和結(jié)點(diǎn)的預(yù)處理對結(jié)點(diǎn)vi預(yù)處理:按式(1)計(jì)算結(jié)點(diǎn)vi的介數(shù)中心性:式中ρ(s,v,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間經(jīng)過結(jié)點(diǎn)v的最短路徑的條數(shù),ρ(s,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間的最短路徑的條數(shù);按式(2)計(jì)算邊的聚集系數(shù):式中,Z(vi,vj)表示包含邊(vi,vj)的三角形個(gè)數(shù),di,dj分別是點(diǎn)vi,vj的度;按式(3)計(jì)算邊的皮爾森相關(guān)系數(shù):式中,xi,yi表示蛋白質(zhì)vx,vy在時(shí)間點(diǎn)t時(shí)的基因表達(dá)值,μ(x),μ(y)是蛋白質(zhì)vx,vy的平均基因表達(dá)值,T為時(shí)間點(diǎn)的最大值;(3)構(gòu)建動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)在時(shí)間點(diǎn)t時(shí),蛋白質(zhì)vi的基因表達(dá)值GEit若大于基因表達(dá)閾值A(chǔ)T(i),則被認(rèn)為蛋白質(zhì)vi在時(shí)間點(diǎn)t具有活性;否則認(rèn)為該結(jié)點(diǎn)在時(shí)間點(diǎn)t不具有活性;將所有時(shí)間點(diǎn)的活性蛋白質(zhì)組合在一起,對應(yīng)到原靜態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)中形成一個(gè)新的蛋白質(zhì)相互作用網(wǎng)絡(luò),即動態(tài)蛋白質(zhì)網(wǎng)絡(luò);GEit為蛋白質(zhì)vi在時(shí)間點(diǎn)t處的基因表達(dá)值;基因表達(dá)閾值A(chǔ)T(i)由式(4)得到:AT(i)=μ(i)+3σ(i)(1-F(i))式(4)式中μ(i)是蛋白質(zhì)vi平均基因表達(dá)值,σ(i)是基因表達(dá)值的標(biāo)準(zhǔn)差,F(xiàn)(i)=1/(1+σ2(i))是權(quán)函數(shù);(4)選取已知關(guān)鍵蛋白質(zhì)作為蜜源令N為蜜源中包含的已知關(guān)鍵蛋白質(zhì)的數(shù)量,在目前已知的關(guān)鍵蛋白質(zhì)中隨機(jī)選取N個(gè)關(guān)鍵蛋白質(zhì)作為先驗(yàn)知識的蜜源;Ep_set表示蜜源包含的蛋白質(zhì)的集合;iter,maxiter分別表示當(dāng)前迭代次數(shù)和最大迭代次數(shù),iter=1,matxiter∈[100,800];(5)采蜜蜂搜索蜜源鄰域蜜源的鄰域即與蜜源蛋白質(zhì)有相互作用的蛋白質(zhì)結(jié)點(diǎn)集合niber_set1,每一個(gè)鄰域結(jié)點(diǎn)看作一只采蜜蜂;按照score1(i)=relevant(vi,,Ep_set)確定采蜜蜂當(dāng)前所在位置的蜜源收益度及該鄰域結(jié)點(diǎn)成為新蜜源的可能性,式中score1(i)為采蜜蜂當(dāng)前位置的蜜...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:雷秀娟丁玉連陸鋮代才程適
    申請(專利權(quán))人:陜西師范大學(xué)
    類型:發(fā)明
    國別省市:陜西,61

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 2014AV天堂无码一区| 国产午夜精品无码| 亚洲Av无码一区二区二三区| 国产成人AV片无码免费| 亚洲日韩看片无码电影| 无码AⅤ精品一区二区三区| 国产成A人亚洲精V品无码性色| 久久久久亚洲AV无码网站| 变态SM天堂无码专区| 亚洲精品无码久久久久YW| 国产成年无码AV片在线韩国| 无码粉嫩虎白一线天在线观看| 亚洲精品无码久久久久去q | 久久久久亚洲av无码专区导航| 永久免费av无码不卡在线观看| 国产成人精品无码片区在线观看 | 少妇伦子伦精品无码STYLES| 精品人妻无码专区在中文字幕| 亚洲AV永久青草无码精品| 无码人妻精一区二区三区| 无码中文在线二区免费| 精品无码人妻一区二区三区| 亚洲av无码成人黄网站在线观看| 亚洲一级特黄无码片| 惠民福利中文字幕人妻无码乱精品| 岛国av无码免费无禁网站| 久久精品无码中文字幕| 亚洲中文无码亚洲人成影院| 久久亚洲AV无码精品色午夜| 老司机亚洲精品影院无码| 日韩精品真人荷官无码| 久久久久久久亚洲Av无码| 无码精品人妻一区二区三区人妻斩 | 亚洲男人第一无码aⅴ网站| 狠狠久久精品中文字幕无码| 免费无码又爽又刺激毛片| 国产成人无码a区在线观看视频免费 | 久久久久无码国产精品一区| 日韩精品无码人成视频手机 | 日韩a级无码免费视频| MM1313亚洲精品无码久久|