The invention discloses a method for using the foraging mechanism of artificial bee colony optimization algorithm to identify the key proteins, the protein interaction network into DNA undirected graph, the corresponding expression values for protein, and construct dynamic protein interaction network, select the known proteins as nectar, honey bees, follow the neighborhood search the bee bees search neighborhood, honey, bee investigation update global search and update new nectar, nectar of key protein protein interaction network of nodes and edges pretreatment. The method of the invention can accurately identify the key proteins; simulation results show that the sensitivity, specificity, positive predictive value and negative predictive value of index performance is better; compared with other key protein identification methods, combined with the characteristics and optimization of protein interaction process of artificial bee colony identification of key proteins with the characteristics of network implementation, improve the accuracy of identification of essential proteins.
【技術(shù)實(shí)現(xiàn)步驟摘要】
采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法
本專利技術(shù)屬于生物信息領(lǐng)域,涉及一種動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)的識別方法,具體涉及采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法。
技術(shù)介紹
關(guān)鍵蛋白質(zhì)是生物體生存和繁殖所必須的蛋白質(zhì),關(guān)鍵蛋白質(zhì)的缺失會導(dǎo)致有關(guān)蛋白質(zhì)復(fù)合物功能喪失,并導(dǎo)致生物體無法生存。由于關(guān)鍵蛋白質(zhì)在生命活動中扮演重要角色,因此對于關(guān)鍵蛋白質(zhì)的預(yù)測與識別成為一項(xiàng)重要研究工作。在生物學(xué)上,關(guān)鍵蛋白質(zhì)的識別主要是依靠生物實(shí)驗(yàn)方法,例如單基因挑出和條件性基因剔除等。通過這些實(shí)驗(yàn)技術(shù)得到的結(jié)果雖然是明確和有效的,但代價(jià)高,效率低,試用范圍有限。因此,利用計(jì)算生物學(xué)的方法來預(yù)測關(guān)鍵蛋白質(zhì)成為一個(gè)新的發(fā)展方向。目前,通過計(jì)算方法實(shí)現(xiàn)關(guān)鍵蛋白質(zhì)的識別主要基于兩種措施,拓?fù)渲行男苑椒ê彤愵愒慈诤戏椒ā?001年提出的“中心性-致死性”法則指出蛋白質(zhì)的關(guān)鍵性與蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)緊密相關(guān),具體表現(xiàn)為擁有較多相鄰結(jié)點(diǎn)的蛋白質(zhì)的缺失更易于影響整個(gè)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),進(jìn)而產(chǎn)生致死的效應(yīng)。也就是說,蛋白質(zhì)網(wǎng)絡(luò)中度越高的蛋白質(zhì)結(jié)點(diǎn)越傾向于表現(xiàn)關(guān)鍵性。該理論成為了基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的關(guān)鍵蛋白質(zhì)識別的基礎(chǔ)。此后,許多研究人員提出了基于拓?fù)渲行男缘年P(guān)鍵蛋白質(zhì)識別方法,其中包括度中心性(DegreeCentrality,DC),介數(shù)中心性(BetweennessCentrality,BC),緊密度中心性(ClosenessCentrality,CC),特征向量中心性(EigenvectorCentrality,EC),信息中心性(Informati ...
【技術(shù)保護(hù)點(diǎn)】
采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,其特征在于包括以下步驟:(1)將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化成一個(gè)無向圖G=(V,E),其中,V={v
【技術(shù)特征摘要】
1.采用覓食機(jī)制的人工蜂群優(yōu)化算法識別關(guān)鍵蛋白質(zhì)的方法,其特征在于包括以下步驟:(1)將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化為無向圖將蛋白質(zhì)相互作用網(wǎng)絡(luò)轉(zhuǎn)化成一個(gè)無向圖G=(V,E),其中,V={vi,i=1,2,…,n}為結(jié)點(diǎn)vi的集合,E為邊e的集合,結(jié)點(diǎn)vi表示蛋白質(zhì),邊e表示蛋白質(zhì)之間的相互作用;(2)對蛋白質(zhì)相互作用網(wǎng)絡(luò)邊和結(jié)點(diǎn)的預(yù)處理對結(jié)點(diǎn)vi預(yù)處理:按式(1)計(jì)算結(jié)點(diǎn)vi的介數(shù)中心性:式中ρ(s,v,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間經(jīng)過結(jié)點(diǎn)v的最短路徑的條數(shù),ρ(s,t)表示蛋白質(zhì)相互作用網(wǎng)絡(luò)中結(jié)點(diǎn)s與結(jié)點(diǎn)t之間的最短路徑的條數(shù);按式(2)計(jì)算邊的聚集系數(shù):式中,Z(vi,vj)表示包含邊(vi,vj)的三角形個(gè)數(shù),di,dj分別是點(diǎn)vi,vj的度;按式(3)計(jì)算邊的皮爾森相關(guān)系數(shù):式中,xi,yi表示蛋白質(zhì)vx,vy在時(shí)間點(diǎn)t時(shí)的基因表達(dá)值,μ(x),μ(y)是蛋白質(zhì)vx,vy的平均基因表達(dá)值,T為時(shí)間點(diǎn)的最大值;(3)構(gòu)建動態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)在時(shí)間點(diǎn)t時(shí),蛋白質(zhì)vi的基因表達(dá)值GEit若大于基因表達(dá)閾值A(chǔ)T(i),則被認(rèn)為蛋白質(zhì)vi在時(shí)間點(diǎn)t具有活性;否則認(rèn)為該結(jié)點(diǎn)在時(shí)間點(diǎn)t不具有活性;將所有時(shí)間點(diǎn)的活性蛋白質(zhì)組合在一起,對應(yīng)到原靜態(tài)蛋白質(zhì)相互作用網(wǎng)絡(luò)中形成一個(gè)新的蛋白質(zhì)相互作用網(wǎng)絡(luò),即動態(tài)蛋白質(zhì)網(wǎng)絡(luò);GEit為蛋白質(zhì)vi在時(shí)間點(diǎn)t處的基因表達(dá)值;基因表達(dá)閾值A(chǔ)T(i)由式(4)得到:AT(i)=μ(i)+3σ(i)(1-F(i))式(4)式中μ(i)是蛋白質(zhì)vi平均基因表達(dá)值,σ(i)是基因表達(dá)值的標(biāo)準(zhǔn)差,F(xiàn)(i)=1/(1+σ2(i))是權(quán)函數(shù);(4)選取已知關(guān)鍵蛋白質(zhì)作為蜜源令N為蜜源中包含的已知關(guān)鍵蛋白質(zhì)的數(shù)量,在目前已知的關(guān)鍵蛋白質(zhì)中隨機(jī)選取N個(gè)關(guān)鍵蛋白質(zhì)作為先驗(yàn)知識的蜜源;Ep_set表示蜜源包含的蛋白質(zhì)的集合;iter,maxiter分別表示當(dāng)前迭代次數(shù)和最大迭代次數(shù),iter=1,matxiter∈[100,800];(5)采蜜蜂搜索蜜源鄰域蜜源的鄰域即與蜜源蛋白質(zhì)有相互作用的蛋白質(zhì)結(jié)點(diǎn)集合niber_set1,每一個(gè)鄰域結(jié)點(diǎn)看作一只采蜜蜂;按照score1(i)=relevant(vi,,Ep_set)確定采蜜蜂當(dāng)前所在位置的蜜源收益度及該鄰域結(jié)點(diǎn)成為新蜜源的可能性,式中score1(i)為采蜜蜂當(dāng)前位置的蜜...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:雷秀娟,丁玉連,陸鋮,代才,程適,
申請(專利權(quán))人:陜西師范大學(xué),
類型:發(fā)明
國別省市:陜西,61
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。