• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種多模態蛋白質構象空間搜索方法技術

    技術編號:8656000 閱讀:675 留言:0更新日期:2013-05-01 23:41
    本發明專利技術提出了一種多模態蛋白質構象空間搜索方法,即在排擠差分進化算法的基礎上,綜合了空間局部性原理和集結過程思想,并采用能量極小化過程對實驗所得蛋白質構象進行處理??臻g局部性原理提升了算法的收斂速度,并有效地平衡了多模態優化問題的局部收斂性和模態多樣性;集結過程通過隨機選取不同的交叉策略,避免了構象中較好片段被算法破壞,改善了蛋白質構象群體的多樣性;能量極小化過程降低了蛋白質構象空間求解的復雜度,有效縮小了其可行域的搜索空間。本發明專利技術以腦啡肽為例,不僅得到了其公認的全局最穩定結構,還獲得了一系列高質量的局部穩定結構,解決了傳統針對單一靶點的單模態研究方法所不能解決的疾病多基因和多靶點通路的問題,滿足了現階段計算機輔助藥物設計中對于蛋白質結構多模態的需求。

    【技術實現步驟摘要】

    本專利技術設計涉及蛋白質構象空間搜索
    ,特別是涉及一種基于排擠差分進化算法的多模態蛋白質構象空間搜索方法,屬于生物信息技術、現代智能優化方法和計算機虛擬現實技術綜合交叉的技術。
    技術介紹
    2003年4月14日,美國人類基因組研究項目首席科學家Collins F博士在華盛頓隆重宣布人類基因組序列圖繪制成功,人類基因組計劃(Human Genome Project, HGP)的所有目標全部實現,這標志著人類基因組計劃勝利完成和后基因組時代(Post GenomeEra,PGE)已來臨。在當今分子生物學領域中,蛋白質分子空間結構與功能的研究無疑是最具有挑戰性的問題,雖然三聯密碼的破譯讓人們了解了分子生物學的中心法則,但這些有一定的氨基酸順序排列的多肽鏈如何形成具有一定空間結構的蛋白質分子的,這是生物學中心法則中目前還沒解決的問題?;蚪M測序計劃產生了大量的氨基酸序列,然而要了解蛋白質在生物體中的具體作用,僅有這些序列是不夠的,還必須找到蛋白質的結構和功能。蛋白質的結構和功能是統一的,一種特定的蛋白質結構是真正理解其機理所不可缺少的。因此,根據蛋白質分子的氨基酸序列預測其三維空間結構,它將會使人們能夠更系統和完整的理解生物信息從DNA到具有生物活性蛋白質的傳遞全過程,使中心法則得到更完整的闡明,從而對生命過程中的各種現象有進一步的深刻認識,最終推動生命科學的快速發展。蛋白質結構預測除了其自身的理論意義外,還具有很重要的實際應用意義,知道蛋白質功能并找到其致病的分子機理,只靠氨基酸的測序是不夠的,必須知道它們的空間結構,即藥物設計是基于蛋白質空間結構的?,F代藥物工程為了抑制某些酶或蛋白質的變異,在已知其三級結構的基礎上,利用分子對接算法,在計算機上設計抑制劑分子作為候選藥物,一些常見病如瘋牛病、白內障等都是由于蛋白質結構發生變異而引起的。人類基因組為藥物開發提供了新源泉,迄今已應用的人類藥物靶標約500種,包括受體、酶、信號轉導分子等,開發成功的藥物約2000種,估計人類基因組中3-4萬個基因中,約5000個基因產物可成為潛在的藥物靶標?;蚪M藥物的種類大致可以分為基因工程重組蛋白質藥物;以人類基因編碼蛋白為靶標的化學藥物;以人類基因編碼蛋白為靶標的人源化抗體;反義核酸類和RNA類藥物等。因此,人們希望通過研究蛋白質的內在結構來了解其內在機理,并找出蛋白質折疊的真正驅動力,這樣不僅可以對疾病進行有效的預測和控制,還可以按照人們的設想設計出符合特定需求的非天然蛋白質。然而試驗方法測定蛋白質結構的速度遠遠落后于測序速度,X射線晶體學方法和多維核磁共振技術是目前測定蛋白質結構的主要物理方法。X射線衍射分析方法能得到高分辨率的蛋白質晶體結構,但不能測定溶液中蛋白質分子的三維結構,同時該方法對蛋白質晶體之輩要求苛刻,所以帶來成本高、周期長的缺點;多維核磁共振技術能夠測定溶液中蛋白質分子結構,但是對樣本的需求量大,樣本蛋白質分子量也受到一定的限制。相比之下,蛋白質氨基酸序列被測定的數目由于DNA測序的實現而高速增長,截至目前,UniProtKB/TrEMBL數據庫存放蛋白質序列已達到10,891,661條,而其中只有63,559條序列的結構被實驗測定,僅占序列總數O. 58%,這意味著已知序列的蛋白質數量和已測定結構的蛋白質數量的差距將會越來越大。因此,單純依靠試驗方法測定所有蛋白質的空間結構遠遠不能滿足后基因時代對于蛋白質數據分析的需求,有必要發展一種可靠的理論預測方法,從而迅速、簡便的獲取蛋白質的結構信息。現有預測蛋白質構象的方法主要有兩種同源建模法和從頭預測法。同源建模法是通過比較目標蛋白質與另外一種已知結構,且其氨基酸序列與目標蛋白質聯系密切的蛋白質進行預測,如果不存在與目標蛋白質氨基酸序列相似的蛋白質,則無法進行預測。而從頭預測是假設折疊后的蛋白質取能量最低的構象,通過計算得到蛋白質每一部分不同的卷曲狀態對應的構象,直到發現最低能量狀態。由于它僅利用一級序列信息進行預測,而不需要任何其他已知蛋白質構象信息,所以該方法是比較理想的預測方法。但是在蛋白質分子設計過程中,很多情況下,預測算法所得到的蛋白質全局穩定構象可能并不滿足實際的需求,例如使用計算機等技術進行蛋白質藥物設計時,由于蛋白質構象預測所選取的能量模型的復雜性和實驗的誤差性,同時現在許多疾病涉及多基因、多靶點通路的問題,所以傳統的、針對單一靶點的單模態研究方法預測所得的蛋白質全局穩定構象和實測靶點的結構并不能很好的吻合,這就需要設計能夠給出蛋白質其他的高質量的局部穩定構象。近年來,許多隨機全局優化算法陸續提出來解決多模態優化問題,如遺傳算法(Genetic Algorithms, GA、差分進化(Differential Evolution, DE)算法,但是面對多模態函數優化時,智能優化算法要么只能尋找到問題的全局最優解,要么極易陷入局部極值解,必須與擁擠模型、適應度共享機制等小生境模型結合使用,才能找到盡可能多的極值解。2012年,K-C Wong提出的基于空間局部性原理的排擠差分進化算法(CrowdingDE-SL),較好的解決了多模態優化問題。然而蛋白質是一個大分子的復雜體系,它的能量勢能面存在著大量的局部極小,如何避免陷入局部極小的陷阱,找到全局能量極小構象成為解決多模態蛋白質構象空間搜索問題的關鍵。理想的蛋白質構象空間搜索方法是基于能量極小化的理論計算方法,因為它建立在熱力學基礎上,通常勢能面可得到許多極小值的位置,其中對應于最低能量的點稱為全局最小值,相當于蛋白質分子最穩定的構象。通過能量極小化過程進行結構優化時,避免了陷入局部相對穩定的構象,而力求得到全局最小值,從而實現全局優化。差分進化算法雖然具有很強的全局搜索能力,但是其局部搜索的能力較弱。本專利技術采用能量極小化過程,能提高差分進化算法的局部搜索能力,大大降低算法的搜索空間。特別是當群體進入一個全局最小的區域時,采用能量極小化過程可快速找到最優解。盡管現階段多模態蛋白質構象空間搜索取得了一些成果,但是要想精確、穩定、有效的搜索到蛋白質的穩定構象,同時還保證得到良好的模態分布性,蛋白質構象空間搜索仍然是一項艱巨的任務。其原因在于合理的多模態蛋白質構象空間搜索方法必須滿足以下三個條件一是要有一個合理的勢函數,能夠將蛋白質結構抽象轉化成一個數學模型;二是蛋白質能量模型是一個高維的非凸函數,要保證算法在有效的計算時間找到勢能函數的全局最優;三是在蛋白質分子設計過程中,可能算法預測所得的全局穩定構象并不滿足實際的需求,那就要求新的算法不僅更快的得到蛋白質的全局穩定構象,還要盡可能的找到一系列高質量的局部最優構象。
    技術實現思路
    本專利技術克服現有技術出現的問題,提供了一種基于排擠差分進化算法的多模態蛋白質構象空間搜索方法,其綜合了空間局部性原理和集結過程、能量極小化過程,不但能夠快速、有效的定位到蛋白質的全局穩定構象,還能得到一系列高質量的局部穩定構象。本專利技術所述的多模態蛋白質構象空間搜索方法,包括如下步驟:1)、確定優化目標,選擇蛋白質構象能量函數E(X);2)、初始化種群:采用隨機法生成初始種群pop= { ,…,<},其中N為優化問題的維數,P為種群大小,并設定算法的各控制參本文檔來自技高網
    ...

    【技術保護點】
    一種多模態蛋白質構象空間搜索方法,其特征是:在排擠差分進化算法的基礎上綜合了空間局部性原理、集結過程、能量極小化過程,對蛋白質構象進行優化處理,具體實現如下:1)、確定優化目標,選取蛋白質構象能量函數E(x);2)、設定差分進化算法各控制參數:種群大小P,變異因子F,交叉因子CR,種群迭代最大次數CG,并采用均勻分布函數隨機法生成初始種群,其中N為優化問題的維數,P為種群大?。?)、根據能量函數E(x)對初始種群進行能量極小化預處理,并按能量從小到大進行排序,選取種群前M個蛋白質構象作為種子個體;4)、變異操作:對每個目標個體(其中i、m表示第m個目標個體的第i維,i∈{1,2,……,N})做以下處理:4.1)初始化:令G=1(G為迭代次數),i=1;4.2)計算種群中非親代和親代個體的距離,其中m≠n∈{1,2,……,P},i∈N,并由大到小排序,再通過轉換函數f(x)將距離轉化為輪盤賭形式,其中轉換函數f(x)形式為:f(x)=exp{-(d22×SD2)}其中d為非親代和親代目標個體的距離,SD等于,dMAX為距親代最遠的距離;4.3)首先選取距親代最近的個體作為變異的基準矢量,然后在輪盤中隨機選取個體和,最后對執行變異操作得到變異測試個體,變異過程可表示為:umi=xai+F·(xbi-xci)其中i表示目標個體的第i維,且a≠b≠c∈{1,2,……,P},i∈N,F為變異因子;5)、以不同的概率(X、Y、Z)選取相應的交叉策略對變異測試個體執行交叉操作得到交叉測試個體;6)、對所得的交叉測試個體進行能量極小化處理得到測試個體;7)、令i=i+1,若iDIJ=Σk=1Nmin[mod{(θkI-θkJ),sym(k)},{sym(k)-mod{(θkI-θkJ),sym(k)}}]式中N為優化目標維數,θ為蛋白質構象的二面角解集,sym(k)取360o、180o、120o,表示蛋白質構象關于二面角k的對稱重復結構;11)、算法結束,輸出實驗所得的蛋白質穩定構象。FDA0000269020771.jpg,FDA0000269020772.jpg,FDA0000269020773.jpg,FDA0000269020774.jpg,FDA0000269020776.jpg,FDA0000269020777.jpg,FDA0000269020778.jpg,FDA0000269020779.jpg,FDA00002690207710.jpg,FDA00002690207711.jpg,FDA00002690207712.jpg,FDA00002690207713.jpg,FDA00002690207714.jpg,FDA00002690207716.jpg,FDA00002690207717.jpg,FDA00002690207718.jpg,FDA00002690207719.jpg,FDA00002690207720.jpg,FDA00002690207721.jpg,FDA00002690207722.jpg,FDA00002690207723.jpg...

    【技術特征摘要】
    1.一種多模態蛋白質構象空間搜索方法,其特征是:在排擠差分進化算法的基礎上綜合了空間局部性原理、集結過程、能量極小化過程,對蛋白質構象進行優化處理,具體實現如下: 1)、確定優化目標,選取蛋白質構象能量函數E(X); 2)、設定差分進化算法各控制參數:種群大小P,變異因子F,交叉因子CR,種群迭代最大次數CG,并采用均勻分布函數隨機法生成初始種群PW= {.<,.<,……,xf },其中N為優化問題的維數,P為種群大小; 3)、根據能量函數EU)對初始種群進行能量極小化預處理,并按能量從小到大進行排序,選取種群前M個蛋白質構象作為種子個體; 4)、變異操作:對每個目標個體<(其中1、m表示第m個目標個體的第i維,ie {1,2,……,N})做以下處理:` ` 4.1)初始化:令G=I (G為迭代次數),i=l ; ` 4.2)計算種群中非親代¥和親代個體4的距離,其中m古n e {I...

    【專利技術屬性】
    技術研發人員:張貴軍,程正華,鄧勇躍周曉根何陽軍,姚春龍,張貝金,
    申請(專利權)人:浙江工業大學,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码视频在线观看| 乱人伦人妻中文字幕无码久久网| 亚洲AV综合色区无码一二三区 | yy111111少妇影院无码| 亚洲无码视频在线| 久久久久久久人妻无码中文字幕爆| 亚洲午夜无码久久| 精选观看中文字幕高清无码| 无码人妻熟妇AV又粗又大| 人妻丰满熟妇av无码区不卡| 精品国产AV无码一区二区三区| 亚洲AV综合色区无码一区爱AV| 国语成本人片免费av无码| 精品日韩亚洲AV无码| 国产亚洲美日韩AV中文字幕无码成人 | 黑人巨大无码中文字幕无码 | 久久久久亚洲?V成人无码| 久久99久久无码毛片一区二区 | 日韩免费无码一区二区视频| 亚洲AV无码成人精品区日韩 | 毛片一区二区三区无码| 精品无码人妻一区二区免费蜜桃| 国产精品无码成人午夜电影| 无码国模国产在线无码精品国产自在久国产| 白嫩少妇激情无码| 亚洲国产精品无码久久久秋霞2 | 亚洲中文字幕无码一久久区| 亚洲最大av资源站无码av网址| 超清无码熟妇人妻AV在线电影| 免费看无码自慰一区二区| 精品无码人妻一区二区免费蜜桃| 亚洲av无码一区二区三区乱子伦 | 色综合久久久无码中文字幕 | 久久亚洲精品无码gv| 久久精品无码专区免费青青 | 亚洲美免无码中文字幕在线| 国产午夜无码精品免费看动漫 | 中文字幕无码日韩专区| 亚洲成av人片不卡无码久久| 无码人妻少妇伦在线电影| 一级电影在线播放无码|