The invention discloses a pathogenic microbial genome analysis method and data analysis platform; this method is based on the strain on the database system provides a type of bacterial genome sequence and tracing function based on user need only for parameter setting and upload a simple gene strain sequence, the strain feedback system will be in a very short time MLST results, drug resistance and virulence gene distribution, reference strains name and the phylogenetic tree of all strains of the isolates and database users to upload. The method is suitable for the establishment of a data analysis platform for pathogenic microbiology integrating genetic, genomic and phylogenetic studies. Compared with the existing technology, higher resolution, can more accurate area of the same clone strains; feedback speed, efficient use of the reference strains setting and genomic SNP sequence mapping technology, the user can quickly obtain the results of data analysis, real-time tracking and tracing the spread of the pathogen is easy to clone.
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種病原微生物基因組快速分析方法及系統(tǒng)
本專(zhuān)利技術(shù)涉及基因組分型與溯源領(lǐng)域,尤其涉及一種病原微生物基因組快速分析方法及系統(tǒng)。
技術(shù)介紹
傳染性流行病是公共衛(wèi)生領(lǐng)域的一個(gè)重大安全問(wèn)題,如何針對(duì)這些傳染性疾病進(jìn)行監(jiān)測(cè)和防控是人類(lèi)面臨的一大難題。近年來(lái),隨著廣譜抗菌藥物的廣泛使用,細(xì)菌耐藥性問(wèn)題已經(jīng)成為全球公共衛(wèi)生所關(guān)注的焦點(diǎn),多重耐藥菌、廣泛耐藥菌不斷增加和流行,臨床上已經(jīng)出現(xiàn)對(duì)目前所有抗菌藥物均耐藥的“超級(jí)耐藥細(xì)菌”感染,給人類(lèi)健康帶來(lái)了巨大威脅。世界衛(wèi)生組織研究報(bào)告指出,如果“超級(jí)細(xì)菌”得不到有效遏制,全球每年可能造成1000萬(wàn)人死亡。我國(guó)是耐藥細(xì)菌流行非常嚴(yán)重的國(guó)家之一,抗生素不合理使用導(dǎo)致的耐藥問(wèn)題已經(jīng)成為關(guān)乎民生和衛(wèi)生健康的重大問(wèn)題。傳統(tǒng)的應(yīng)對(duì)策略通常是對(duì)病原微生物進(jìn)行體外藥物敏感性試驗(yàn)、生化鑒定及多位點(diǎn)序列分型(MLST)、脈沖場(chǎng)凝膠電泳(PFGE)等各種分子生物學(xué)分型手段明確細(xì)菌流行的主要克隆型(Clonaltype)。這些方法所產(chǎn)生的分型結(jié)果通常僅供局部范圍參考,不便于查看、追溯數(shù)據(jù),也無(wú)法建立長(zhǎng)期有效地耐藥菌株流行檔案;并且分型數(shù)據(jù)相對(duì)孤立,通常難以在不同醫(yī)院之間共享。雖然能在一定程度上指導(dǎo)臨床治療和疫情防控,但很難對(duì)疫情做出迅速反應(yīng),而且受限于其低水平分辨率通常難以準(zhǔn)確的區(qū)分同一克隆型的細(xì)菌,故無(wú)法制定針對(duì)性強(qiáng)的治療及防控措施。尤其在面對(duì)新發(fā)、突發(fā)傳染病病原或難以用常規(guī)手段培養(yǎng)的病原微生物時(shí),傳統(tǒng)分子流行病學(xué)方法往往難以發(fā)揮效應(yīng),無(wú)法找到疾病傳播的源頭并阻止疫情的繼續(xù)蔓延。病原微生物溯源則是解決疾病傳播所不可或缺的手段,它是指借助某種技術(shù)手 ...
【技術(shù)保護(hù)點(diǎn)】
一種病原微生物基因組快速分析方法,其特征在于,包括以下步驟:S1:獲取細(xì)菌菌株的基因組序列數(shù)據(jù)與臨床資料信息并建立BWGT數(shù)據(jù)庫(kù);S2:根據(jù)BWGT數(shù)據(jù)庫(kù)確定菌株基因組序列所對(duì)應(yīng)的物種及其相應(yīng)的MLST分型方案,并構(gòu)建MLST數(shù)據(jù)庫(kù);S3:根據(jù)物種與MLST分型方案在MLST數(shù)據(jù)庫(kù)中通過(guò)BLAST序列比對(duì)分析得到基于菌株基因組序列的序列型及其所屬克隆復(fù)合體信息,并設(shè)定具體的參考菌株;S4:獲取菌株的基因組SNP序列與親緣關(guān)系數(shù)據(jù);S5:繪制基于細(xì)菌基因組SNP序列的系統(tǒng)發(fā)生樹(shù)。
【技術(shù)特征摘要】
1.一種病原微生物基因組快速分析方法,其特征在于,包括以下步驟:S1:獲取細(xì)菌菌株的基因組序列數(shù)據(jù)與臨床資料信息并建立BWGT數(shù)據(jù)庫(kù);S2:根據(jù)BWGT數(shù)據(jù)庫(kù)確定菌株基因組序列所對(duì)應(yīng)的物種及其相應(yīng)的MLST分型方案,并構(gòu)建MLST數(shù)據(jù)庫(kù);S3:根據(jù)物種與MLST分型方案在MLST數(shù)據(jù)庫(kù)中通過(guò)BLAST序列比對(duì)分析得到基于菌株基因組序列的序列型及其所屬克隆復(fù)合體信息,并設(shè)定具體的參考菌株;S4:獲取菌株的基因組SNP序列與親緣關(guān)系數(shù)據(jù);S5:繪制基于細(xì)菌基因組SNP序列的系統(tǒng)發(fā)生樹(shù)。2.根據(jù)權(quán)利要求1所述的病原微生物基因組快速分析方法,其特征在于,還包括以下步驟:S6:將菌株臨床資料、參考菌株、基因組SNP序列和系統(tǒng)發(fā)生樹(shù)信息存儲(chǔ)到BWGT數(shù)據(jù)庫(kù)。3.根據(jù)權(quán)利要求1所述的病原微生物基因組快速分析方法,其特征在于,所述BWGT數(shù)據(jù)庫(kù)至少包括以下信息:依照不同物種進(jìn)行劃分的病原微生物基因組序列及其編碼蛋白與結(jié)構(gòu)域的注釋?zhuān)桓魑锓N對(duì)應(yīng)的多位點(diǎn)序列分型方案、等位基因序列、序列型與等位基因型對(duì)應(yīng)關(guān)系表;菌株臨床資料信息及其與公共數(shù)據(jù)庫(kù)的鏈接;用于基因組分型的參考菌株信息;與參考菌株基因組序列進(jìn)行BLAST比對(duì)與多序列聯(lián)配后,生成的基因組SNP數(shù)據(jù);用戶(hù)提交的菌株臨床信息及其基因組SNP數(shù)據(jù)。4.根據(jù)權(quán)利要求1所述的病原微生物基因組快速分析方法,其特征在于,所述BWGT數(shù)據(jù)庫(kù)中的菌株基因組序列是從公共數(shù)據(jù)庫(kù)中獲取的基因組數(shù)據(jù),并將基因組數(shù)據(jù)進(jìn)行去冗余處理,后按照病原體的不同物種進(jìn)行分類(lèi)得到的菌株基因組序列;所述BWGT數(shù)據(jù)庫(kù)中的MLST分型方案數(shù)據(jù)是根據(jù)不同物種從公共數(shù)據(jù)庫(kù)中提取不同MLST分型數(shù)據(jù)集,并存入數(shù)據(jù)庫(kù)。5.根據(jù)權(quán)利要求1所述的病原微生物基因組快速分析方法,其特征在于,所述BWGT數(shù)據(jù)庫(kù)中設(shè)置有細(xì)菌菌株的參考菌株的相關(guān)信息;根據(jù)基因組序列信息確定基因組序列的分型組;所述基因組序列中的等位基因型超過(guò)預(yù)設(shè)數(shù)量的判定為一個(gè)分型組;從分型組中確定克隆復(fù)合體;所述分型組中的序列型達(dá)到預(yù)設(shè)個(gè)數(shù)的判定為一個(gè)克隆復(fù)合體;在每個(gè)克隆復(fù)合體中選取一株細(xì)菌作為參考菌株。6.根據(jù)權(quán)利要求3所述的病原微生物基因組快速分析方法,其特征在于,所述序列型與等位基因型對(duì)應(yīng)關(guān)系表設(shè)置有八列,分別代表序列型與七個(gè)等位基因的序列型數(shù)值;所述MLST數(shù)據(jù)庫(kù)中的MLST分型方案所對(duì)應(yīng)的等位基因序列采用如下的序列格式:該序列格式以FASTA格式為基礎(chǔ),在每行“>”后輸入等位基因名與等位基因型,中間用“-”分隔;所述BWGT數(shù)據(jù)庫(kù)包括公共數(shù)據(jù)庫(kù)資源和菌株臨床資料信息;所述公共數(shù)據(jù)庫(kù)資源包括NCBI、EBI、PATRIC公共數(shù)據(jù)庫(kù)資源和PubMLST公共數(shù)據(jù)庫(kù)資源;所述菌株臨床資料信息通過(guò)文本挖掘技術(shù)從網(wǎng)頁(yè)與文獻(xiàn)中提取菌株的臨床資料整合數(shù)據(jù)。7.一種病原微生物基因組快速分析系統(tǒng),其特征在于,包括BWGT數(shù)據(jù)庫(kù)及分別與BWGT數(shù)據(jù)庫(kù)關(guān)聯(lián)的菌株基因組分型與溯源單元、SNP序列注釋單元、參考菌株判定單元、SNP序列生成單元、SNP位點(diǎn)坐標(biāo)轉(zhuǎn)換單元、數(shù)據(jù)庫(kù)瀏覽單元、耐藥與毒力基因鑒定單元和用戶(hù)數(shù)據(jù)提交單元;所述BWGT數(shù)據(jù)庫(kù)至少包括以下信息:依照不同物種進(jìn)行劃分的病原微生物基因組序列及其編碼蛋白與結(jié)構(gòu)域的注釋?zhuān)桓魑锓N對(duì)應(yīng)的多位點(diǎn)序列分型方案、等位基因序列、序列型與等位基因型對(duì)應(yīng)關(guān)系表;菌株臨床資料信息及其...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:阮陟,陳歡,馮曄,單杲,
申請(qǐng)(專(zhuān)利權(quán))人:浙江大學(xué),
類(lèi)型:發(fā)明
國(guó)別省市:浙江,33
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。