本發(fā)明專利技術(shù)提供了一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,包括對(duì)每個(gè)分組中BGP采集點(diǎn)采集的AS之間的路徑信息進(jìn)行初始判定,獲得一致性AS連接關(guān)系集合和無(wú)法判定的AS連接關(guān)系集合;每個(gè)分組對(duì)一致性AS連接關(guān)系集合中的同一個(gè)AS連接關(guān)系進(jìn)行判定,獲得可信的p2p連接關(guān)系或p2c連接關(guān)系,將其加入可信AS連接關(guān)系集合;一致性AS連接關(guān)系集合中的其他AS連接關(guān)系加入無(wú)法判定的AS連接關(guān)系集合;利用可信AS連接關(guān)系集合進(jìn)行分類模型訓(xùn)練,利用訓(xùn)練好的分類模型對(duì)無(wú)法判定的AS連接關(guān)系集合中的AS連接關(guān)系進(jìn)行判定,輸出判定結(jié)果。該方法能夠?qū)o(wú)法判定關(guān)系類型的AS連接關(guān)系進(jìn)行推斷,構(gòu)建準(zhǔn)確的AS連接關(guān)系。構(gòu)建準(zhǔn)確的AS連接關(guān)系。構(gòu)建準(zhǔn)確的AS連接關(guān)系。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法
[0001]本專利技術(shù)屬于網(wǎng)絡(luò)空間測(cè)量
,具體涉及一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法。
技術(shù)介紹
[0002]如今,互聯(lián)網(wǎng)由6萬(wàn)多個(gè)自治系統(tǒng)(autonomous systems, AS)組成。基于互聯(lián)網(wǎng)連接的要求,這些AS傳播前綴并相互交換路由信息,以控制流量的路由方式。AS級(jí)拓?fù)渲械倪B接關(guān)系通常用AS
?
to
?
AS方式表示,包括對(duì)等方(peer
?
to
?
peer, p2p)、客戶對(duì)提供商(customer
?
to
?
provider, c2p)和提供商對(duì)客戶(provider
?
to
?
customer, p2c)。隨著互聯(lián)網(wǎng)的規(guī)模和復(fù)雜性以前所未有的速度增長(zhǎng),了解不同AS之間的關(guān)系對(duì)于理解、運(yùn)營(yíng)和整合互聯(lián)網(wǎng)非常重要,例如研究互聯(lián)網(wǎng)的健壯性、檢測(cè)路由劫持、路由泄漏和路由瓶頸,設(shè)計(jì)各種基于路由的攻擊及其對(duì)抗措施,以及部署安全路由機(jī)制。
[0003]然而,對(duì)AS關(guān)系有充分的了解并不容易,因?yàn)樗鼈兺ǔJ潜C艿模仨殢母鞣N相關(guān)信息中推斷出來(lái)。目前,幾乎所有推理算法都使用一組BGP(Border Gateway Protocol,邊界網(wǎng)關(guān)協(xié)議)采集點(diǎn)集合所收集的BGP路由作為其分析的主要數(shù)據(jù),然后將一些其他相關(guān)信息進(jìn)行補(bǔ)充,包括互聯(lián)網(wǎng)信息交換中心、BGP社區(qū)等。但是,BGP采集點(diǎn)所采集到的數(shù)據(jù)是零碎的數(shù)據(jù)集,推理算法面臨著幾個(gè)基本的挑戰(zhàn)。首先,這些觀察結(jié)果與不可忽略的噪聲相耦合,即路由異常或配置錯(cuò)誤導(dǎo)致的路由。第二,來(lái)自某個(gè)BGP采集點(diǎn)的路線只是全球互聯(lián)網(wǎng)的一部分,因此數(shù)據(jù)上具有局限性。第三,BGP采集點(diǎn)通常集中在互聯(lián)網(wǎng)層次結(jié)構(gòu)的上層位置,它們的重疊或非重疊視圖在聚合時(shí)會(huì)帶來(lái)觀察偏差。這些挑戰(zhàn)會(huì)給AS連接之間的關(guān)系推理帶來(lái)錯(cuò)誤結(jié)論和嚴(yán)重影響。
技術(shù)實(shí)現(xiàn)思路
[0004]專利技術(shù)目的:本專利技術(shù)所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法。
[0005]為了解決上述技術(shù)問(wèn)題,本專利技術(shù)公開了一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,包括以下步驟。
[0006]步驟S1,獲取公開的BGP采集點(diǎn)和每個(gè)BGP采集點(diǎn)采集的AS之間的路徑信息,對(duì)BGP采集點(diǎn)進(jìn)行分組;對(duì)每個(gè)分組中BGP采集點(diǎn)采集的AS之間的路徑信息進(jìn)行初始判定,獲得一致性AS連接關(guān)系集合和無(wú)法判定的AS連接關(guān)系集合。
[0007]步驟S2,每個(gè)分組對(duì)一致性AS連接關(guān)系集合中的同一個(gè)AS連接關(guān)系進(jìn)行判定,獲得可信的p2p連接關(guān)系或p2c連接關(guān)系,并將其加入可信AS連接關(guān)系集合;一致性AS連接關(guān)系集合中的其他AS連接關(guān)系加入無(wú)法判定的AS連接關(guān)系集合。
[0008]步驟S3,利用可信AS連接關(guān)系集合進(jìn)行分類模型訓(xùn)練,利用訓(xùn)練好的分類模型對(duì)無(wú)法判定的AS連接關(guān)系集合中的AS連接關(guān)系進(jìn)行判定,輸出判定結(jié)果。
[0009]進(jìn)一步地,步驟S1包括以下步驟。
[0010]步驟S101,從互聯(lián)網(wǎng)中下載公開的RouteView數(shù)據(jù),獲得所有的BGP采集點(diǎn),并從中摘取出BGP采集點(diǎn)采集的BGP路由數(shù)據(jù),所述BGP路由數(shù)據(jù)包含了互聯(lián)網(wǎng)域間路由在報(bào)文轉(zhuǎn)發(fā)過(guò)程中經(jīng)過(guò)各個(gè)AS之間的路徑信息。
[0011]步驟S102,將所有的BGP采集點(diǎn)通過(guò)隨機(jī)方式進(jìn)行分組,每個(gè)分組包含的BGP采集點(diǎn)數(shù)目為N。
[0012]步驟S103,在每個(gè)分組中,分別采用AS
?
Rank算法對(duì)分組中每個(gè)BGP采集點(diǎn)所采集到的AS之間的路徑信息進(jìn)行計(jì)算,獲得對(duì)應(yīng)的AS連接之間的第一關(guān)系。
[0013]步驟S104,在每個(gè)分組中,采用集成學(xué)習(xí)方式對(duì)分組內(nèi)所有BGP采集點(diǎn)計(jì)算獲得的同一個(gè)AS連接之間的第一關(guān)系逐一進(jìn)行投票判定,以確保AS連接關(guān)系推斷結(jié)果的準(zhǔn)確性,將投票結(jié)果最高的AS連接之間的第一關(guān)系判定為一致性AS連接關(guān)系,并將這些一致性AS連接關(guān)系劃分到一致性AS連接關(guān)系集合中,其他的AS連接關(guān)系暫時(shí)劃分到無(wú)法判定的AS連接關(guān)系集合中。
[0014]進(jìn)一步地,所述步驟S102中每個(gè)分組包含的BGP采集點(diǎn)數(shù)目N設(shè)置如下。
[0015]步驟S1021,從CAIDA(Center for Applied Internet Data Analysis)國(guó)際測(cè)量組織中下載其所公開的已知AS連接關(guān)系,并將這些已知AS連接關(guān)系作為基準(zhǔn)數(shù)據(jù)集。
[0016]步驟S1022,針對(duì)步驟S101中獲得的每個(gè)BGP采集點(diǎn),采用AS
?
Rank算法計(jì)算所述基準(zhǔn)數(shù)據(jù)集中各個(gè)AS連接之間的第二關(guān)系,將所述AS連接之間的第二關(guān)系與基準(zhǔn)數(shù)據(jù)集中對(duì)應(yīng)AS連接關(guān)系進(jìn)行比較,獲得BGP采集點(diǎn)判斷對(duì)應(yīng)AS連接關(guān)系的誤判率以及BGP采集點(diǎn)判斷基準(zhǔn)數(shù)據(jù)集中所有AS連接關(guān)系的平均誤判率p。
[0017]步驟S1023,利用二項(xiàng)式定理進(jìn)行評(píng)估,確定每個(gè)分組中BGP采集點(diǎn)的數(shù)目N。
[0018]進(jìn)一步地,步驟S1023包括:以至少有一半的BGP采集點(diǎn)數(shù)能夠正確判定AS連接關(guān)系的概率不低于95%為目標(biāo),確定每個(gè)分組中BGP采集點(diǎn)的數(shù)目N,公式如下。
[0019]arg min(N)其中,X表示能夠正確判定AS連接關(guān)系的BGP采集點(diǎn)數(shù)目,表示至少有一半的BGP采集點(diǎn)數(shù)能夠正確判定AS連接關(guān)系的概率。
[0020]進(jìn)一步地,步驟S2包括以下步驟。
[0021]步驟S201,各個(gè)分組對(duì)一致性AS連接關(guān)系集合中的同一個(gè)AS連接關(guān)系進(jìn)行判定。
[0022]步驟S202,如果超過(guò)第一比例閾值t1的采集點(diǎn)分組都將某個(gè)AS連接關(guān)系判定為p2p連接關(guān)系,則將該AS連接關(guān)系判定為可信的p2p連接關(guān)系。
[0023]步驟S203,如果超過(guò)第二比例閾值t2的采集點(diǎn)分組都將某個(gè)AS連接關(guān)系判定為p2c/c2p連接關(guān)系,則將該AS連接關(guān)系判定為可信的p2c/c2p連接關(guān)系。
[0024]步驟S204,將所述可信的p2p連接關(guān)系和可信的p2p/c2p連接關(guān)系都加入到可信AS連接關(guān)系集合中,一致性AS連接關(guān)系集合中的其他AS連接關(guān)系加入無(wú)法判定的AS連接關(guān)系集合中。
[0025]進(jìn)一步地,步驟S202中的第一比例閾值t1的值為所有BGP采集點(diǎn)能夠獲得的p2p鏈路比例的均值;步驟S203中的第二比例閾值t2的值為所有BGP采集點(diǎn)能夠獲得的p2c/c2p鏈路比例的均值。
[0026]進(jìn)一步地,步驟S3中所述分類模型采用基于期望最大化的貝葉斯網(wǎng)絡(luò)模型。考慮到所有BGP采集點(diǎn)所收集到的AS連接數(shù)據(jù)存在較大的不均衡分布特性,而貝葉斯網(wǎng)絡(luò)模型可以有效消除這種特性給AS連接關(guān)系推斷所帶來(lái)的影響。
[0027]進(jìn)一步地,步驟S3包括以下步驟。
[0028]步驟S301,分別為可信AS連接關(guān)系集合和無(wú)法判定的AS連接關(guān)系集合中的每條AS連接關(guān)系建立對(duì)應(yīng)的特征向量。...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,其特征在于,包括以下步驟:步驟S1,獲取公開的BGP采集點(diǎn)和每個(gè)BGP采集點(diǎn)采集的AS之間的路徑信息,對(duì)BGP采集點(diǎn)進(jìn)行分組;對(duì)每個(gè)分組中BGP采集點(diǎn)采集的AS之間的路徑信息進(jìn)行初始判定,獲得一致性AS連接關(guān)系集合和無(wú)法判定的AS連接關(guān)系集合;步驟S2,每個(gè)分組對(duì)一致性AS連接關(guān)系集合中的同一個(gè)AS連接關(guān)系進(jìn)行判定,獲得可信的p2p連接關(guān)系或p2c連接關(guān)系,并將其加入可信AS連接關(guān)系集合;一致性AS連接關(guān)系集合中的其他AS連接關(guān)系加入無(wú)法判定的AS連接關(guān)系集合;步驟S3,利用可信AS連接關(guān)系集合進(jìn)行分類模型訓(xùn)練,利用訓(xùn)練好的分類模型對(duì)無(wú)法判定的AS連接關(guān)系集合中的AS連接關(guān)系進(jìn)行判定,輸出判定結(jié)果。2.根據(jù)權(quán)利要求1所述的一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,其特征在于,步驟S1包括以下步驟:步驟S101,從互聯(lián)網(wǎng)中下載公開的RouteView數(shù)據(jù),獲得所有的BGP采集點(diǎn),并從中摘取出BGP采集點(diǎn)采集的BGP路由數(shù)據(jù),所述BGP路由數(shù)據(jù)包含了互聯(lián)網(wǎng)域間路由在報(bào)文轉(zhuǎn)發(fā)過(guò)程中經(jīng)過(guò)各個(gè)AS之間的路徑信息;步驟S102,將所有的BGP采集點(diǎn)通過(guò)隨機(jī)方式進(jìn)行分組,每個(gè)分組包含的BGP采集點(diǎn)數(shù)目為N;步驟S103,在每個(gè)分組中,分別采用AS
?
Rank算法對(duì)分組中每個(gè)BGP采集點(diǎn)所采集到的AS之間的路徑信息進(jìn)行計(jì)算,獲得對(duì)應(yīng)的AS連接之間的第一關(guān)系;步驟S104,在每個(gè)分組中,采用集成學(xué)習(xí)方式對(duì)分組內(nèi)所有BGP采集點(diǎn)計(jì)算獲得的同一個(gè)AS連接之間的第一關(guān)系逐一進(jìn)行投票判定,將投票結(jié)果最高的AS連接之間的第一關(guān)系判定為一致性AS連接關(guān)系,并將這些一致性AS連接關(guān)系劃分到一致性AS連接關(guān)系集合中,其他的AS連接關(guān)系暫時(shí)劃分到無(wú)法判定的AS連接關(guān)系集合中。3.根據(jù)權(quán)利要求2所述的一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,其特征在于,所述步驟S102中每個(gè)分組包含的BGP采集點(diǎn)數(shù)目N設(shè)置如下:步驟S1021,從CAIDA國(guó)際測(cè)量組織中下載其所公開的已知AS連接關(guān)系,并將這些已知AS連接關(guān)系作為基準(zhǔn)數(shù)據(jù)集;步驟S1022,針對(duì)步驟S101中獲得的每個(gè)BGP采集點(diǎn),采用AS
?
Rank算法計(jì)算所述基準(zhǔn)數(shù)據(jù)集中各個(gè)AS連接之間的第二關(guān)系,將所述AS連接之間的第二關(guān)系與基準(zhǔn)數(shù)據(jù)集中對(duì)應(yīng)AS連接關(guān)系進(jìn)行比較,獲得BGP采集點(diǎn)判斷對(duì)應(yīng)AS連接關(guān)系的誤判率以及BGP采集點(diǎn)判斷基準(zhǔn)數(shù)據(jù)集中所有AS連接關(guān)系的平均誤判率p;步驟S1023,利用二項(xiàng)式定理進(jìn)行評(píng)估,確定每個(gè)分組中BGP采集點(diǎn)的數(shù)目N。4.根據(jù)權(quán)利要求3所述的一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,其特征在于,步驟S1023包括:以至少有一半的BGP采集點(diǎn)數(shù)能夠正確判定AS連接關(guān)系的概率不低于95%為目標(biāo),確定每個(gè)分組中BGP采集點(diǎn)的數(shù)目N,公式如下:arg min(N)其中,X表示能夠正確判定AS連接關(guān)系的BGP采集點(diǎn)數(shù)目,表示至少有一半的BGP采集點(diǎn)數(shù)能夠正確判定AS連接關(guān)系的概率。
5.根據(jù)權(quán)利要求4所述的一種基于不完全信息推斷互聯(lián)網(wǎng)AS連接關(guān)系的方法,其特征在于,步驟S2包括以下步驟:步驟S201,各個(gè)分組對(duì)一致性AS連接關(guān)系集合中的同一個(gè)AS...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:蔡冰,嵇程,邢欣,張麗霞,袁藝,
申請(qǐng)(專利權(quán))人:國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心江蘇分中心,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。