【技術實現(xiàn)步驟摘要】
本專利技術涉及車聯(lián)網(wǎng)通信,尤其涉及一種基于深度強化學習的車輛自組網(wǎng)系統(tǒng)及方法。
技術介紹
1、隨著智能網(wǎng)聯(lián)汽車icv技術的快速發(fā)展,車輛間通信v2x已成為提升交通安全性、優(yōu)化道路利用率和增強智能交通系統(tǒng)its性能的關鍵技術。v2x通信能夠實現(xiàn)車輛與其他交通參與者(包括其他車輛、基礎設施、行人等)的信息交互,以支持車輛編隊、自主駕駛、碰撞預警等應用。然而,現(xiàn)有的v2x通信系統(tǒng)在實際部署中仍然面臨諸多技術挑戰(zhàn),尤其是在動態(tài)網(wǎng)絡環(huán)境下,如何確保數(shù)據(jù)的高效傳輸、穩(wěn)定連接和安全性,仍然是當前研究的重點。
2、盡管傳統(tǒng)的v2x通信系統(tǒng)在一定程度上提高了車輛間的信息交互能力,但仍然存在多個問題。首先,網(wǎng)絡拓撲的動態(tài)變化導致路由不穩(wěn)定,由于車輛的移動性,傳統(tǒng)的靜態(tài)或半動態(tài)路由協(xié)議難以快速適應拓撲變化,容易造成通信鏈路斷裂,影響數(shù)據(jù)傳輸?shù)目煽啃浴F浯危嗵鴤鬏數(shù)男实停W(wǎng)絡擁塞嚴重,當單跳通信信號衰減時,數(shù)據(jù)需經(jīng)過多個中繼節(jié)點傳輸,但現(xiàn)有的中繼機制缺乏智能化優(yōu)化,可能導致跳數(shù)過多,增加時延并引發(fā)網(wǎng)絡擁堵。此外,現(xiàn)有的異構網(wǎng)絡切換方式不夠智能,v2x系統(tǒng)與wi-fi?6等通信技術雖然具備互補性,但在協(xié)議切換時仍依賴固定閾值,難以適應復雜的網(wǎng)絡環(huán)境,導致通信質量下降。同時,現(xiàn)有v2x系統(tǒng)的高精度定位能力受限,傳統(tǒng)gps定位在高樓密集區(qū)、隧道等復雜環(huán)境中易受干擾,難以提供高精度的相對定位信息,影響車輛編隊和協(xié)同感知的效果。最后,由于v2x通信的開放性,系統(tǒng)在數(shù)據(jù)安全性和可信性方面存在風險,惡意節(jié)點可能通過偽造身份或中間人攻擊干擾通信,現(xiàn)有的
技術實現(xiàn)思路
1、針對上述問題,本專利技術提出了一種基于深度強化學習的車輛自組網(wǎng)系統(tǒng)及方法,通過深度強化學習優(yōu)化網(wǎng)絡拓撲管理、智能中繼傳輸、協(xié)議動態(tài)切換、高精度定位融合和區(qū)塊鏈安全驗證,實現(xiàn)了更高效、安全和穩(wěn)定的車輛自組網(wǎng)系統(tǒng),進一步提升了智能網(wǎng)聯(lián)汽車的通信能力和交通系統(tǒng)的整體運行效率。
2、為了實現(xiàn)上述目的,本專利技術通過如下的技術方案來實現(xiàn):
3、一種基于深度強化學習的車輛自組網(wǎng)系統(tǒng),包括:
4、動態(tài)路由模塊,用于通過深度強化學習算法實時采集車輛密度、信號強度及網(wǎng)絡負載數(shù)據(jù),根據(jù)所述數(shù)據(jù)選擇中繼節(jié)點并自適應調整多跳路徑,其中路徑調整的跳數(shù)上限依據(jù)網(wǎng)絡負載情況動態(tài)優(yōu)化;
5、中繼信號傳輸模塊,用于在信號強度低于預設閾值時,通過動態(tài)路由模塊提供的路徑選擇結果,構建多跳中繼鏈路,并通過無線傳播借用其他車輛的網(wǎng)絡信號;
6、多模通信模塊,用于根據(jù)車輛所在的網(wǎng)絡環(huán)境和信號強度,智能切換v2x通信協(xié)議與wi-fi?6通信協(xié)議;
7、定位協(xié)同模塊,用于融合車輛間的定位數(shù)據(jù),包括利用uwb技術和imu傳感器數(shù)據(jù)生成高精度的車輛間相對定位信息,并基于此信息進行定位協(xié)同;
8、安全驗證模塊,用于保護系統(tǒng)中傳輸?shù)臄?shù)據(jù)的安全性,采用加密算法對數(shù)據(jù)進行加密,驗證中繼節(jié)點的身份,利用區(qū)塊鏈智能合約機制確保身份驗證的有效性和不可篡改性;
9、通信控制模塊,用于在基于深度強化學習的車輛自組網(wǎng)系統(tǒng)中協(xié)調數(shù)據(jù)傳輸、路徑選擇和通信協(xié)議。
10、作為本專利技術的一種優(yōu)選方案,所述動態(tài)路由模塊包括:
11、信號采集單元,用于實時采集車輛密度、信號強度rssi及網(wǎng)絡負載數(shù)據(jù),采樣周期為100毫秒,其中?rssi閾值范圍根據(jù)車輛密度進行調整,在車輛密度高時,rssi閾值范圍設置在低范圍;在車輛密度低時,rssi閾值范圍設置在高范圍;
12、策略決策單元,采用深度q網(wǎng)絡dqn算法,輸入?yún)?shù)包括rssi閾值范圍、帶寬占用率閾值范圍,根據(jù)輸入?yún)?shù)輸出中繼節(jié)點選擇及跳數(shù)分配策略;
13、指令執(zhí)行單元,根據(jù)策略決策單元輸出的中繼節(jié)點選擇和跳數(shù)分配策略,構建中繼鏈路,并根據(jù)網(wǎng)絡負載率調整跳數(shù)上限,當網(wǎng)絡負載率連續(xù)三個采樣周期超過預設值時,跳數(shù)上限為預設值;當網(wǎng)絡負載率連續(xù)三個采樣周期不超過預設值時,跳數(shù)上限為另一個預設值。
14、作為本專利技術的一種優(yōu)選方案,所述策略決策單元基于改進的深度q網(wǎng)絡(dqn)算法,構建自適應路徑優(yōu)化模型,以解決現(xiàn)有技術中路徑選擇固化、動態(tài)調整能力不足、計算復雜度高的問題,優(yōu)化信道資源分配及傳輸路徑,并采用以下獎勵函數(shù):
15、;
16、其中::基于v2x通信的車輛間信道質量指示值,動態(tài)權衡中繼節(jié)點選擇的通信質量;
17、:自適應調整的最低信道質量閾值,保證不同場景下的網(wǎng)絡穩(wěn)定性;:當前信道負載,通過強化學習動態(tài)優(yōu)化帶寬資源分配,減少信道擁塞;:信道的最大可用帶寬,在復雜車載網(wǎng)絡環(huán)境下自適應調整負載均衡策略;:車輛間相對速度變化量,采用非線性指數(shù)函數(shù)調整路徑穩(wěn)定性權重,減少高速移動導致的通信斷裂;:車輛群組的平均速度,以優(yōu)化數(shù)據(jù)傳輸?shù)姆€(wěn)定性,使得路徑選擇更加智能;:最大通信可達距離,結合信道狀態(tài)自適應調整,提高網(wǎng)絡覆蓋范圍;:當前鏈路的通信時延,采用時延優(yōu)化策略,降低多跳傳輸?shù)睦塾嫊r延;:數(shù)據(jù)包的跳數(shù),通過強化學習方法自動優(yōu)化跳數(shù),以減少累積丟包率;、、、、:用于調整各參數(shù)權重的自適應優(yōu)化系數(shù),使得網(wǎng)絡在不同車載環(huán)境下動態(tài)調整優(yōu)化策略。
18、所述策略決策單元基于該獎勵函數(shù),采用強化學習動態(tài)優(yōu)化路徑選擇,使得系統(tǒng)能夠實時感知通信環(huán)境、智能調整信道負載分配,并優(yōu)化中繼節(jié)點選擇及跳數(shù),以降低時延、提高鏈路穩(wěn)定性和提升數(shù)據(jù)吞吐量。相比現(xiàn)有基于靜態(tài)閾值或固定優(yōu)化策略的路徑優(yōu)化方法,本專利技術的自適應路徑優(yōu)化模型能夠根據(jù)不同車載網(wǎng)絡條件動態(tài)優(yōu)化通信路徑,在保證網(wǎng)絡穩(wěn)定性的同時減少計算復雜度,適用于車載邊緣計算環(huán)境,提高了系統(tǒng)的實時性和計算效率。
19、作為本專利技術的一種優(yōu)選方案,所述中繼信號傳輸模塊包括:
20、信號強度檢測單元,用于實時檢測當前車輛的信號強度,當信號強度低于預設的信號強度閾值時,觸發(fā)中繼信號傳輸功能;
21、中繼路徑選擇單元,根據(jù)動態(tài)路由模塊提供的路徑選擇結果,選擇合適的中繼節(jié)點進行中繼鏈路構建;
22、無線傳播單元,用于通過無線傳播借用其他車輛的網(wǎng)絡信號,實現(xiàn)多跳中繼鏈路,并通過中繼鏈路將網(wǎng)絡信號回傳至當前車輛或其他需要網(wǎng)絡資源的車輛。
23、作為本專利技術的一種優(yōu)選方案,所述多模通信模塊包括:
24、協(xié)議切換單元,用于根據(jù)網(wǎng)絡環(huán)境和可用信號強度,選擇v2x通信協(xié)議與wi-fi?6通信協(xié)議中的一種進行切換,所述v2x通信協(xié)議的工作頻段為5.9ghz,wi-fi?6通信協(xié)議的工作頻段為5ghz或6ghz,并且兩者的頻段間隔不小于200mhz;
25、信號強度監(jiān)測單元,用于實時監(jiān)測當前信號強度,當信號強度低于預設閾值時,切換至其他通信協(xié)議進行數(shù)據(jù)傳輸;
26、協(xié)議適應策略單元,根據(jù)車輛與其他車輛的距離、帶寬需求和信號穩(wěn)定性,選擇通信協(xié)議進行數(shù)據(jù)傳輸。
27、作為本專利技術的本文檔來自技高網(wǎng)...
【技術保護點】
1.一種基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,包括:
2.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述動態(tài)路由模塊包括:
3.根據(jù)權利要求2所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述策略決策單元基于改進的深度Q網(wǎng)絡DQN算法,構建自適應路徑優(yōu)化模型,優(yōu)化信道資源分配及傳輸路徑,并采用以下獎勵函數(shù):
4.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述中繼信號傳輸模塊包括:
5.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述多模通信模塊包括:
6.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述定位協(xié)同模塊包括:
7.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述安全驗證模塊包括:
8.根據(jù)權利要求7所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述區(qū)塊鏈智能合約包括:
9.根據(jù)權利要求1-8中任一項所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng)的車輛
10.根據(jù)權利要求9所述的基于深度強化學習的車輛自組網(wǎng)方法,其特征在于,進一步包括:基于車輛間的實時相對位置數(shù)據(jù),采用加權因子計算候選中繼節(jié)點的優(yōu)先級,并調整路徑選擇策略;
...【技術特征摘要】
1.一種基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,包括:
2.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述動態(tài)路由模塊包括:
3.根據(jù)權利要求2所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述策略決策單元基于改進的深度q網(wǎng)絡dqn算法,構建自適應路徑優(yōu)化模型,優(yōu)化信道資源分配及傳輸路徑,并采用以下獎勵函數(shù):
4.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述中繼信號傳輸模塊包括:
5.根據(jù)權利要求1所述的基于深度強化學習的車輛自組網(wǎng)系統(tǒng),其特征在于,所述多模通信模塊包括:
6.根據(jù)權...
【專利技術屬性】
技術研發(fā)人員:張明俊,
申請(專利權)人:潤芯微科技江蘇有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。