【技術實現步驟摘要】
本專利技術涉及智能交通,尤其涉及一種基于深度學習的智能網聯phev多行駛模式自主決策控制方法。
技術介紹
1、隨著智能交通系統its和人工智能技術的不斷發展,傳統汽車與智能網聯技術逐漸深入融合,被視為未來汽車發展的重要方向,大力發展智能網聯汽車成為了國際社會的共識。另一方面,智能網聯汽車綜合了自動駕駛和網絡互聯的優勢,研究車輛行駛模式的控制方法以提高智能網聯汽車的安全性、舒適性和能耗經濟性具有十分重要的意義。
2、目前,隨著交通場景的日益復雜以及智能網聯汽車icv和智能交通系統its的快速發展,傳統汽車通常依靠駕駛員經驗和傳統輔助駕駛系統來操控車輛行駛,并沒有深入的融合智能網聯信息,面對多變、復雜的路況,車輛在行駛中的安全性、舒適性以及能耗經濟性難以保證。
3、用于求解智能網聯汽車最優控制問題的方法主要包括基于規則、優化和學習等算法。基于規則邏輯的控制策略其適應性和靈活性較低,無法滿足復雜交通環境下的需求。基于優化的控制方法需要實時在線處理大量數據,對車載處理器要求很高,適應復雜的交通環境。基于深度強化學習理論在車輛自動駕駛領域的研究大多都是關于車輛跟隨行駛決策,對于在復雜交通環境下綜合考慮車輛的安全性、舒適性和能耗經濟性的研究仍需進一步深入。
技術實現思路
1、本專利技術的目的在于提供一種基于深度學習的智能網聯phev多行駛模式自主決策控制方法,解決現有技術中的基于深度強化學習理論在車輛自動駕駛領域的研究大多都是關于車輛跟隨行駛決策,對于在復雜交通環境下綜
2、2、為實現上述目的,本專利技術提供了一種基于深度學習的智能網聯phev多行駛模式自主決策控制方法,所述基于深度學習的智能網聯phev多行駛模式自主決策控制方法包括如下步驟:
3、s1:在智能網聯環境下構建三種交通場景,分別為巡航場景、跟馳場景和通行場景;
4、s2:利用its、gps和v2x技術,獲取道路交通信息和前方車輛的基本信息,并構建巡航智能網聯phev行駛模型、跟馳智能網聯phev行駛模型及通行智能網聯phev行駛模型,且采用考慮多目標函數的mpc算法求解最優行駛車速;
5、s3:基于ddpg算法搭建多目標行駛模式自主決策控制模型;
6、s4:采用下一代交通仿真項目的公開數據作為深度強化學習網絡訓練數據集,并提取其中的跟馳巡航數據集作為訓練集,進行算法訓練;
7、s5:智能體根據獲得的獎勵信號不斷調整策略,多次訓練優化后趨于穩定,使其探索到一種相對穩定的行為策略,并且該策略能夠在環境中獲得穩定的獎勵,最終達到訓練次數的最大值時訓練終止;
8、s6:使用訓練優化后的策略和基于規則式acc控制策略分別在同一典型工況和實際工況中進行仿真測試,并評估行駛模式自主決策控制策略的有效性和適應性。
9、其中,在步驟s2中,構建巡航智能網聯phev行駛模型、跟馳智能網聯phev行駛模型及通行智能網聯phev行駛模型的具體方法為:
10、巡航智能網聯phev行駛模型設計:在車輛處于巡航模式工作時,控制目標只需考慮速度與加速度,因此采用實時性較好,響應快速的pid算法來調節車速,以安全性、舒適性和能耗經濟性作為約束條件,基于pid控制實現對期望速度跟蹤;
11、跟馳智能網聯phev行駛模型設計:通過實時獲得的交通道路環境信息和前方車輛狀態信息,結合車輛安全間距策略以及縱向動力學模型,以后車的安全性、舒適性及能耗經濟性綜合最優為目標,基于模型預測控制控制策略對后車速度進行優化;
12、通行智能網聯phev行駛模型設計:依托智能網聯環境,根據獲取的信號燈信息和前車狀態信息進行目標速度的規劃,建立了基于rbf神經網絡的預測模型對前車速度進行預測,根據規劃的目標速度、與前車保持的安全距離為目標設計目標函數,同時根據車輛自身和道路的限制,對驅動轉矩、制動力和速度進行約束,基于非線性mpc對多目標優化問題進行求解。
13、其中,在步驟s3中,所述ddpg算法采用確定性策略梯度方法與actor-critic算法相結合,并且所述多目標行駛模式自主決策控制模型包括狀態空間、動作空間和獎勵函數。
14、其中,在步驟s3中,所述狀態空間、動作空間和獎勵函數的設計具體為:
15、狀態空間和動作空間的設計:當目標車輛在復雜交通環境中行駛時,期望行駛模式自主決策控制模型可以根據獲取到的周邊信息自主決策使用何種行駛模式;
16、在設計獎勵函數時,需考慮行駛安全性、經濟性和舒適性三個優化目標設計獎勵函數。
17、其中,在步驟s4中,算法訓練的具體步驟為:在matlab/simulink中搭建模型進行仿真實驗,采用下一代交通仿真項目的公開數據作為深度強化學習網絡訓練數據集,提高訓練質量。
18、其中,在步驟s6中,使用訓練優化后的策略和基于規則式acc控制策略分別在同一典型工況和實際工況中進行仿真測試具體包括典型工況仿真結果分析和實際工況仿真結果分析。
19、其中,在步驟s6中,典型工況仿真結果分析具體為:采用基于規則邏輯的acc控制策略在相同工況下進行仿真分析對比。
20、其中,在步驟s6中,實際工況仿真結果分析具體為:在真實交通場景中的泛化能理。
21、本專利技術的一種基于深度學習的智能網聯phev多行駛模式自主決策控制方法,通過構建巡航場景、跟馳場景和通行場景三種行駛模式,設計基于確定性策略梯度算法的狀態空間與動作空間,并針對行車安全性、乘車舒適性和能耗經濟構建多目標獎勵函數,利用馬爾可夫決策過程搭建多目標行駛模式自主決策控制模型,保證智能網聯phev在復雜環境下行駛時,可以通過自主決策不同的行駛模式從而規劃出最優目標車輛速度,實現智能網聯phev在行駛過程中安全性、通行性以及能耗經濟性綜合最優,進一步提高智能車輛在復雜交通環境中的決策能力。
本文檔來自技高網...【技術保護點】
1.一種基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,包括如下步驟:
2.如權利要求1所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
3.如權利要求2所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
4.如權利要求3所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
5.如權利要求4所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
6.如權利要求5所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
7.如權利要求6所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
8.如權利要求7所述的基于深度學習的智能網聯PHEV多行駛模式自主決策控制方法,其特征在于,
【技術特征摘要】
1.一種基于深度學習的智能網聯phev多行駛模式自主決策控制方法,其特征在于,包括如下步驟:
2.如權利要求1所述的基于深度學習的智能網聯phev多行駛模式自主決策控制方法,其特征在于,
3.如權利要求2所述的基于深度學習的智能網聯phev多行駛模式自主決策控制方法,其特征在于,
4.如權利要求3所述的基于深度學習的智能網聯phev多行駛模式自主決策控制方法,其特征在于,
...【專利技術屬性】
技術研發人員:雷貞貞,張帥,薛阿龍,董李法,張元建,施軍,孟杰,劉娟,
申請(專利權)人:重慶科技大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。