一種基于DQN的移動機(jī)器人復(fù)雜環(huán)境路徑規(guī)劃方法,涉及路徑規(guī)劃領(lǐng)域,包括以下步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、設(shè)計深度Q網(wǎng)絡(luò)、設(shè)計獎勵函數(shù)和路徑規(guī)劃。本發(fā)明使用機(jī)器人的狀態(tài)信息對深度Q網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使其學(xué)習(xí)到通過環(huán)境信息來選擇動作策略的能力,具...