12月8日上午,由研究生院/研究生工作部主辦、運(yùn)輸工程學(xué)院承辦、校研究生科學(xué)技術(shù)協(xié)會(huì)協(xié)辦的“虹”學(xué)講堂第528講在南校區(qū)東院伯聲報(bào)告廳舉行。西北工業(yè)大學(xué)周琛淏教授作題為“競(jìng)合模式下的水平運(yùn)輸充電與作業(yè)調(diào)度”的報(bào)告,相關(guān)學(xué)院共200余名師生參加講座。

周琛淏教授作報(bào)告
本次報(bào)告主要圍繞基于多智能體強(qiáng)化學(xué)習(xí)的水平運(yùn)輸充電與作業(yè)調(diào)度優(yōu)化和基于多智能體構(gòu)架的水平運(yùn)輸在線路徑優(yōu)化與仿真兩個(gè)方面展開。周琛淏教授提出了自動(dòng)導(dǎo)引車(AGV)任務(wù)分配的多智能體Q學(xué)習(xí)模型,該模型通過將每一個(gè)學(xué)習(xí)智能體與一臺(tái)AGV關(guān)聯(lián),實(shí)現(xiàn)智能體之間的信息交互,使每個(gè)智能體的學(xué)習(xí)過程既競(jìng)爭(zhēng)又合作,實(shí)現(xiàn)集中訓(xùn)練和分散執(zhí)行。針對(duì)隨機(jī)速度下的車輛充電與作業(yè)調(diào)度問題,周琛淏教授構(gòu)建了馬爾科夫決策過程模型,精確地反映車輛與環(huán)境間的動(dòng)態(tài)交互。周琛淏教授還引入了基于演員-評(píng)論家框架的多智能體深度強(qiáng)化學(xué)習(xí)算法,該算法克服了狀態(tài)空間巨大的問題,訓(xùn)練好的模型能夠適用于集裝箱碼頭不同規(guī)模的水平運(yùn)輸充電與作業(yè)調(diào)度實(shí)時(shí)求解。周琛淏教授針對(duì)在線路徑優(yōu)化提出了兩階段在線算法,并結(jié)合實(shí)際情況搭建了仿真平臺(tái),驗(yàn)證了該算法在大型復(fù)雜網(wǎng)絡(luò)交通中能夠科學(xué)高效地規(guī)劃車輛路徑,解決了大規(guī)模無死鎖車輛路徑規(guī)劃問題,證明了其落地應(yīng)用的可行性。
報(bào)告結(jié)束后,周琛淏教授回答了老師們和同學(xué)們的問題,使大家對(duì)競(jìng)合模式下的水平運(yùn)輸充電與作業(yè)調(diào)度有了更為深入的了解。
(審稿:胡錦玉 網(wǎng)絡(luò)編輯:和燕)