• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

张祯毅 (张祯毅.) [1] | 黄捷 (黄捷.) [2] (Scholars:黄捷)

Indexed by:

PKU CSCD

Abstract:

针对多差速机器人系统提出了一种基于试错学习的多智能体强化学习任务监管器。此方法解决了基于行为的多智能体系统总是依赖人的智能设计切换规则以决策行为优先级的问题。首先,在零空间行为控制框架下引入了差速模型代替质点模型,首次推导了具有非完整约束的零空间行为控制范式,从而提升了系统对最小极值状态的鲁棒性。然后,首次将行为优先级切换问题建模为协作式马尔可夫博弈问题,学习了一个最优的联合策略以动态且智能地决策行为优先级,不仅避免了人工设计切换规则,而且降低了在线计算和存储负担。仿真结果显示,所提出多智能体强化学习任务监管器具有优越的行为优先级切换性能。在AgileX Limo系列多差速机器人系统上的成功应用,验证了该任务监管器的实用性。

Keyword:

任务监管器 差速机器人 强化学习 智能决策 行为控制

Community:

  • [ 1 ] 福州大学电气工程与自动化学院
  • [ 2 ] 福州大学5G+工业互联网研究院

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

机器人

Year: 2024

Issue: 04

Volume: 46

Page: 397-413,424

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 5

Online/Total:142/10016070
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1