基于行为的多差速机器人强化学习任务监管器设计 - Details

author：

张祯毅 (张祯毅.) ^[1] | 黄捷 (黄捷.) ^[2] (Scholars：黄捷)

Indexed by：

PKU CSCD

Abstract：

针对多差速机器人系统提出了一种基于试错学习的多智能体强化学习任务监管器。此方法解决了基于行为的多智能体系统总是依赖人的智能设计切换规则以决策行为优先级的问题。首先，在零空间行为控制框架下引入了差速模型代替质点模型，首次推导了具有非完整约束的零空间行为控制范式，从而提升了系统对最小极值状态的鲁棒性。然后，首次将行为优先级切换问题建模为协作式马尔可夫博弈问题，学习了一个最优的联合策略以动态且智能地决策行为优先级，不仅避免了人工设计切换规则，而且降低了在线计算和存储负担。仿真结果显示，所提出多智能体强化学习任务监管器具有优越的行为优先级切换性能。在AgileX　Limo系列多差速机器人系统上的成功应用，验证了该任务监管器的实用性。

Keyword：

任务监管器差速机器人强化学习智能决策行为控制

Community：

[ 1 ] 福州大学电气工程与自动化学院
[ 2 ] 福州大学5G+工业互联网研究院

Reprint 's Address：

Email：

Show more details

Version：

基于行为的多差速机器人强化学习任务监管器设计
2024，机器人

Related Keywords：

面向智慧工厂的多仓储机器人路径规划仿真教学研究
2024，实验技术与管理
非线性二阶系统的多智能体强化学习行为控制
2024，Frontiers of Information Technology & Electronic Engineering
面向人—多机器人协同系统的带记忆强化学习行为控制任务管理器（英文）
2022，Frontiers of Information Technology & Electronic Engineering
Reinforcement Learning Mission Supervisor Design for Behavior-based Differential Drive Robots; [基于行为的多差速机器人强化学习任务监管器设计]
2024，Robot

Source ：

机器人

Year： 2024

Issue： 04

Volume： 46

Page： 397-413,424

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 5

Affiliated Colleges：

电气工程与自动化学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search CNKI

Type
Departments

All Years Choose Year From to