基于多智能体近端策略优化的多信道动态频谱接入 - Details

author：

陈平平 (陈平平.) ^[1] | 张旭 (张旭.) ^[2] | 谢肇鹏 (谢肇鹏.) ^[3] | 丘毓萍 (丘毓萍.) ^[4] | 方毅 (方毅.) ^[5]

Indexed by：

EI Scopus

Abstract：

为了在多用户多信道通信场景中应用动态频谱接入(Dynamic　Spectrum　Access,DSA)技术提高通信效率,保证用户公平,本文基于多智能体近端策略优化(Multi-Agent　Proximal　Policy　Optimization,MAPPO)提出了MAPPO-DSA算法.该算法首先针对单信道接入在多个信道同时空闲时存在的频谱浪费问题,使用多信道接入作为解决方案.同时,多信道接入导致状态空间与动作空间指数增长,计算成本高,学习难度大.为此本文引入MAPPO深度强化学习(Deep　Reinforcement　Learning,DRL)算法,在复杂环境中高效学习和优化接入策略.通过设计优化MAPPO中观测及奖励等强化学习要素和共享网络参数来保证用户公平.最后,在不同场景下的实验结果表明,所提出的MAPPO-DSA能够学习到近似最优的接入策略,部分场景中的网络吞吐量逼近理论上限,显著优于现有算法,且有效保证用户公平.

Keyword：

动态频谱接入多信道接入多智能体近端优化深度强化学习

Community：

[ 1 ] [丘毓萍]福州大学
[ 2 ] [张旭]福州大学
[ 3 ] [方毅]广东工业大学
[ 4 ] [陈平平]福州大学
[ 5 ] [谢肇鹏]福州大学

Reprint 's Address：

Email：

Show more details

Version：

Related Keywords：

Source ：

电子学报

ISSN： 0372-2112

Year： 2024

Issue： 6

Volume： 52

Page： 1824-1831

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 12

Affiliated Colleges：

物理与信息工程学院、微电子学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to