• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

陈平平 (陈平平.) [1] (Scholars:陈平平) | 张旭 (张旭.) [2] | 谢肇鹏 (谢肇鹏.) [3] | 丘毓萍 (丘毓萍.) [4] | 方毅 (方毅.) [5]

Abstract:

为了在多用户多信道通信场景中应用动态频谱接入(Dynamic Spectrum Access,DSA)技术提高通信效率,保证用户公平,本文基于多智能体近端策略优化(Multi-Agent Proximal Policy Optimization,MAPPO)提出了MAPPO-DSA算法.该算法首先针对单信道接入在多个信道同时空闲时存在的频谱浪费问题,使用多信道接入作为解决方案.同时,多信道接入导致状态空间与动作空间指数增长,计算成本高,学习难度大.为此本文引入MAPPO深度强化学习(Deep Reinforcement Learning,DRL)算法,在复杂环境中高效学习和优化接入策略.通过设计优化MAPPO中观测及奖励等强化学习要素和共享网络参数来保证用户公平.最后,在不同场景下的实验结果表明,所提出的MAPPO-DSA能够学习到近似最优的接入策略,部分场景中的网络吞吐量逼近理论上限,显著优于现有算法,且有效保证用户公平.

Keyword:

动态频谱接入 多信道接入 多智能体近端优化 深度强化学习

Community:

  • [ 1 ] 福州大学先进制造学院
  • [ 2 ] 福州大学物理与信息工程学院
  • [ 3 ] 广东工业大学信息工程学院

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

电子学报

Year: 2024

Issue: 06

Volume: 52

Page: 1824-1831

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 4

Online/Total:35/10138724
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1