• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

颜梦玫 (颜梦玫.) [1] | 杨冬平 (杨冬平.) [2]

Indexed by:

PKU CSCD

Abstract:

平均场理论(MFT)为理解深度神经网络(DNN)的运行机制提供了非常深刻的见解,可以从理论上指导深度学习的工程设计.近年来,越来越多的研究人员开始投入DNN的理论研究,特别是基于MFT的一系列工作引起人们的广泛关注.为此,对深度神经网络平均场理论相关的研究内容进行综述,主要从初始化、训练过程和泛化性能这三个基本方面介绍最新的理论研究成果.在此基础上,介绍了混沌边缘和动力等距初始化的相关概念、相关特性和具体应用,分析了过参数网络以及相关等价网络的训练特性,并对不同网络架构的泛化性能进行理论分析,体现了平均场理论是理解深度神经网络机理的非常重要的基本理论方法.最后,总结了深度神经网络中初始、训练和泛化阶段的平均场理论面临的主要挑战和未来研究方向.

Keyword:

动力学 平均场理论 泛化性 深度神经网络 随机初始化

Community:

  • [ 1 ] [颜梦玫]福州大学 先进制造学院,福建 泉州 362000;中国科学院海西研究院 泉州装备制造研究中心, 福建 泉州 362200;之江实验室 混合增强智能研究中心,杭州 311101
  • [ 2 ] [杨冬平]中国科学院海西研究院 泉州装备制造研究中心, 福建 泉州 362200;之江实验室 混合增强智能研究中心,杭州 311101

Reprint 's Address:

Email:

Show more details

Version:

Related Keywords:

Source :

计算机应用

ISSN: 1001-9081

CN: 51-1307/TP

Year: 2024

Issue: 2

Volume: 44

Page: 331-343

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 11

Online/Total:59/10027541
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1