211硕士学历,经常使用Python语言,pytorch、tensorflow框架做深度学习算法,也可以用python语言做代码编程,擅长做项目开发,项目管理以及与客户沟通,也可以用python语言做代码编程,擅长做项目开发,项目管理以及与客户沟通
多智能体强化学习算法---一区论文
面向未知海域的多智能体协同探索--挑战杯全国特等奖队长
多智能体强化学习算法---一区论文
面向未知海域的多智能体协同探索--挑战杯全国特等奖队长
图中从左到右分别是区域信息采集系统的不同时刻状态,在图(a) 中,左侧的八个 小船代表八个用IC MARL 算法模型控制的智能体,智能体的数目是可以动态修改 的,蓝色的八边形框代表的是目标海域,在本章中范围大小是3x5 海里,在系统运行的 整个过程中,智能体不能离开该区
右侧的模块则代表的是T_QMIX 算法种QMIX 的核心,这是一种超网络(hyper network)结构,这样设计的目的是尽可能多的利用到系统场景的全局状态信息,主要的 网络层是全连接MLP 层,st 代表的是在t 时刻系统场景的全局状态信息,Qa( a; at )(
右侧的模块则代表的是T_QMIX 算法种QMIX 的核心,这是一种超网络(hyper network)结构,这样设计的目的是尽可能多的利用到系统场景的全局状态信息,主要的 网络层是全连接MLP 层,st 代表的是在t 时刻系统场景的全局状态信息,Qa( a; at )(