在多智能体强化学习无人机穿越森林项目中,我主导开发 CEL-MADDPG 算法框架,通过融合课程学习与多网络集成策略,解决传统算法在复杂动态环境中训练效率低与协同策略鲁棒性不足的问题。构建含随机障碍物、通信遮挡和传感器噪声的森林仿真环境,将穿越任务分解为目标跟踪与队形维持子任务,利用分层奖励函数引导智能体学习协同策略,结合相对经验学习与优先经验回放双重筛选机制提升样本利用效率。实验显示,改进算法在静态、动态及混合障碍物环境中表现优异,在 20 棵障碍物的动态场景中成功率达 89%,有效提升无人机群体协同避障能力与环境适应性,相关技术为智慧林业、应急救援等领域提供技术支撑。