该作品为一个基于扩散模型的文本到 360 度全景图生成系统。系统能够根据用户输入的文本描述自动生成完整的全景场景图像,可用于虚拟场景构建、游戏环境原型设计以及沉浸式内容生成等应用场景。在系统设计中,通过引入几何感知约束与优化策略,RL算法,提升了全景图生成过程中的空间一致性,有效缓解了传统方法在全景投影下容易出现的边界不连续与几何畸变问题。
在项目实现过程中,主要负责模型训练与算法实现,并完成数据处理、模型推理以及生成流程的工程化实现。系统能够稳定生成具有较好结构一致性的全景图像,并具备一定的可扩展能力,可进一步用于三维场景重建或沉浸式内容生成相关应用。