短期开发任务,需要在2个月内完成交付验收。报酬可谈!
针对接单的工程师,需要进行提前的线下或线上的沟通确认后进行任务配发。完成任务后进行一次性结清或者根据项目进度阶段性支付报酬;
【岗位职责】
1.负责电商穿搭场景下的单图人物视频驱动算法研发,实现基于用户任意静态全身照(人像与穿搭不固定),自动生成指定动作(如旋转、挥手等)的展示短视频。
2.针对业务对算力成本与时效性的严苛要求,负责轻量化模型的设计与落地。探索并应用非大模型依赖的高效技术方案(如基于 2D 运动迁移、3D 人体先验驱动等),替代高消耗的传统视频生成大模型。
3.攻克单图驱动中的核心难点,确保人物在大幅度或固定动作下,穿搭纹理、人物特征的高度保真,同时保证背景画面的稳定,解决转身、遮挡等场景下的画面撕裂或伪影问题。
4.负责算法的工程化部署与性能优化,通过模型剪枝、量化、推理加速等手段,实现低延迟的视频生成,满足线上业务的实时性需求。
【任职要求】
1.本科及以上学历,计算机、人工智能、数学、自动化等相关专业优先(专业不做硬性限制,能力突出者不限专业)。
2.具备扎实的深度学习与计算机视觉基础,熟练掌握 PyTorch / TensorFlow 等主流框架,拥有优秀的 Python/C++ 编程与工程落地能力。
3.核心技术经验(满足以下任意一项即可):
(1)熟悉人物动画驱动领域的主流算法(如 First Order Motion Model, TPS, LivePortrait 等),有单图驱动视频生成的实际项目经验;
(2)熟悉 3D 人体重建与驱动技术(如 SMPL/SMPL-X 模型),了解如何将 3D 先验知识应用于 2D 人物动作生成,能解决大幅度动作(如转身)下的视觉连续性问题;
(3)具备极强的模型轻量化与推理加速能力,熟悉模型蒸馏、剪枝、量化以及 TensorRT、ONNX 等部署工具,有在低算力环境下落地 AI 模型的经验。
4.具备良好的技术调研与问题解决能力,能够结合业务需求,独立探索并验证“固定动作、任意人像”的高效生成技术路线。
【加分项】
1.有虚拟试衣、数字人驱动、电商 AIGC 视频应用等实际业务落地经验。
2.熟悉 FFmpeg、OpenCV 等音视频处理工具,了解图形学渲染管线。
3.在 CVPR, ICCV, SIGGRAPH 等顶级会议发表过人物动画、神经渲染相关论文,或在 GitHub 有高质量的相关开源项目。