我主导并全程参与了多行业内容作品分类分级大模型的落地实施项目,该项目支持图文、短视频、长视频、音频、直播流等全媒介内容的智能识别,覆盖政治敏感、低俗色情、暴力血腥、侵权盗版等 20 + 一级风险类别和 120 + 二级细分类目,同时实现合规等级自动评定、违规内容分级处置建议生成,支持自定义分类规则和分级标准的动态配置。
我主要负责从需求调研、大模型选型、领域数据标注体系搭建到模型微调训练的全流程技术工作;重点承担了私有化部署方案设计,完成了在阿里云 ECS 和本地 GPU 服务器上的分布式部署与性能优化,将单条内容推理延迟从 800ms 优化至 150ms 以内;负责上线后的持续实施调优,通过主动学习和难例挖掘机制每月迭代模型版本,将整体识别准确率从 92.3% 提升至 98.7%。项目已成功服务于多家互联网平台和文化传媒公司,日均处理内容量超 500 万条。