端侧AI优化专家:主导过亿级MAU的图像算法项目,4K图像端侧处理仅15ms/帧,速度超行业标准1.8倍
多模态/AIGC落地:实现CLIP图文对比预训练优化,部署Stable Diffusion,参数量压缩42%同时精度提升12%
全栈交付能力:具备后端(Java/Go/Python)、前端(Vue/React/Uniapp)、小程序、独立站全栈开发能力,可独立完成AI应用从0到1构建
质量保障体系:主导过推荐算法全链路质量体系,支撑月均营收增长2500万+
多模态图像风格迁移系统 - 核心算法负责人(2025.01-至今)
技术挑战:端侧实时滤镜需同时满足4K画质、15ms延迟和语义保留,行业平均精度仅81.7%
解决方案:设计双分支动态解耦网络(轻量化VGG+改进SE注意力),通过三元组损失优化特征分离度
工程落地:针对端侧NPU定制算子融合策略,实现4K输入实时处理(15ms/帧,速度超竞品1.8倍)
业务成果:支撑视频/社交类场景的"实时滤镜+语义保留"需求,功能MAU破1.2亿,直接带动产品销量提升18%
全栈延伸:将该算法封装为RESTful API,并开发微信小程序Demo验证效果,实现算法到应用的全链路打通
空间感知实时图像增强算法 - 核心设计者(2024.08-2024.12)
技术创新:首创"轻量级多权重预测器+空间感知3D LUT"架构,解决传统3D LUT空间信息缺失导致的增强失真
性能突破:4K图像在V100上处理仅4ms,速度超SOTA方法2个数量级,能效比行业第一
开源验证:在DIV2K及业务数据集(手机摄像/自动驾驶)中,PSNR/SSIM提升15%-20%
业务价值:已在手机摄像、车载ISP场景验证,支持终端低算力部署(适配亿级设备)
全栈能力:开发Web端实时演示系统(Vue+Flask),直观展示算法效果,助力商务洽谈
AIGC内容生成与评估系统 - 算法核心研发(2022.08-2023.07)
多模态创新:基于MobileNetV3融合视觉特征(主观美学+基础质量)和文本描述(风格标签),创新动态特征筛选策略,跨模态匹配精度提升12%
端侧优化:针对移动端资源约束,通过模型蒸馏+算子深度优化,参数量压缩42%至460万,推理速度120ms/帧
业务价值:支撑23亿用户获得更精准的AIGC内容推荐(点击率+28%),技术成为团队端侧AIGC评估标准方案
全栈应用:开发AIGC内容生成Web应用(React+FastAPI),集成多种生成模型,支持用户在线创作
电商搜索推荐算法质量保障体系 - 技术负责人(2020.07-2022.07)
体系建设:主导构建覆盖召回、粗排、精排、重排的全链路质量保障体系,设计12+项核心指标监控评估框架
算法迭代:基于500万用户日志与A/B实验,推动模型从FM升级至DeepFM,推荐准确率+23%、冷启动召回率+40%
性能优化:设计分布式压测(10万+ QPS),定位系统瓶颈,使排序延迟从500ms降至80ms,缺陷率从0.35%压至0.02%
业务价值:支撑20+版本迭代,月均营收增2500万+
技术栈:Java SpringBoot、Vue.js、Redis、Kafka、MySQL、Elasticsearch
这是一款面向短视频、直播和动图制作场景的实时AI色彩迁移系统。用户上传任意视频或动图,选择目标风格图像,系统即可在毫秒级内将风格色彩迁移至原内容,同时精准保留人脸、天空、物体等语义信息,避免传统滤镜导致的颜色失真或语义混淆。
本作品聚焦电子制造行业 PCB 质检的核心痛点,针对传统人工目检主观性强、漏检率高,单一视觉检测无法覆盖 “外观缺陷 + 隐性发热故障” 的行业难题,研发了一套双模态融合的 PCB 元器件故障智能检测系统。 系统同步采集 PCB 的可见光高清外观图像与红外热成像温度数据,基于