我目前工作,主要服务于计算机视觉和深度学习相关的项目,同时也具备一定的全栈交付能力。
模型训练与深度学习:
熟悉深度学习模型的全流程开发,包括数据清洗与标注、模型选型与结构设计、训练调参、模型量化压缩以及推理部署。常用框架为 PyTorch ,有过图像分类、目标检测、语义分割等任务的实践经验。能够根据业务场景选择合适的预训练模型进行微调
,具备基本的分布式训练使用经验,了解 ONNX、TensorRT 等推理优化工具的常规用法。
视觉算法: 这是我主要的技术方向。熟悉 OpenCV 等常用图像处理库,掌握图像预处理、特征提取、图像配准、目标跟踪等基础算法
。在工业视觉检测、安防监控等场景中有实际项目积累,能够独立完成从算法选型、原型验证到工程落地的完整链路。对经典视觉算法
和基于深度学习的方法都有一定的理解,能够根据实际需求在两者之间做合理取舍。
前端开发: 具备基本的前端开发能力,熟悉 HTML/CSS/JavaScript 技术栈,使用过 React/Vue 等主流框架。能够独立搭建简单的前
端页面和数据可视化看板,用于算法效果的展示和调试。虽然不是专业前端工程师,但日常开发中的常见需求和接口联调都可以胜任。
整体风格是实用导向,注重方案的可行性和交付效率,遇到不熟悉的领域会主动学习并快速上手。
工业零件缺陷检测系统(视觉算法 + 模型训练)
为某制造企业开发了一套基于深度学习的零件表面缺陷检测系统。项目中使用 PyTorch 搭建了基于 ResNet 和 EfficientNet
的分类模型,结合目标检测框架(YOLOv8)对划痕、凹坑、毛刺等常见缺陷进行定位与识别。数据集规模约 5
万张,涉及类别不平衡、小目标检测等问题,通过数据增强、Focal Loss
和多尺度训练等策略有效提升了检测精度。最终模型在测试集上 mAP 达到 92% 以上,推理速度满足产线实时要求,使用 TensorRT部署在边缘设备上稳定运行。这个项目让我完整走通了从数据准备、模型训练到工程部署的全流程。
智慧安防行人属性识别(视觉算法)
参与了一个园区安防监控场景下的行人属性识别项目,需要从监控视频流中实时提取行人的性别、年龄段、衣着颜色、背包等属性信息
。基于轻量级 CNN 架构设计了一个多任务学习模型,在多个公开数据集上完成预训练后,针对项目实际场景的数据进行微调。项目中
处理了大量的低质量监控图像,在图像增强和模型鲁棒性方面积累了不少经验。最终模型在嵌入式设备上达到了 15fps
以上的推理速度,属性识别准确率满足业务需求。