具备扎实的计算机科学理论基础,熟练掌握Python与C++编程语言,深耕计算机视觉(CV)领域,聚焦目标检测、图像分割与人物ReID任务,拥有AI实习中的实战经验,能提供贴合实际场景的技术支持。
在目标检测方向,熟悉YOLOv3/v4、Faster R-CNN等模型的核心原理与实践应用。实习中参与过人物目标检测项目,负责使用YOLOx进行模型训练与调参。
图像分割领域,聚焦U-Net与Mask R-CNN模型的落地实践,理解Encoder-Decoder架构的特征提取与上采样逻辑。曾复现医疗影像分割任务,基于U-Net实现器官区域分割:通过调整网络深度(将Encoder层从4层扩展至5层)提升小区域捕捉能力,使用Dice损失函数解决类别不平衡问题。
人物ReID任务中,熟悉以ResNet50为backbone的特征提取流程,掌握基于度量学习的模型训练方法。实习中参与人物reid项目,负责行人特征向量的提取与匹配:通过优化样本采样策略(均衡不同场景下的行人样本比例),使用三元组损失函数训练模型,在测试集中实现Top-5匹配准确率达85%,并通过计算余弦距离完成实时特征比对,满足实际应用场景低延迟要求。
具备基础工程化能力,能用Python结合PyTorch搭建模型训练框架,编写数据加载、损失计算、指标评估等核心模块;熟练使用OpenCV进行图像预处理(如尺寸归一化、通道转换);掌握Linux环境下的模型训练流程,会用Git进行版本控制。
在目标检测方向,熟悉YOLOv3/v4、Faster R-CNN等模型的核心原理与实践应用。实习中参与过人物目标检测项目,负责使用YOLOx进行模型训练与调参。
图像分割领域,聚焦U-Net与Mask R-CNN模型的落地实践,理解Encoder-Decoder架构的特征提取与上采样逻辑。曾复现医疗影像分割任务,基于U-Net实现器官区域分割:通过调整网络深度(将Encoder层从4层扩展至5层)提升小区域捕捉能力,使用Dice损失函数解决类别不平衡问题。
人物ReID任务中,熟悉以ResNet50为backbone的特征提取流程,掌握基于度量学习的模型训练方法。实习中参与人物reid项目,负责行人特征向量的提取与匹配:通过优化样本采样策略(均衡不同场景下的行人样本比例),使用三元组损失函数训练模型,在测试集中实现Top-5匹配准确率达85%,并通过计算余弦距离完成实时特征比对,满足实际应用场景低延迟要求。
具备基础工程化能力,能用Python结合PyTorch搭建模型训练框架,编写数据加载、损失计算、指标评估等核心模块;熟练使用OpenCV进行图像预处理(如尺寸归一化、通道转换);掌握Linux环境下的模型训练流程,会用Git进行版本控制。