ID:402445

安迪

AI研发工程师

  • 公司信息:
  • 桂林谷科林科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 广州
  • 荔湾

技术能力

课程项目:基于 PyTorch 的图像分类模型实现 | 2024.03 - 2024.6
跟随课程要求,使用 Python 与 PyTorch 完成简易图像分类任务,基于 CIFAR-10 数据集搭建基础 CNN 模型(含卷积层、池化层、全连接层),编写训练脚本实现数据加载、前向传播与反向传播,通过调整学习率(0.01→0.001)和迭代次数(50→80),使模型准确率从 65% 提升至 78%。
独立完成数据预处理流程:使用 Pandas 清洗数据集标签,用 OpenCV 对图像进行简单增强(如尺寸统一、灰度化),通过 Matplotlib 可视化样本分布,理解数据分布对模型效果的影响,形成完整的 "数据 - 模型 - 训练" 实验报告。
数据标注实践:校园植物图像数据集整理 | 2023.10 - 2023.12
参与校内 AI 社团的植物识别项目,负责 1000 张校园植物图像的标注工作,使用 LabelImg 工具标注植物类别与轮廓框,制定基础标注规则(如区分乔木 / 灌木、明确框选范围),通过交叉检查将标注错误率控制在 8% 以内。
用 Python 脚本批量处理标注数据:编写简单代码校验标注文件格式(XML 转 JSON),统计各类别样本数量,发现样本不均衡问题后,手动补充 200 张稀缺类别的植物图像,为后续模型训练提供更均衡的数据集。
自学实践:PyTorch 基础训练框架搭建
自学 PyTorch 官方教程,独立搭建简易训练框架:实现数据加载器(DataLoader)、损失函数(交叉熵)、优化器(SGD/Adam)的调用,完成 MNIST 手写数字识别任务,通过调整 batch size(8→32)和激活函数(ReLU 替换 Sigmoid),缩短单轮训练时间 30%,最终测试集准确率达 95%。
记录训练过程中的参数变化与结果,用 Excel 绘制损失曲线和准确率变化图,分析过拟合现象(如训练集准确率 98% vs 测试集 85%),尝试添加 Dropout 层缓解,初步理解模型优化的基本思路。

项目经验

课程作业:基于 PyTorch 的手写数字识别模型训练​
跟随课程要求完成基础机器学习项目,使用 PyTorch 框架搭建简易神经网络,加载 MNIST 数据集并完成数据预处理(图像归一化、维度转换),通过调整网络层数(从 2 层增至 3 层)和隐藏层神经元数量(128→256),优化模型训练效果。​
独立编写训练脚本,实现损失函数(交叉熵)和优化器(SGD)的调用,记录 10 轮训练过程中的损失值变化,最终模型在测试集上的准确率达到 96%,比初始版本提升 8 个百分点。​
用 Matplotlib 绘制训练 / 测试准确率曲线,分析模型在数字 “8” 和 “9” 上易混淆的原因,尝试增加 500 条难例样本进行补充训练,初步理解数据质量对模型效果的影响。​
个人探索:校园花卉图像分类小项目​
出于对计算机视觉的兴趣,自主开展小型分类项目,收集校园内 5 种常见花卉图像共 800 张(每种 150-170 张),使用 LabelImg 工具完成类别标注,生成 Pascal VOC 格式标注文件。​
基于 PyTorch 搭建轻量级 CNN 模型,参考网上教程实现数据加载(自定义 Dataset 类)和简单数据增强(随机翻转、亮度调整),通过控制变量法测试不同学习率(0.01/0.001)对训练的影响,最终模型在验证集上准确率达 82%。​
整理项目过程形成技术文档,包含数据集介绍、模型结构设计图、训练参数记录表和结果分析,其中对 “月季” 与 “蔷薇” 分类混淆的问题提出可能的改进方向(增加花瓣细节特征标注),加深对 “数据 - 模型 - 结果” 关联关系的理解。​
社团实践:校园活动照片数据集整理与预处理​
参与校内 AI 社团的数据整理项目,负责 2000 张校园活动照片的分类与预处理,使用 Label Studio 标注照片中的场景类别(如运动会、晚会、讲座),通过 Excel 统计标注进度,确保两周内完成分配任务。​
用 Python 编写简单脚本(Pandas+OS 库)批量处理图像文件:统一调整尺寸至 224×224 像素,转换格式为 JPG,剔除模糊、重复的低质量样本 300 余张,处理后的数据按 8:2 比例划分为训练集和验证集,存储为模型可直接读取的格式。​
参与社团内部分享会,介绍数据预处理过程中遇到的格式转换问题及解决方法,获得学长学姐关于 “样本均衡性处理” 的建议,后续补充 50 张稀缺场景照片,为社团后续的图像分类模型训练提供基础数据支持。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服