ID:391723

🏹 身份已认证

  • 公司信息:
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 佛山
  • 全区
  • 大沥镇

技术能力

1. 编程语言与工具:熟练使用Python完成全流程开发,掌握Jupyter Notebook、PyCharm等开发环境,熟悉Git版本控制。

2. 图像识别技术:

◦ 传统方法:精通OpenCV库,掌握SIFT、ORB等特征提取算法,以及FLANN、BF匹配器。

◦ 深度学习:熟练运用PyTorch、TensorFlow框架,掌握ResNet、YOLO、U-Net等经典模型,擅长迁移学习、数据增强及模型压缩优化。

3. 数据挖掘与分析:

◦ 数据处理:熟练使用Pandas、Numpy进行数据清洗、特征工程,掌握PySpark处理大规模数据。

◦ 机器学习:精通Scikit-learn,熟悉LightGBM、XGBoost等模型,擅长分类、聚类、回归任务。

◦ 多模态融合:具备图像、文本、时序数据融合经验,掌握跨模态特征提取与模型构建。

4. 系统开发与部署:

◦ 服务搭建:使用FastAPI、Flask开发API接口,熟悉Docker容器化部署。

◦ 工程优化:掌握FAISS向量检索、Redis缓存,能利用MLflow进行实验管理与模型迭代。

5. 行业应用经验:

◦ 涵盖电商图像检索、工业缺陷检测、医学影像诊断、社交媒体分析等领域,熟悉对应业务场景与技术落地流程。

项目经验

项目一:基于深度学习的图像分类与检索系统开发

项目背景:
为某电商平台构建商品图像分类与以图搜图系统,解决海量商品图片(超100万张)的精准分类和相似商品检索需求,提升用户搜索效率和推荐准确性。

技术栈:

• 框架/库:PyTorch、TensorFlow、OpenCV、Scikit-learn

• 模型:ResNet50/101(迁移学习)、Faster R-CNN(目标检测)、Triplet Loss度量学习

• 数据处理:数据增强(MixUp/CutOut)、Mosaic数据合成、特征金字塔构建

• 工程优化:FAISS向量检索引擎、Docker容器化部署、GPU集群训练(NVIDIA A100)

负责内容:

1. 数据 pipeline 搭建:

◦ 设计图像标注流程,构建包含50万张标注数据的训练集,覆盖200+商品类别;

◦ 开发数据清洗脚本,通过OCR文本校验、跨模态哈希去重,将无效数据比例从15%降至3%。

2. 算法开发与优化:

◦ 基于ResNet101实现图像分类基线模型,通过知识蒸馏将模型参数量压缩40%,推理速度提升2.5倍;

◦ 引入度量学习(Triplet Loss + 难样本挖掘)构建图像特征向量,结合FAISS实现亿级特征向量的毫秒级检索,Top-5准确率达92%。

3. 系统集成与部署:

◦ 设计“特征提取-向量存储-检索匹配”三层架构,使用FastAPI搭建API服务,支持日均10万次检索请求;

◦ 实现模型动态更新机制,通过MLflow跟踪实验参数,迭代30+版本后整体检索召回率提升18%。

项目成果:

• 商品分类准确率从基线模型的78%提升至91.2%,以图搜图平均响应时间<200ms;

• 助力平台搜索转化率提升12%,人工标注成本降低50%,相关技术方案被纳入公司AI中台标准组件。

项目二:工业缺陷检测智能系统(图像+时序数据融合挖掘)

项目背景:
为某制造业企业开发生产线缺陷检测系统,针对机械零部件表面缺陷(划痕、裂纹等)及设备运行异常,实现实时检测与故障预警,替代传统人工目检和阈值报警方案。

技术栈:

• 多模态数据:机器视觉(工业相机采集RGB图像)、振动传感器(时序数据)

• 模型:YOLOv5(缺陷定位)、LSTM-AutoEncoder(时序异常检测)、特征融合网络

• 工具:Pandas(时序数据清洗)、PySpark(分布式特征工程)、TensorBoard(可视化)

负责内容:

1. 跨模态数据融合:

◦ 设计图像特征(HOG/SIFT)与时序特征(FFT频谱、均方根值)的融合策略,通过concat和注意力机制提升互补性;

◦ 构建包含8000+缺陷样本的图像数据集和20万条时序样本的混合数据集,设计分层抽样策略平衡正负样本。

2. 实时检测算法开发:

◦ 基于YOLOv5s实现缺陷定位,通过模型剪枝和量化压缩,在边缘计算设备(Jetson Nano)上实现30FPS实时检测;

◦ 针对振动数据设计LSTM-AutoEncoder异常检测模型,通过重构误差阈值判断设备运行状态,误报率从25%降至8%。

3. 工业级系统落地:

◦ 开发边缘端数据采集模块(Python + ROS),实现图像流和传感器数据的同步采集与预处理;

◦ 部署Flask服务与企业ERP系统对接,实时推送缺陷报告和设备预警信息,支持历史数据回溯与趋势分析。

项目成果:

• 表面缺陷检测准确率达95.6%,设备异常预警提前量平均提升4小时;

• 生产线人工检测成本降低70%,设备非计划停机时间减少35%,年节省生产成本超200万元。

项目三:医学影像智能诊断辅助系统(肺部CT结节检测)

项目背景:
与某三甲医院合作开发肺部CT结节辅助诊断系统,基于公开医学影像数据集(如LIDC-IDRI),实现结节自动检测与良恶性分类,缓解放射科医生读片压力。

技术栈:

• 医学影像处理:Monai、SimpleITK(三维图像分割)、Numpy(体数据处理)

• 模型:3D U-Net(结节分割)、ResNet3D(分类)、注意力机制(CBAM/Self-Attention)

• 评估指标

案例展示

  • 飞机大战

    飞机大战

    飞机大战小游戏 敌机ai学习玩家操作 boss会生成 难度非常苦难 敌机自学习非常的强度 玩家需要高超的手法

  • 翻译ai

    翻译ai

    进行爬取翻译网站来 提取用户的翻译需求 用了几个常用的反反爬技术手段来进行爬取翻译网站 无伤爬取用户想爬的内容

  • 爬取交易猫

    爬取交易猫

    简单用python爬取交易猫网站 用了三个简单的反反爬处理 可以爬取交易猫数据等等数据 利于我们工作

  • 简单微信单机版模拟器

    简单微信单机版模拟器

    模拟微信的一个python小程序 可以进行微信聊天 加好友 和好友聊天等小功能 页面简单简洁易懂 新手上手简单

  • 烟柜烟盒识别系统

    烟柜烟盒识别系统

    烟柜台烟盒识别系统,识别一个烟柜里的所有烟,列出货架顺序,烟的品牌价格等信息。技术原理:yolov8识别标签纸框的位置,obb检测标签纸,ocr识别文字

  • 多源迁移学习模型项目

    多源迁移学习模型项目

    多源迁移学习模型项目 项目概述 这是一个基于PyTorch实现的多源迁移学习模型,用于ESG(环境、社会和治理)评级预测。项目整合了来自多个源域的知识,通过注意力机制和知识蒸馏等技术提升目标域的预测性能。 主要功能 - 多源数据整合与预处理 - 多种迁移学习模

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服