1. 编程语言与工具:熟练使用Python完成全流程开发,掌握Jupyter Notebook、PyCharm等开发环境,熟悉Git版本控制。
2. 图像识别技术:
◦ 传统方法:精通OpenCV库,掌握SIFT、ORB等特征提取算法,以及FLANN、BF匹配器。
◦ 深度学习:熟练运用PyTorch、TensorFlow框架,掌握ResNet、YOLO、U-Net等经典模型,擅长迁移学习、数据增强及模型压缩优化。
3. 数据挖掘与分析:
◦ 数据处理:熟练使用Pandas、Numpy进行数据清洗、特征工程,掌握PySpark处理大规模数据。
◦ 机器学习:精通Scikit-learn,熟悉LightGBM、XGBoost等模型,擅长分类、聚类、回归任务。
◦ 多模态融合:具备图像、文本、时序数据融合经验,掌握跨模态特征提取与模型构建。
4. 系统开发与部署:
◦ 服务搭建:使用FastAPI、Flask开发API接口,熟悉Docker容器化部署。
◦ 工程优化:掌握FAISS向量检索、Redis缓存,能利用MLflow进行实验管理与模型迭代。
5. 行业应用经验:
◦ 涵盖电商图像检索、工业缺陷检测、医学影像诊断、社交媒体分析等领域,熟悉对应业务场景与技术落地流程。
项目一:基于深度学习的图像分类与检索系统开发
项目背景:
为某电商平台构建商品图像分类与以图搜图系统,解决海量商品图片(超100万张)的精准分类和相似商品检索需求,提升用户搜索效率和推荐准确性。
技术栈:
• 框架/库:PyTorch、TensorFlow、OpenCV、Scikit-learn
• 模型:ResNet50/101(迁移学习)、Faster R-CNN(目标检测)、Triplet Loss度量学习
• 数据处理:数据增强(MixUp/CutOut)、Mosaic数据合成、特征金字塔构建
• 工程优化:FAISS向量检索引擎、Docker容器化部署、GPU集群训练(NVIDIA A100)
负责内容:
1. 数据 pipeline 搭建:
◦ 设计图像标注流程,构建包含50万张标注数据的训练集,覆盖200+商品类别;
◦ 开发数据清洗脚本,通过OCR文本校验、跨模态哈希去重,将无效数据比例从15%降至3%。
2. 算法开发与优化:
◦ 基于ResNet101实现图像分类基线模型,通过知识蒸馏将模型参数量压缩40%,推理速度提升2.5倍;
◦ 引入度量学习(Triplet Loss + 难样本挖掘)构建图像特征向量,结合FAISS实现亿级特征向量的毫秒级检索,Top-5准确率达92%。
3. 系统集成与部署:
◦ 设计“特征提取-向量存储-检索匹配”三层架构,使用FastAPI搭建API服务,支持日均10万次检索请求;
◦ 实现模型动态更新机制,通过MLflow跟踪实验参数,迭代30+版本后整体检索召回率提升18%。
项目成果:
• 商品分类准确率从基线模型的78%提升至91.2%,以图搜图平均响应时间<200ms;
• 助力平台搜索转化率提升12%,人工标注成本降低50%,相关技术方案被纳入公司AI中台标准组件。
项目二:工业缺陷检测智能系统(图像+时序数据融合挖掘)
项目背景:
为某制造业企业开发生产线缺陷检测系统,针对机械零部件表面缺陷(划痕、裂纹等)及设备运行异常,实现实时检测与故障预警,替代传统人工目检和阈值报警方案。
技术栈:
• 多模态数据:机器视觉(工业相机采集RGB图像)、振动传感器(时序数据)
• 模型:YOLOv5(缺陷定位)、LSTM-AutoEncoder(时序异常检测)、特征融合网络
• 工具:Pandas(时序数据清洗)、PySpark(分布式特征工程)、TensorBoard(可视化)
负责内容:
1. 跨模态数据融合:
◦ 设计图像特征(HOG/SIFT)与时序特征(FFT频谱、均方根值)的融合策略,通过concat和注意力机制提升互补性;
◦ 构建包含8000+缺陷样本的图像数据集和20万条时序样本的混合数据集,设计分层抽样策略平衡正负样本。
2. 实时检测算法开发:
◦ 基于YOLOv5s实现缺陷定位,通过模型剪枝和量化压缩,在边缘计算设备(Jetson Nano)上实现30FPS实时检测;
◦ 针对振动数据设计LSTM-AutoEncoder异常检测模型,通过重构误差阈值判断设备运行状态,误报率从25%降至8%。
3. 工业级系统落地:
◦ 开发边缘端数据采集模块(Python + ROS),实现图像流和传感器数据的同步采集与预处理;
◦ 部署Flask服务与企业ERP系统对接,实时推送缺陷报告和设备预警信息,支持历史数据回溯与趋势分析。
项目成果:
• 表面缺陷检测准确率达95.6%,设备异常预警提前量平均提升4小时;
• 生产线人工检测成本降低70%,设备非计划停机时间减少35%,年节省生产成本超200万元。
项目三:医学影像智能诊断辅助系统(肺部CT结节检测)
项目背景:
与某三甲医院合作开发肺部CT结节辅助诊断系统,基于公开医学影像数据集(如LIDC-IDRI),实现结节自动检测与良恶性分类,缓解放射科医生读片压力。
技术栈:
• 医学影像处理:Monai、SimpleITK(三维图像分割)、Numpy(体数据处理)
• 模型:3D U-Net(结节分割)、ResNet3D(分类)、注意力机制(CBAM/Self-Attention)
• 评估指标
飞机大战小游戏 敌机ai学习玩家操作 boss会生成 难度非常苦难 敌机自学习非常的强度 玩家需要高超的手法
进行爬取翻译网站来 提取用户的翻译需求 用了几个常用的反反爬技术手段来进行爬取翻译网站 无伤爬取用户想爬的内容
简单用python爬取交易猫网站 用了三个简单的反反爬处理 可以爬取交易猫数据等等数据 利于我们工作
模拟微信的一个python小程序 可以进行微信聊天 加好友 和好友聊天等小功能 页面简单简洁易懂 新手上手简单
烟柜台烟盒识别系统,识别一个烟柜里的所有烟,列出货架顺序,烟的品牌价格等信息。技术原理:yolov8识别标签纸框的位置,obb检测标签纸,ocr识别文字
多源迁移学习模型项目 项目概述 这是一个基于PyTorch实现的多源迁移学习模型,用于ESG(环境、社会和治理)评级预测。项目整合了来自多个源域的知识,通过注意力机制和知识蒸馏等技术提升目标域的预测性能。 主要功能 - 多源数据整合与预处理 - 多种迁移学习模