主要精通Python语言,熟悉各类CV算法,包括但不限于yolo,opencv,OCR, 各类分割算法,熟悉数据标注,模型训练,调优,量化部署的全过程。熟悉LLM相关技术,熟悉unsloth,llamafactory来做模型微调,CPT,SFT,强化学习算法GRPO,DPO等。熟悉vllm,lmdeploy等推理框架,熟悉fastapi,做模型私有化部署。熟悉autoawq,MXFP4, NVFP4,fp8等量化技术。熟悉Linux,docker。kaggle竞赛 AIMO2 15名。
基于 YOLO 的番茄果串识别系统
负责从数据采集、标注、模型训练到边缘部署的一体化实现。构建了包含约1万张多光照、多角度、遮挡样本的标注数据集,采用 YOLO 系列目标检测网络(针对果串结构做 anchor 与多尺度改进),结合强鲁棒的数据增强(色变、仿射、雾化)和在线 hard-example mining,提高模型对重叠果串与遮挡的识别能力。通过后处理将单果检测结果聚合为果串(基于聚类与空间约束),实现实时推断:服务器端 mAP@0.5 ≈ 92%,在 RTX/Jetson 两种平台分别达到 ~40 FPS / ~15 FPS。系统已接入分拣/采摘指令输出接口,显著提升分拣准确率与自动化率,支持 OTA 模型迭代与在线监控告警。
企业级 AI 知识库系统(RAG + 多模态检索)
搭建面向企业文档的知识管理与问答平台:设计了文档采集/清洗管道(PDF、PPT、Excel、内部 Wiki、邮件),采用高质量嵌入模型进行向量化并存入向量数据库(支持 Milvus/Pinecone 等),实现 Retrieval-Augmented Generation(RAG)检索+生成混合的问答服务。为保证回答准确性,加入基于证据的回答回溯、置信度阈值与多条检索候选合并策略;并实现细粒度权限控制与审计日志。上线后在内部客服/知识检索场景中,自动化回复正确率(经人工抽检)达到 ~88%,单次查询延迟可控在 <200ms,工单首次解决率提升显著,平均工单处理时间下降约60%。系统支持版本化语料、增量索引与模型可插拔升级。
基于 AI 的代码生成与工程师助理系统
设计并实现了一个面向企业工程流程的代码生成平台,核心包括:语义检索上下文召回(项目 repo + issue + PR 历史)、小样本/LoRA 微调策略、代码语义校验与自动化单元测试生成。采用混合数据集(公开仓库 + 内部样例)训练代码生成模型并结合静态扫描与安全规则过滤器,防止生成存在明显安全缺陷的片段。在 CI 中集成生成→测试→静态分析→人审的闭环,支持按仓库/语言定制化模型。上线实验数据显示:常见模板化任务(CRUD、接口对接、迁移脚本)代码交付率与首次通过率显著提升,平均开发周期缩短约2–3倍,代码审查时间明显下降。系统同时提供插件化 IDE 扩展与 API 供内部工具调用,支持持续学习与指标化监控(通过率、回滚率、用户满意度)。