专注于 AI Agent 系统开发与落地交付,覆盖低代码平台快速搭建到全栈定制开发的完整能力谱系。
Agent 平台应用(Dify / Coze / FastGPT):熟练使用 Dify 搭建企业级 RAG 知识库问答系统、多轮对话 Agent 及工作流自动化应用;熟悉 Coze 插件开发与 Bot 发布;了解 FastGPT 知识库配置与 API 对接;可根据客户需求快速交付开箱即用的 Agent 应用,也可在平台能力不足时无缝切换至自研方案。
Agent 后端定制开发:熟练使用 LangGraph 构建生产级 Multi-Agent 系统,具备 Orchestrator-Worker 架构、ReAct + Tool Calling、多 Agent 通信协议等完整工程经验;基于 FastAPI 封装 Agent 能力为标准 REST / SSE 流式接口;Docker 容器化部署,支持私有化交付。
Agent 前端开发:能基于 React / Vue 搭建 Agent 对话界面,实现流式消息渲染、工具调用状态展示、多轮对话管理、知识库检索结果展示等核心交互功能;可独立交付带完整前端的 Agent 应用。
模型能力支撑:具备大模型 SFT / GRPO 后训练实战经验(8×A800),可针对垂直业务场景做模型微调;熟悉 vLLM 推理部署,支持私有化模型接入 Dify 等平台;有量化部署与端侧适配经验(ONNX / RKNN)。
项目一:企业级多模态 Multi-Agent 视觉理解系统 | 企业:TeleAI
为解决复杂视觉理解任务中单模型能力瓶颈,设计并落地完整的 Multi-Agent 系统。后端基于 LangGraph 实现 Orchestrator + Sub-Agent 架构,FastAPI 封装对外服务接口,支持流式输出;前端提供任务状态追踪与结果可视化界面。结合 GRPO 算法进行 Agentic RL 训练(8×A800),自研 Step Reward 机制解决稀疏奖励问题。*V benchmark 准确率提升 10%,业务数据集提升 7%**,已在企业业务中稳定运行。
项目二:基于 Dify 的企业知识库问答 Agent
基于 Dify 平台为客户搭建私有化 RAG 知识库问答系统,涵盖文档解析、向量入库、检索召回策略配置、多轮对话 Agent 工作流设计;对接企业微信 / 飞书等渠道完成机器人部署;针对 Dify 平台能力限制,通过自定义 API 工具节点扩展私有逻辑,实现平台能力与定制开发的灵活结合。
项目三:VLM 推理加速方案 NUWA | ICLR 2026 一作
针对企业部署 VLM 推理成本高的痛点,提出两阶段视觉 Token 裁剪方法。在 13 个 benchmark 上减少 66.7% 视觉 token,保持 98.8% 语义感知性能与 79.2% 空间感知性能,可直接用于降低私有化 VLM 部署的推理成本。
项目四:端侧模型量化优化与部署 | 企业:北极雄芯
负责 CV 模型 FP32 → FP16 量化迁移,通过逐层量化模拟定位问题算子,结合 LoRA 微调策略将精度恢复至 FP32 的 90% 以上,完成 RK3588 端侧部署交付。