猿急送>

北京Java兼职程序员

ID：418466

裴

高级研发工程师

公司信息：
滴滴出行

工作经验：
4年

兼职日薪：
1000元/8小时

兼职时间：
下班后
周六
周日

所在区域：
北京
海淀

技术能力

核心技术能力概述

作为一名专注于AI Agent研发的高级技术专家，我深耕于大语言模型（LLM）应用架构与工程化落地领域。我的技术栈以大模型微调与推理优化为核心，精通LangChain、LlamaIndex等Agent编排框架，具备从Prompt Engineering到RAG（检索增强生成）系统的全流程构建能力。在模型层面，熟练掌握Transformer架构原理，拥有LoRA、QLoRA等参数高效微调经验，并能利用vLLM、TensorRT-LLM等框架实现高性能推理部署。

针对高并发业务场景，我擅长构建分布式微服务架构，熟练运用Kubernetes进行容器编排与弹性伸缩，结合Redis/Milvus实现向量检索与缓存策略，确保Agent服务的低延迟与高可用。同时，我具备深厚的数据处理能力，能够设计复杂的ETL pipeline清洗非结构化数据，并利用MLflow进行模型全生命周期管理。此外，我熟悉AI安全与对齐技术，能有效实施RAGAS评估体系，致力于打造可控、可靠且符合业务伦理的智能体系统。

项目经验

项目名称：滴滴智能数据分析助手“数智通”（基于NanoClaw架构）

项目背景与挑战：
针对滴滴数据分析师在日常工作中面临的“提数难、口径杂、重复劳动多”等痛点，我作为核心负责人，摒弃了传统的单一大模型调用模式，基于NanoClaw微内核架构重构了智能数据分析应用。项目旨在解决数据分析师在使用自然语言取数时，大模型难以精确映射复杂业务Schema、无法处理多轮上下文歧义，以及单一模型在面对“简单查询 vs 复杂归因”任务时顾此失彼的核心难题。

技术方案与实施：
我设计了“NanoClaw + 多模型路由 + RAG”的分层解耦架构：
1. NanoClaw 流程编排：利用轻量级NanoClaw框架作为Agent的“神经中枢”，将复杂的分析任务拆解为Schema检索、SQL生成、SQL审核、结果洞察四个原子化Step，实现了高可控的Pipeline执行流，而非黑盒式的端到端生成。
2. 多模型动态路由（Multi-Model）：构建了智能路由层，针对简单明确定义的查询（如“查询昨日DAU”）调度轻量级模型以保证速度；针对涉及复杂Join或多指标计算的归因分析（如“分析暴雨天气对司机接单时长的影响”），则动态切换至千亿参数级大模型。这一策略在保证95%任务准确率的同时，降低了40%的推理成本。
3. 增强型RAG知识库：构建了包含滴滴全链路ODS/DWD/DWS层表结构、8000+核心指标口径说明及历史优质SQL模版的向量知识库。通过Hybrid Search（混合检索）技术，确保LLM在生成SQL前能精准“回忆”起最匹配的表字段与过滤条件。

项目成果：
该应用在滴滴内部数据应用工程部上线后，已成为数据分析师的首选工具。它将分析师编写SQL的平均耗时从15分钟压缩至30秒以内，复杂跨表查询的一次性生成准确率达到90%。同时，通过多模型路由机制，系统在高并发时段依然保持毫秒级响应，有效支撑了双十一、暑期出行高峰等关键节点的实时数据探查需求，彻底改变了数据团队的工作范式。