核心技术能力概述
作为一名专注于AI Agent研发的高级技术专家,我深耕于大语言模型(LLM)应用架构与工程化落地领域。我的技术栈以大模型微调与推理优化为核心,精通LangChain、LlamaIndex等Agent编排框架,具备从Prompt Engineering到RAG(检索增强生成)系统的全流程构建能力。在模型层面,熟练掌握Transformer架构原理,拥有LoRA、QLoRA等参数高效微调经验,并能利用vLLM、TensorRT-LLM等框架实现高性能推理部署。
针对高并发业务场景,我擅长构建分布式微服务架构,熟练运用Kubernetes进行容器编排与弹性伸缩,结合Redis/Milvus实现向量检索与缓存策略,确保Agent服务的低延迟与高可用。同时,我具备深厚的数据处理能力,能够设计复杂的ETL pipeline清洗非结构化数据,并利用MLflow进行模型全生命周期管理。此外,我熟悉AI安全与对齐技术,能有效实施RAGAS评估体系,致力于打造可控、可靠且符合业务伦理的智能体系统。
项目名称:滴滴智能数据分析助手“数智通”(基于NanoClaw架构)
项目背景与挑战:
针对滴滴数据分析师在日常工作中面临的“提数难、口径杂、重复劳动多”等痛点,我作为核心负责人,摒弃了传统的单一大模型调用模式,基于NanoClaw微内核架构重构了智能数据分析应用。项目旨在解决数据分析师在使用自然语言取数时,大模型难以精确映射复杂业务Schema、无法处理多轮上下文歧义,以及单一模型在面对“简单查询 vs 复杂归因”任务时顾此失彼的核心难题。
技术方案与实施:
我设计了“NanoClaw + 多模型路由 + RAG”的分层解耦架构:
1. NanoClaw 流程编排: 利用轻量级NanoClaw框架作为Agent的“神经中枢”,将复杂的分析任务拆解为Schema检索、SQL生成、SQL审核、结果洞察四个原子化Step,实现了高可控的Pipeline执行流,而非黑盒式的端到端生成。
2. 多模型动态路由(Multi-Model): 构建了智能路由层,针对简单明确定义的查询(如“查询昨日DAU”)调度轻量级模型以保证速度;针对涉及复杂Join或多指标计算的归因分析(如“分析暴雨天气对司机接单时长的影响”),则动态切换至千亿参数级大模型。这一策略在保证95%任务准确率的同时,降低了40%的推理成本。
3. 增强型RAG知识库: 构建了包含滴滴全链路ODS/DWD/DWS层表结构、8000+核心指标口径说明及历史优质SQL模版的向量知识库。通过Hybrid Search(混合检索)技术,确保LLM在生成SQL前能精准“回忆”起最匹配的表字段与过滤条件。
项目成果:
该应用在滴滴内部数据应用工程部上线后,已成为数据分析师的首选工具。它将分析师编写SQL的平均耗时从15分钟压缩至30秒以内,复杂跨表查询的一次性生成准确率达到90%。同时,通过多模型路由机制,系统在高并发时段依然保持毫秒级响应,有效支撑了双十一、暑期出行高峰等关键节点的实时数据探查需求,彻底改变了数据团队的工作范式。