ID:418466

高级研发工程师

  • 公司信息:
  • 滴滴出行
  • 工作经验:
  • 4年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 海淀

技术能力

核心技术能力概述

作为一名专注于AI Agent研发的高级技术专家,我深耕于大语言模型(LLM)应用架构与工程化落地领域。我的技术栈以大模型微调与推理优化为核心,精通LangChain、LlamaIndex等Agent编排框架,具备从Prompt Engineering到RAG(检索增强生成)系统的全流程构建能力。在模型层面,熟练掌握Transformer架构原理,拥有LoRA、QLoRA等参数高效微调经验,并能利用vLLM、TensorRT-LLM等框架实现高性能推理部署。

针对高并发业务场景,我擅长构建分布式微服务架构,熟练运用Kubernetes进行容器编排与弹性伸缩,结合Redis/Milvus实现向量检索与缓存策略,确保Agent服务的低延迟与高可用。同时,我具备深厚的数据处理能力,能够设计复杂的ETL pipeline清洗非结构化数据,并利用MLflow进行模型全生命周期管理。此外,我熟悉AI安全与对齐技术,能有效实施RAGAS评估体系,致力于打造可控、可靠且符合业务伦理的智能体系统。

项目经验

项目名称:滴滴智能数据分析助手“数智通”(基于NanoClaw架构)

项目背景与挑战:
针对滴滴数据分析师在日常工作中面临的“提数难、口径杂、重复劳动多”等痛点,我作为核心负责人,摒弃了传统的单一大模型调用模式,基于NanoClaw微内核架构重构了智能数据分析应用。项目旨在解决数据分析师在使用自然语言取数时,大模型难以精确映射复杂业务Schema、无法处理多轮上下文歧义,以及单一模型在面对“简单查询 vs 复杂归因”任务时顾此失彼的核心难题。

技术方案与实施:
我设计了“NanoClaw + 多模型路由 + RAG”的分层解耦架构:
1. NanoClaw 流程编排: 利用轻量级NanoClaw框架作为Agent的“神经中枢”,将复杂的分析任务拆解为Schema检索、SQL生成、SQL审核、结果洞察四个原子化Step,实现了高可控的Pipeline执行流,而非黑盒式的端到端生成。
2. 多模型动态路由(Multi-Model): 构建了智能路由层,针对简单明确定义的查询(如“查询昨日DAU”)调度轻量级模型以保证速度;针对涉及复杂Join或多指标计算的归因分析(如“分析暴雨天气对司机接单时长的影响”),则动态切换至千亿参数级大模型。这一策略在保证95%任务准确率的同时,降低了40%的推理成本。
3. 增强型RAG知识库: 构建了包含滴滴全链路ODS/DWD/DWS层表结构、8000+核心指标口径说明及历史优质SQL模版的向量知识库。通过Hybrid Search(混合检索)技术,确保LLM在生成SQL前能精准“回忆”起最匹配的表字段与过滤条件。

项目成果:
该应用在滴滴内部数据应用工程部上线后,已成为数据分析师的首选工具。它将分析师编写SQL的平均耗时从15分钟压缩至30秒以内,复杂跨表查询的一次性生成准确率达到90%。同时,通过多模型路由机制,系统在高并发时段依然保持毫秒级响应,有效支撑了双十一、暑期出行高峰等关键节点的实时数据探查需求,彻底改变了数据团队的工作范式。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服