熟练掌握 Python、TypeScript、Java、Kotlin 及 SQL 等核心开发语言,专注于 AI Agent 智能体架构、AI Infra 以及端侧 AI 推理系统的开发与工程落地。
在 AI 大模型应用领域,深入理解并具备丰富的 LangGraph 图式多智能体协同编排、任务拓扑驱动及工具自治路由的架构设计经验。熟练运用 FAISS 向量检索与 BM25 传统检索,掌握基于 RRF(倒数排名融合)、Cross-Encoder 深度重排以及查询重写(Query Rewriting)的混合检索(RAG)优化技术。熟悉基于 RAGAS 的自动化检索质控评估体系,能有效治理大语言模型的数值幻觉与语义偏差。
在端侧 AI 与 Infra 领域,具备端侧异构算力调度经验,熟练使用 LiteRT-LM 框架在移动端部署开源大模型,掌握 GPU 优先与 CPU 自动降级策略,并能通过投机采样技术实现推理加速。熟练运用 ONNX Runtime 部署多模态 CLIP 模型进行零样本目标检测。后端侧熟悉基于 FastAPI 的高性能异步接口开发,并能熟练结合企业级数据库(如 Oracle、PostgreSQL)进行复杂数据流管理,具备大规模数据交互的生产环境实践经验。
项目一:港口危险货物智能数据分析系统(担任角色:后端负责人 / 核心架构师)
项目背景:系统初期基于单路径线性分析链,主要依赖系统接口或 Text2SQL 单工具处理,在面对多源数据组合、计划校验与复杂结果合并时扩展性严重不足。
核心技术:Python、Oracle、LangGraph、FastAPI、SSE
主要贡献:主导了基于 LangGraph 的图式动态编排架构重构,引入 Planner 路由机制,实现了系统接口、Text2SQL 与 Join 算子的高效动态协同。自主设计以结构化意图为核心的编排机制,由 Planner 结合工具能力、参数约束生成多步执行计划,并接入校验与拦截层,大幅提升了复杂多步查询的执行稳定性。针对多源异构数据,设计了“近期明细优先、超窗自动回退”的动态降级与联合补数路由策略。为了解决大模型的数值幻觉,剥离其计算职责,自研后端确定性聚合算子(完成求和、计数、分组统计),并引入状态声明防止数据冒充。同时,在入口层部署防模糊反问的拦截器,减少无效调用。最终成功实现了跨业务维度多源组合计算、SSE 状态流响应及结构化报表的一键导出。
项目二:多智能体金融分析与高质检索引擎(担任角色:AI Agent 架构师)
项目背景:传统单智能体或简单线性 RAG 在处理高专业度的多跳问答和复杂语料时,易出现视角片面、忠实度低以及信息检索不精准的问题。
核心技术:Python、LangGraph、FAISS、BM25、RAGAS、PostgreSQL
主要贡献:构建了一个包含数据抓取、多空双视角分析、对抗辩论及自省反思的复杂多智能体协同拓扑链条,通过引入激烈的辩论和纠偏机制,有效拉齐了大模型的认知偏差,消除了单一视角的输出盲区。全链路内嵌 RAGAS 自动化质控评估指标,底层检索创新地将向量检索与传统检索相结合,采用倒数排名融合(RRF)算法、深度重排以及查询重写技术,在万级复杂金融语料测试集下,使多跳问答的忠实度(Faithfulness)显著提升了 32%,实现了高可靠、工业级的智能问答与深度分析输出。
我担任后端负责人与核心架构师。主导基于LangGraph的动态图式智能体(Agent)编排重构,接入Planner路由、Text2SQL及Join工具协同。自研后端确定性聚合算子治理大模型幻觉,实现跨源数据Excel流式导出与秒级SSE响应。
我担任AI工程师与Agent架构师。端侧基于LiteRT-LM本地部署Gemma大模型,利用GPU/CPU异构调度与投机采样加速,结合ONNX Runtime实现MobileCLIP离线零样本检测;云端构建LangGraph多智能体对抗辩论与RAGAS质控体系。