1. AI Agent 与 LLM 应用开发:熟练使用 LangChain / LangGraph 构建复杂 Multi-Agent 协作拓扑(规划-执行-反思三层架构);掌握 Dify、AutoGen 等编排框架;熟练设计 ReAct、CoT、Self-Reflection 等 Prompt 范式;具备端到端 Agent 工作流设计与落地能力。
2. RAG 全链路:深入掌握 RAG 完整流程——文档解析(PDF/Word/HTML)、语义切片策略、Embedding 向量化(BGE / text-embedding-3);熟练使用 Milvus 向量数据库(Collection 设计、IVF_FLAT/HNSW 索引调优、ANN 检索);掌握混合检索(稠密+稀疏 BM25)、元数据过滤、Rerank(Cohere / BGE-reranker)等优化手段。
3. 后端工程:熟练使用 FastAPI / Python 构建 RESTful 及 Streaming 接口;掌握 Docker 容器化、Docker Compose 服务编排;熟悉 Git 版本控制与 CI/CD 流程;了解微服务架构设计,具备项目独立部署与线上排障能力。
4. 模型微调与推理加速:熟练掌握 LoRA / QLoRA 高效微调技术,具备在 Qwen / LLaMA 系列模型上的 SFT 实战经验;熟悉 vLLM 推理加速框架,了解 PagedAttention 及张量并行(TP)分布式加速方案;理解 Transformer 底层架构与注意力机制。
5. 数理与算法基础:数学与数据结构基础扎实(考研初试专业第一);熟悉常见检索算法与向量相似度计算原理;英语四级,具备阅读英文技术文档能力。
中医药领域 LLM Benchmark 构建与多模型性能对比研究 2025.9 – 2026.1
第一作者 | Python · LangChain · RAG · NLP 数据工程
•基准构建:设计 NLP 提取管道(正则匹配 + LLM 校验双层过滤)对中医古籍进行数据清洗,构建含 600+ 高难度 Q&A 基准,覆盖诊断、药方及古籍理解三大类别,数据噪声率低于 3%。
•RAG 优化:针对300c同源异质300d古籍数据难题,设计带元数据过滤(朝代、文献类型)与 BGE-Reranker 语义重排的两阶段检索方案;构建 Milvus 专业知识库(10 万+ 文本块),Top-5 召回率提升 28%,通过 RAG 使模型综合评测得分提升 20%。
•评测体系:设计涵盖【事实准确性、逻辑推理、安全合规】三维评测指标,系统对比 GPT-4o、Qwen2.5-72B 等 6 款前沿模型,产出评测报告并撰写一作学术论文(在投)。
高难度数学推理任务的 LLM 测试时扩展优化与评测 2025.7 – 2025.9
第一作者 | Python · vLLM · LoRA/QLoRA · LangChain
•模型微调:使用高质量数学推理数据集(MATH / NuminaMath),采用 QLoRA(4-bit 量化)对 Qwen3-8B 进行 SFT 训练,在 A100×4 环境下完成训练,MATH 基准得分提升 4.2 个百分点。
•评测管线:基于 vLLM 在 8×24GB 显卡集群搭建高吞吐自动化评测管线(吞吐量 180 req/s),量化 Scaling 性能边界;设计多路径采样(Best-of-N)与自我验证策略,推理准确率最高提升 3%,总 Token 消耗减少 80%。
产出一作学术论文(在投),相关代码已整理为可复现实验框架。
锐捷网络——多模态 AI 互动式教学智能体 2026.2 – 至今
核心成员 | LangGraph · Dify · RAG · Vision LLM
•Agent 编排:基于 LangGraph 设计「规划-答疑-评估」多角色 Multi-Agent 协作拓扑,通过状态流转实现任务拆解与闭环交互,支持 100+ 并发学生会话。
•RAG 与多模态:基于 Dify 部署 RAG 链路,实现教材文档切片(按知识点边界分块)与混合检索,答题幻觉率下降 55%;设计基于意图路由的 Vision/Text 模型联合调度,支持图形题自动解析。
•逻辑强化:构建深度 Prompt Pipeline,引入多步 CoT + Self-Reflection 机制,模型解题拆分正确率提升 30%。
基于 LangChain 的 Multi-Agent 核心编排与开发(Python): 使用 Python 结合 LangChain/LangGraph 框架,从零主导开发「规划-答疑-评估」多角色 Multi-Agent 协作拓扑。摒弃轻量级可视化工具,通过底层代码构建复杂的
本项目以数字金融科技为背景,针对当前金融研报生成的复杂性与高专业性,提出了一种基于多模态技术的智能研报生成方案。通过融合大模型技术与金融领域数据,项目实现了从数据采集到报告生成的全流程创新设计,旨在提升智能投研和投顾服务的效率与质量。 多模态数据处理:集成文本、表格和图像数