精通Python后端开发,熟练掌握FastAPI框架及其底层原理,能够基于Router-Service-CRUD架构快速搭建高并发、易维护的企业级API服务。
具备扎实的Python脚本编写与爬虫开发能力,能够高效完成复杂网页的数据抓取、清洗与自动化处理任务,熟练应对各类反爬策略。
在AI应用与大模型后端架构方面经验丰富,深入理解并掌握RAG架构的核心流程,包括文本切块、向量化、向量索引与语义检索。熟练使用FAISS、ChromaDB等向量数据库进行高效检索与海量数据存储。
熟悉Transformer架构与常见开源大模型(如DeepSeek、GLM、Qwen等)的基本原理与本地化部署。熟练运用LangChain、Dify、Ragflow等AI框架进行业务层API开发与集成。
精通Prompt Engineering,掌握Few-shot、CoT等多步推理技术,能够有效提升大语言模型在复杂任务中的推理准确率,并能设计严格的JSON输出范式以满足后端接口交互需求。了解并掌握LORA、SFT、DPO等模型微调技术。
熟练使用Git进行代码版本控制与团队协作。熟练使用Docker、Conda等工具进行项目环境隔离、跨平台部署与交付。具备丰富的RPA集成经验,擅长编写中间件脚本打通系统间的数据壁垒。
项目一:企业级合同智能自动化审核系统
项目描述:为大型国企定制开发合同自动化审核流程,构建从合同自动抓取、大模型智能审查到结果回填的全流程业务闭环系统。
主要职责:
1. 负责后端核心逻辑开发与AI审核链路的构建。设计标准化的输入输出API接口,与RPA流程完成深度对接,打通全自动化链路。
2. 独立设计并实现基于ChromaDB的向量检索微服务,为系统依据性条款比对提供核心的高性能知识检索支持。
3. 负责核心提示词工程设计,覆盖基础合规项与深度风控项(如管辖权条款、高风险违约金等)共12个审核点。通过CoT技术提升复杂法律条款的推理准确率,并强制约束模型输出严格的JSON范式供后端解析。
项目二:文化艺术资源智能问答API服务系统
项目描述:基于RAG框架构建的垂直领域智能问答系统,通过向量检索与大模型生成,解决传统搜索无法精准响应复杂文化类问题痛点。
主要职责:
1. 后端基于FastAPI框架实现高性能API服务,整合FAISS向量数据库与Embedding模型,实现稳定高效的文档检索接口。
2. 编写Python数据处理脚本,收集并清理大量历史资料与用户反馈,完成文本的切片清洗与向量化处理。
3. 深度集成LangChain框架,支持底层文档解析、多轮上下文状态保持及问答逻辑路由。基于IndexFlatIP实现精确相似度搜索,确保后端返回的检索结果具备极高的准确性与可靠性。
项目三:银行对公产品大模型微调与RAG问答系统
项目描述:针对银行领域数据,完成大模型的私有化微调,并结合检索增强生成技术构建对公产品知识的精准问答后端引擎。
主要职责:
1. 编写Python爬虫与自动化脚本,获取并清洗10万条QA数据及1万条金融咨询PairWise数据,为模型训练提供高质量数据源。
2. 采用LangChain框架构建后端RAG链路,采用bge-large-zh编码文本并对接FAISS完成海量金融数据入库与高效查询。
长安十二时辰文化艺术资源知识服务系统 项目描述:基于RAG框架构建的垂直领域智能问答系统,通过向量检索与大模型生成,解决传统搜索无法精准响应复杂文化类问题痛点。 主要职责: 1. 后端基于FastAPI框架实现高性能API服务,整合FAISS向量数据库与Embedding模
参与公司自研的智能合同审核产品研发,系统采用双引擎架构:基于Prompt的LLM审核器负责逻辑合规性判断,基于知识库的RAG审核器负责依据性条款比对。旨在通过差异化的技术路径,实现对合同风险的全面自动化审查。 独立设计并实现基于ChromaDB的向量检索服务,为RAG审核器提供
参与公司自研的智能合同审核产品研发,系统采用双引擎架构:基于Prompt的LLM审核器负责逻辑合规性判断,基于知识库的RAG审核器负责依据性条款比对。旨在通过差异化的技术路径,实现对合同风险的全面自动化审查。 独立设计并实现基于ChromaDB的向量检索服务,为RAG审核器提供