1.熟练掌握 预训练(Pre-training)、监督微调(SFT)、基于人类反馈的强化学习(RLHF) 核心训练方法。
2.熟悉 DeepSeek、Qwen、ChatGLM 等大模型,以及主流模型推理与服务框架:Sglang、vLLM。
3.熟练掌握 RAG、GraphRAG 和 LightRAG 检索增强生成技术,具备完整的应用与优化能力。
4.熟悉 MCP 多端服务编排与异步调度,具备开发与优化能力。
5.熟悉 Dify 框架进行 AI 应用开发,设计 Workflow 和定制 AI 工具。
6.熟悉数字人核心技术,包括ASR、TTS、Wav2Lip等模块。
7.擅长编写高效 Prompt 提示词。
8.熟练掌握主流深度学习算法:RNN、LSTM、Word2Vec、Transformer、BERT、GPT。
9.熟练使用 PyTorch 和 TensorFlow 等框架。
10.熟练使用MySQL、Redis、Neo4j等关系型与非关系型数据库。
11.熟悉Milvus、Chroma等常用向量数据库。
12.熟练操作 Linux 开发环境,使用 Docker 进行项目部署与打包。
项目背景:员工在日常工作中频繁需要查阅公司制度、员工手册、公司报销等各类资料。为提升查询效率并降低人工问答成本,我们构建一个基于RAG技术的智能问答系统。系统可自动解析文档,实现对公司资料的高效语义检索与智能应答,帮助员工快速获取所需信息,提升办公效率。
项目流程:
1.使用MinerU + Glm4v-9b提取文本、表格和标题,生成适合检索的语义块。
2.基于微调后的 bge-m3 嵌入模型,将分块后的文档向量化,存储在 Milvus 数据库中,支持高效的语义检索。
3.处理用户输入的查询,包括代词消解、查询重写和子问题生成,确保问题清晰且适合检索。
4.使用Milvus进行并行检索,获取相关上下文,并通过重排序选择最相关的Top 3上下文。
5.利用Qwen2.5-32b模型整合检索到的上下文,生成简洁、准确的答案。
6.通过Redis存储用户历史对话和查询结果,支持代词消解和快速响应,优化系统性能。