ID:407009

刘星星不爱笑

资深Python开发工程师

  • 公司信息:
  • 联众智慧
  • 工作经验:
  • 8年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 武汉
  • 全区

技术能力

熟练使用 PyCharm 和 Jupyter Notebook 等主流开发工具
熟悉常用的 Linux 命令,具备高效的服务器操作能力
掌握 MySQL、Oracle、Neo4j、Milvus 等数据库的使用
熟悉 Python 编程语言,具备良好的代码规范和开发习惯
熟悉 大模型微调技术、RAG 技术及 LangChain 开发框架,能够灵活应用于实际场景
熟悉主流预训练大模型的架构与原理(如 BERT、ChatGLM 等),能够结合业务需求进行深入优化
掌握 提示词微调技术(如 PET、P-Tuning)
熟练使用 PyTorch 框架,以及 NumPy、Pandas、Scikit-learn 等常用库,具备扎实的开发基础
深入理解 RNN、LSTM、Transformer、TextCNN 等深度学习模型的原理及实际应用
熟悉文本分类、命名实体识别(NER)和关系抽取的方法,掌握 Pipeline 和 Joint 方法的应用技巧
掌握 Flask 和 Docker 等框架的使用,熟悉模型部署及上线流程
熟悉 vLLM 和 Transformers 等大模型推理加速框架,能够优化推理效率
深入掌握大模型应用技术,具备 Function Call 功能开发与 Agent 设计能力,能够通过任务分解与执行实现高效自动化
熟悉Model Context Protocol(MCP)原理及应用
熟练使用Dify、Coze构建智能体、工作流、RAG

项目经验

医疗知识智能问答
项目背景
医疗知识智能问答项目通过结合大模型技术和检索增强生成(RAG),整合医学文献和权威知识库,为医疗从业者和患者提供实时,精准,可靠的问答服务,提升诊疗效率和用户体验,助力医疗行业数字化转型与智能化发展。
工作内容
1.数据收集
负责构建RAG知识库,包括整理和集成医疗知识相关文献、健康教育资料、药品说明书及护理手册等多类型文档
2.数据处理实现文档的自动加载和预处理工作,包括数据清洗、内容分块以及向量化表示的生成
3.向量数据库构建
构建包含3.256.492条数据的Milyus向量数据库,并搭建支持三类集合(基础医疗知识、临床评估工具、管理与决策支持)的高效检索结构
4.用户意图识别
基于BERT模型开发用户意图识别功能,支持四种类型分类(健康知识咨询、心理与情感支持
系统与技术交互、闲聊互动),实现F1-score达到90.73%
5.智能问答
完成对用户查询(query)的多维度检索处理,包括设计和优化prompt,并基于开源Qwen-2.5-7B模型构建智能问答功能
优化方向
1.表格文档的处理针对表格类型文档的数据处理,采用开源QCR(PaddleOCR)工具,实现结构化数据提取
2.查询与文档优化
在用户查询端引入query改写机制,并对知识文档构建多级索引结构
3.检索与排序优化
针对文档检索过程,采用BM25与Embedding的混合向量检索,并通过Rerank进一步优化查询结果的相关性
4.模型微调
对Qwen2.5-7b模型通过LoRA技术进行微调
5.RAG系统评估
基于RagAS工具对RAG系统进行性能评估,确保答案相关性评分达到0.85以上。同时通过1000条测试集进行人工评估,系统准确率(ACC)达到90.58%
OPERAG
项目背景
聚焦企业级智能应用需求,搭建高扩展性多租户 RAG 系统,提供低代码接入能力,用户凭借 API 及密钥即可快速部署个性化 RAG 解决方案。系统深度集成文档全生命周期管理、智能文档解析、多轮会话管理等核心功能,赋能企业高效实现知识检索与生成的智能化升级。
工作内容
1. 系统架构设计与实现
FastAPI 应用服务:设计并实现基于 FastAPI 的高效应用服务,提供 RESTful API 接口,支持文件上传、文档管理、智能问答功能及会话管理模块,确保系统的高扩展性与稳定性。
Milvus 向量数据库:搭建并优化 Milvus 向量数据库,负责文档向量的存储与相似度检索,确保高效的数据查询与管理。实现多租户数据隔离,确保不同租户的数据安全和独立性。
文档处理服务:设计文档处理服务,涵盖文档分块、文本向量化、元数据管理等功能,确保文档上传、处理进度实时反馈,并实现自动化的资源清理功能。
2. 文档管理模块设计与实现
完成 批量上传与自动分块 处理,通过 LangChain 的递归分块器(RecursiveCharacterTextSplitter)实现高效的文档分块,确保大文档的拆解与处理。
集成 BGE-M3 模型进行文档向量化处理,实现基于语义的检索与问答功能。
支持多种文档类型的处理,包括 PDF、TXT、WORD、CSV、JSON 格式,并提供 实时上传进度反馈。
实现文档删除与资源清理功能,并确保多租户文档隔离,保障不同用户数据的安全和隐私。
3. 智能问答模块设计与实现
设计并实现基于 Milvus 向量数据库的混合检索,结合BM25与相似度匹配方法,提高问答的精准度与相关性。
引入RRF(Ranked Retrieval Fusion)算法 进行结果排序优化,确保查询结果的质量与准确性。
构建高效的基于知识库的问答功能,支持用户的智能查询,提升了问答系统的响应速度和准确性。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服