ID:423603

离风源

NLP算法工程师

  • 公司信息:
  • 北京欧珀通信有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 杭州
  • 萧山

技术能力

【大模型应用】
大模型本地部署、RAG 问答、Prompt设计、Text2SQL、文档信息抽取、工具调用。
【NLP 算法】
文本分类、意图识别、实体识别、信息抽取、文本检索、智能问答、中文分词。
【知识库 / 知识图谱】
文档结构化解析、领域知识建模、实体关系抽取、文本库构建、图谱构建、Neo4j 查询、图谱问答
【工程开发】
Python、FastAPI、Django、Docker、Nginx、conda
【检索与数据库】
Elasticsearch、Milvus、Neo4j、MySQL、向量检索、关键词检索、重排序

项目经验

【项目经历 1:知识图谱管理与智能应用平台】
参与搭建以 “文档 - 知识图谱 - 智能问答” 为完整链路的领域知识管理平台,负责文档全生命周期管理、知识体系标准化维护、文本信息抽取、实体与关系梳理及图谱入库全流程开发。平台具备文档检索、图谱可视化查询、实体关系溯源、知识图谱问答核心能力,支持用户通过文档检索、图谱查询双入口调取领域知识;项目兼顾人工知识库维护与大模型智能调用能力,搭建可管理、可检索、可问答、支持持续迭代更新的长效知识体系。
【项目经历 2:文档智能识别与结构化解析模块】
面向 RAG 知识库构建与学术论文解析场景,搭建多格式文档自动化处理流水线。基于 MinerU、Markdown 工具完成 PDF、Word、Markdown 等文件解析,精准提取正文、标题层级、表格、公式、图文注释等多元要素;融合自定义规则引擎与大模型理解能力,将非结构化原始文档标准化转换为结构化知识单元。成果落地于 RAG 文本切分、章节归类、元数据标注、内容清洗等前置预处理环节,可自动化抽取论文标题、摘要、研究方法、实验结论等关键学术信息,为上层知识库、问答系统提供标准化素材。
【项目经历 3:多智能体问答服务系统】
设计并落地多智能体混合问答服务系统,搭建统一知识底座,配套文档库、向量库与标准化知识入库流水线,支撑底层检索、智能问答业务。检索链路融合关键词检索、向量检索、RRF 重排序实现混合检索,依托问题意图理解、上下文上下文拼接、答案生成完整搭建 RAG 应用链路;新增智能路由调度模块,可依据用户问题类型自动分发任务,灵活调度文档问答、ChatBI 数据查询两类能力并整合输出结果,实现多场景问答能力一体化调度。

案例展示

  • PDF论文结构化解析服务

    PDF论文结构化解析服务

    本项目旨在实现论文PDF的定制化解析,输入为论文的PDF文件(支持扫描件),输出为指定的结构化信息(json文件),主要包含论文题目、摘要、作者、作者邮箱、作者单位,正文文本及对应的坐标,参考文献列表,图片,表格。 项目实现主要包含两部分:a. 解析主服务 b. 解析主服务所依

  • 面向人形机器人现场问答场景的RAG服务

    面向人形机器人现场问答场景的RAG服务

    面向人形机器人现场问答场景的 RAG 服务。项目将本地文档解析、中文文本切分、向量化、Elasticsearch 混合检索和大模型生成串联起来,为机器人提供知识库问答、场景问答、简单意图识别和知识库后台管理能力。 功能特性: - RAG 问答:根据用户问题从知识库检索上下文

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服