ID:333468

Liuyuntao(21:00-22:00)

高级NLP工程师、爬虫工程师

  • 公司信息:
  • 飞算科技
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 深圳
  • 南山

技术能力

拥有多领域的技术能力,涵盖了自然语言处理(NLP)、计算机视觉(CV)和网络爬虫等方面。在NLP方面,熟悉文本预处理、词法分析、情感分析、命名实体识别以及机器翻译等技术,能够处理和理解各种语言文本。在CV方面,掌握图像处理、特征提取、目标检测、图像识别和图像生成等技术,能够实现图像的分析和理解,如人脸识别、物体识别等。此外,还具备网络爬虫技术,能够编写爬虫程序,从互联网上抓取和提取数据,并进行数据清洗和分析。技能能够应用于各种场景,如自动文本摘要、情感分析、图像分类、物体检测、数据采集和挖掘等任务。

项目经验

医疗机器人Python

开发技术:机器人框架API接口技术ASRTTS等
项目介绍:此项目主要面向患者,提供寻诊、问诊、导诊、食物推荐、闲聊功能。该项目包括前端和后端两大模块,前端主要包括可视化语音录制以及回复系统,后端主要包括ASR,连接器,机器人逻辑,知识图谱,TTS等。
项目职责:机器人语料、意图识别、实体提取、ASR等
意图识别
开发工具: python、neo4j

开发技术:三元组抽取、实体识别、前端接口开发等

项目介绍:通过搭建医疗知识图谱,为机器人的搭建提供数据基础。该项目主要分为两个阶段,第-个阶段主要进行数据处理,医院收录10万文本数据,网上收录20万半结构化数据,实体量级30多万个,关系大约110万个,其中3万文本数据和5万半结构化数据是手工标注的,最终通过三元组抽取,做成30万结构化数据,其中三元组抽取精度是95.3%第二个阶段,主要是数据导入,导入的方式是将第一个阶段获得的三元组数据制作成CSV格式文件并使用NEO4]数据库命令导入。后期增加了该知识图谱的API接口。

项目职责:数据处理,将数据处理成结构化数据、三元组抽取、实体识别等

tts混合语音输出系统
开发工具: python. flask
项目介绍:项目主要目的是解决当前国内语音系统TTS普遍面临的中英文混合输出问题,目前国际上有将字符直接对应音素的方法(PPG),但该方法缺陷较大且仅有71%的精度,所以本项目采用相对位置关系来定位不同语言,通过分离+定位的方法解决了多种语言混合输出问题。具体步骤是先进行文本分离并记录不同语言的相对位置关系,再通过不同语言模型将文本转译成对应语音,然后使用相对位置关系再合成的方式获得混合语音的过程。

创新点:开创性的使用分离+相对位置关系+再合成的方式解决混合语音输出问题

项目职责:整体项目研发、前端、后端,部署等

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服