ID:237996

ASR/NLP 身份已认证

NLP、全栈开发

  • 公司信息:
  • 百度
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 北京
  • 全区

技术能力

熟悉语音识别整体流程,包括传统HMM-GMM语音识别和端到端语音识别,熟悉LSTM、CNN等网络模型框架及 attention注意力机制,能使用tensorflow及pytorch搭建模型;
熟悉主流编程语言,如java/python/C++;
了解Docker应用容器引擎,能进行多主机集群管理;
熟练使用linux操作系统,有阅读linux内核页面调度源码经历;
熟悉开源云操作系统openstack,包括OpenStack的概览、操作界面管理、认证管理、镜像管理、计算管理、存储管理、网络管理、编排管理、故障处理。

项目经验

文本纠错
负责对语音识别的输出文本进行优化校正。主要内容包括预处理数据,生成True和False训练标签;使用BiLSTM-CRF进行 网络搭建,从命名实体识别的思路出发进行检错分析,找出错文本中错误文字的索引;根据错误索引,使用混淆集和语言模 型进行文字校正。项目中主要使用java和python语言。主要解决难点在于检错以及混淆集的选取,最终的纠错策略应用在 语音识别上能有效提高文本准确率。

语音识别
负责研发医疗领域语音识别系统。主要职责在于语料分析、语音识别模型训练、模型部署。①语料分析采用的方法是数据的 余弦相似度,在词覆盖率上进行分析,期望在少量的训练集中取到最佳的识别效果;②语音识别模型部分,提取音频数据的 fbank特征,使用tensorflow搭建CNN+CTC的端到端网络模型进行语音模型的训练;③在服务器上部署语音识别模型, 优化客户端和服务器之间的访问请求,达到实时返回识别文本的效果。

案例展示

  • 文本校正

    文本校正

    负责对语音识别的输出文本进行优化校正。主要内容包括预处理数据,生成True和False训练标签;使用BiLSTM-CRF进行 网络搭建,从命名实体识别的思路出发进行检错分析,找出错文本中错误文字的索引;根据错误索引,使用混淆集和语言模 型进行文字校正。项目中主要使用java和py

  • 语音识别

    语音识别

    负责研发医疗领域语音识别系统。主要职责在于语料分析、语音识别模型训练、模型部署。①语料分析采用的方法是数据的 余弦相似度,在词覆盖率上进行分析,期望在少量的训练集中取到最佳的识别效果;②语音识别模型部分,提取音频数据的 fbank特征,使用tensorflow搭建CNN+CTC的

查看案例列表(含更多 0 个案例)

评价列表

Tsetsent@NLP    2022-05-30 19:07    5星

程序员素质高!耐心解决问题!值得合作。

第八日的蝉    2022-02-27 18:57    5星

耐心专业 人好 值得信任 很好的乙方

潘韬Samuel    2021-12-18 11:48    5星

哥们跟进非常及时,对接态度很棒,出现问题会及时反馈问题起因并主动帮忙提出解决方案。执行力强。

Fantasy    2021-11-25 14:32    5星

效率高,交流很及时,耐心解答问题,希望再次合作~

大头、    2021-08-09 11:17    5星

工作积极,态度认真!

信用行为

  • 接单
    6
  • 评价
    5
  • 收藏
    3
  • 五星率
    100%
  • 退款
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服