职位ID:158453

语音识别工程项目(基于开源框架)

  • 合作方式:
  • 项目制 全国远程
  • 预估日薪:
  • 1500
  • 预估总价:
  • 15000元
  • 预估工时:
  • 10天
  • 所在区域:
  • 全国远程

需求描述

任务主要是部署和二次开发:
部署基于 funASR 和 Paraformer (或其他同等水平模型)的工程,需要产出语音识别 API,包含离线 和 在线 两种模式, (在线模式框架里面是通过 websocket 实现的)

识别音频主要为 8K 客服 电话音频。
框架基于标准的框架就可,主要是要有实践经验最好,否则坑跨不过去。


主要的优化点:
1)原版部署噪音过滤效果较差导致错误率较高,需要会调整参数或者对VAD的使用有一定实践经验,了解如何高效率降噪或调参达到较优水平。
2)需要理解框架和模型性能,部署完成后最大程度发挥服务器性能支持高并发
3)封装为 docker 镜像
4)左右声道分别识别,需要有对应句子的时间戳

信用行为

  • 发布项目
    2
  • 订单总数
    0
  • 退款单数
    0

完善简历

工程师完善技术能力和项目经验,更易接到订单

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信客服

需求方请加需求方端客服沟通需求,工程师请加工程师端客服浏览推送职位

需求方端客服
工程师端客服
联系需求方端客服