职位ID:158487

直播TTS翻译应用

  • 合作方式:
  • 项目制 全国远程
  • 预估日薪:
  • 500
  • 预估总价:
  • 5000元
  • 预估工时:
  • 10天
  • 所在区域:
  • 全国远程

需求描述

前期考虑需求的时候,想的太全太复杂,太程序员思维了!我现在把需求简化一下!
以前我们的直播方案是
1.直播开始之前我们会和越南的翻译通过微信通话(我们是做的越南直播)
2.微信语音通话开免提
3.我们obs开播,国内主播开始讲解
4.越南主播在TK上听到国内主播的讲解,之后翻译成中文通过微信语音到国内
5.国内微信语音免提连了蓝牙音响,音响放出声音通过国内主播的话筒再传出去
6.国内主播等翻译说完再开始下一段的讲解.




我的想法,刚开始想的比较全,比如国内主播讲解实时翻译成中文文字,之后通过tts之类的音频云转成越南语
或者英语音频流给到本地的虚拟声卡,在通过OBS一起推流出去,同时也可以加上越南语字幕。国内主播戴个
耳机等翻译完再说下一段,但是后来想想里面有太多的细节问题。 比如:
1.中文识别的准确性
2.转他国音频的准确性
3.国内主播音频需不需要播放出去,还是只要用于识别转他国音频
4.如果不放看直播的会感觉怪怪的
5.放音频那转后的音频和主播音频会不会混,时间怎么控制

我根据我们以前的场景我想把应用简化下
1.obs开播,主播开始介绍,一段段的讲,讲一段停一段,老主播基本都熟练了,毕竟以前就是这样
2.本地音频识别中文,在等主播停顿的时候快速人工审核文字,其实在实时中文识别的时候就已经审了大部分
3.审核完客服点翻译,文字上云或者本地部署的应用,翻译成他国音频流返回给虚拟声卡,推流出去
4.主播开始下一段。
这个方案简单了很多,人工干预但我觉得体验会更好。
优势:
1.主播更加适应这样的节奏
2.翻译的准确性会更高
3.不用考虑主播音频和他国音频串流问题
4.因为客服发送翻译转音频,也可以人工干预,直接输入一些文字在直播间回复客户问题



上面是我的一些想法!最好在一个网页或者一个GUI里面完成

投递职位 已有16人投递,发布人 点此登录 后查看。

信用行为

  • 发布项目
    1
  • 订单总数
    0
  • 退款单数
    0

完善简历

工程师完善技术能力和项目经验,更易接到订单

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信客服

需求方请加需求方端客服沟通需求,工程师请加工程师端客服浏览推送职位

需求方端客服
工程师端客服
联系需求方端客服