文本校正

医疗健康-医患问答 ASR/NLP

负责对语音识别的输出文本进行优化校正。主要内容包括预处理数据,生成True和False训练标签;使用BiLSTM-CRF进行 网络搭建,从命名实体识别的思路出发进行检错分析,找出错文本中错误文字的索引;根据错误索引,使用混淆集和语言模 型进行文字校正。项目中主要使用java和python语言。主要解决难点在于检错以及混淆集的选取,最终的纠错策略应用在 语音识别上能有效提高文本准确率。...

文本校正
文本校正
文本校正

语音识别

医疗健康-医患问答 ASR/NLP

负责研发医疗领域语音识别系统。主要职责在于语料分析、语音识别模型训练、模型部署。①语料分析采用的方法是数据的 余弦相似度,在词覆盖率上进行分析,期望在少量的训练集中取到最佳的识别效果;②语音识别模型部分,提取音频数据的 fbank特征,使用tensorflow搭建CNN+CTC的端到端网络模型进行语音模型的训练;③在服务器上部署语音识别模型, 优化客户端和服务器之间的访问请求,达到实时返回识别文本的效果。...

语音识别
语音识别
------ 加载完毕 ------
联系聘用方端客服