主要背景:应用于金融信审,获客与贷后等等场景下多轮无障碍机器人与用户语音对话。 主要内容: 参与并主导整个机器人语料,训练,预测等等平台与算法设计以及研发工作,算法开发框架tensorflow,keras,带领算法团队成员,研发的算法如下: 1.语音识别:有 vad ,声学前端采用将声音转为傅里叶变换的 mfsc 频谱图,识别模型为自主研发神经网络结构,包含残差结构,空洞卷积,ctc (不详说),该结构对真实口语化和噪声较大情况识别准确率高,语言模型为 transformer 算法。 2.语音合成:采用 tacotron2+wavernn 训练,并实现少量样本的语...
项目简述:该项目主要实现在园区能够自主载人巡游,并在固定景点停靠; 在项目中主要负责: 搭建建图与定位框架,通过 16 线激光雷达与 IMU 进行园区机器人的建图与定位; 利用 CAN 通讯实现汽车的纵向控制与横向控制; 利用 DWA 进行路径跟随,实现循迹、避障; 利用 QT 编写上位机, 便于工人操作, 实时显示机器人定位、 循迹情况;...