HaloVoice 是一款支持中英双向的实时语音转写与同声传译应用,我在项目中负责整体架构设计与核心功能开发。应用基于实时音频采集、噪声抑制、流式传输与大模型语音识别技术,实现“同声传译”,即 Speck2Speck 的高效体验。
在技术实现上,我负责构建低延迟音频采集链路,使用多线程与队列机制保证数据的稳定传输;对接实时流式 ASR 与翻译接口,实现全链路的毫秒级延迟优化。同时开发了音频状态检测、断句逻辑、文本渲染优化等关键功能,以确保长时间使用过程中的稳定性和准确性。
我们对弱网、高噪环境、权限处理以及不同机型的兼容性进行了完整适配。本项目从 0 到 1 完成上线,覆盖语音转写、同传翻译、多语言输出等能力,能够满足学习、会议、跨国沟通等多场景需求。