1. 智能灵魂:大模型驱动的深度对话
接入先进的大语言模型作为核心大脑,使机器人具备丰富的知识储备和强大的上下文理解能力。
支持多轮、深度的自然语言对话,能够进行情感交流、创意写作、逻辑推理、知识问答等,让每一次交流都富有价值且生动有趣。
2. 生动形象:Spine 2D骨骼动画机器人
采用 Spine-runtimes 引擎,为机器人打造了灵活的2D骨骼动画形象。
机器人不再是冰冷的文字,而是能够根据对话内容实时呈现丰富的表情、口型和肢体动作(如点头、挥手、思考),极大增强了交互的趣味性与亲和力。
3. 能听会说:全双工实时语音交互
高精度实时语音识别 (ASR):用户可直接通过麦克风说话,小程序实时将语音转换为文字,交由大模型处理,实现“所说即所输”的便捷体验。
流畅逼真的语音播放 (TTS):机器人的回复可通过文本转语音技术,以自然流畅的语音播报出来,同时驱动Spine模型的口型与表情同步变化,实现真正的“声形同步”。
4. 实时稳定:WebSocket持久化通信
基于 WebSocket 协议构建了稳定、低延迟的全双工通信信道。
确保所有消息(文字、语音数据、动画指令)的即时送达与反馈,为流畅的实时对话和动画联动提供了坚实的技术基础,有效避免了传统HTTP协议的延迟与卡顿问题。