- 项目定位:面向无人直播场景的实时弹幕识别与自动回复系统,支持视频号、小红书、抖音等主流直播平台
- 技术栈:Python + Electron + React + Ant Design + RapidOCR +edge-tts + OpenAI API + PyInstaller - 核心功能:
- 屏幕实时截图 + OCR 文字识别(RapidOCR ONNX Runtime),毫秒级弹幕捕获
- 三级智能回复策略:预录音频播放(零延迟真人声音)→ 关键词TTS 回复 → AI 大模型生成回复
- 音频去重机制 + 多版本音频随机播放,避免回复重复感
- 虚拟音频线(VB-Cable)对接 OBS,实现声音自动化推流
- 可视化配置界面(AntDesign),支持截图区域校准、关键词管理、日志追踪
- 一键打包为 EXE 可执行文件,开箱即用
- 我负责的角色:独立完成从架构设计到开发的全流程,实现 OCR截图识别引擎、三级回复策略逻辑、TTS 语音合成、Electron 桌面端UI 搭建