基本信息

案例ID:240741

技术顾问:富贵 - 7年经验 - 浙江大华技术股份有限公司

联系沟通

微信扫码,建群沟通

项目名称:弹幕OCR工具

所属行业:电子商务 - B2C

->查看更多案例

案例介绍

- 项目定位:面向无人直播场景的实时弹幕识别与自动回复系统,支持视频号、小红书、抖音等主流直播平台
- 技术栈:Python + Electron + React + Ant Design + RapidOCR +edge-tts + OpenAI API + PyInstaller - 核心功能:
- 屏幕实时截图 + OCR 文字识别(RapidOCR ONNX Runtime),毫秒级弹幕捕获
- 三级智能回复策略:预录音频播放(零延迟真人声音)→ 关键词TTS 回复 → AI 大模型生成回复
- 音频去重机制 + 多版本音频随机播放,避免回复重复感
- 虚拟音频线(VB-Cable)对接 OBS,实现声音自动化推流
- 可视化配置界面(AntDesign),支持截图区域校准、关键词管理、日志追踪
- 一键打包为 EXE 可执行文件,开箱即用
- 我负责的角色:独立完成从架构设计到开发的全流程,实现 OCR截图识别引擎、三级回复策略逻辑、TTS 语音合成、Electron 桌面端UI 搭建

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服