项目背景与目标
我需要开发一款基于纯音频分析的AI实时提示系统,应用于游戏
系统通过捕获游戏声卡输出的音频,完全基于音频信号处理。
目标完成度:80%可用版本
需要完成的功能模块
1. 音频采集模块
实时捕获电脑声卡输出音频(loopback录音)
低延迟处理(要求延迟200ms以内)
支持主流声卡和耳机设备
2. 音频分类AI模型
区分不同地面材质的脚步声(木板/混凝土/金属/草地)
识别准确率要求达到80%以上
3. 方位估算模块
基于双耳音效(左右声道差异、HRTF特征)分析
输出方位信息:前/后/左/右/左前/右前等8个方向
距离区间估算:近/ 中(15~30m)/ 远(30m以上)
5. 轻量客户端界面
简单设置界面(灵敏度、距离、音量调节)
系统托盘运行,不影响体验
Windows 10/11兼容
需要应聘者具备的能力
有音频AI、语音识别或声音分类项目实际经验
熟悉Python音频处理库
有过模型训练和调参经验
能提供过往相关项目案例
有游戏音效或游戏AI相关开发经验
熟悉HRTF、3D音频处理
有实时流处理开发经验
训练好的AI模型文件
周期: 期望3-4个月内完成
更多具体内容可以详细洽谈