精通 Python 桌面应用开发与自动化脚本编写,熟悉 NumPy、Wave 等音频处理基础库。掌握本地 AI 模型集成与工程化部署,具备基于 Faster-Whisper 的语音识别落地能力,可在纯离线环境下完成高精度的中文语音转文字。熟悉 Windows 系统级全局热键监听机制,能够使用 pynput 实现后台快捷键捕获而不干扰正常办公流程。精通 GUI 可视化开发,可使用 Tkinter 构建具备状态指示灯、进度反馈、卡片式布局的现代化桌面界面。掌握剪贴板自动化与跨应用输入模拟技术(pyperclip、pyautogui),实现一键粘贴发送。具备软件打包与分发经验,熟练使用 PyInstaller 将 Python 项目构建为独立可执行文件。擅长 Vibe Coding 协作开发模式,能够快速理解需求并交付可运行的工具型产品。
独立设计并完成「AI 语音输入助手」桌面端工具的全流程开发与交付。该项目基于 Python 技术栈,核心采用 Faster-Whisper medium 模型实现本地化语音识别,无需联网即可精准将用户语音转换为文字,充分保护隐私。系统通过 sounddevice 进行实时音频采集,结合 pynput 实现全局自定义快捷键(F1-F12)的监听与触发,采用按住说话、松手识别的交互逻辑,零学习成本。识别完成后,通过 pyperclip 与 pyautogui 自动将文字写入剪贴板并模拟粘贴至当前输入窗口,兼容 Chatbox、微信、钉钉等主流沟通工具。前端界面使用 Tkinter 构建,采用卡片式布局,集成实时状态指示灯与识别进度条,视觉反馈清晰。项目最终通过 PyInstaller 打包为独立 exe 文件,可在无 Python 环境的 Windows 设备上双击运行。整个项目从需求分析、技术选型、编码实现到测试打包均由我独立完成,已形成可交付的完整产品。