visual-phone-remote 是我独立开发的手机远程控制与视觉识别原型项目,主要用于在局域网或 USB 辅助链路下实现 Windows 画面投屏、Android 端显示控制、蓝牙 HID 输入、YOLO 模型识别和低延迟辅助操作。项目包含 Android 手机端、Windows PC 服务端、共享协议、USB/HID 研究模块和相关文档,整体目标是探索“手机作为远程显示与交互终端”的完整技术链路。
我在项目中负责整体架构设计、核心功能实现、端到端调试和性能优化。PC 端负责采集 Windows 屏幕并通过 MJPEG 等方式推送到手机端,支持系统友好、低延迟、清晰识别、USB 低延迟等不同预设;手机端负责接收画面、显示实时 HUD、导入 ONNX/YOLO 模型并进行本地推理。输入控制方面采用“画面投屏 + 蓝牙 HID 控制”的解耦设计,使手机能够被 Windows 识别为标准蓝牙鼠标或键盘,避免将网络控制接口直接暴露给外部环境。
项目中还针对低延迟和稳定性进行了多项优化,例如追最新帧、限制发送缓冲、自动断开慢连接、自适应降载、降低 UI 重组开销、复用图像预处理缓冲、支持 NNAPI 加速回退、显示流 FPS/解码延迟/YOLO FPS/HID 状态等调试指标。该案例体现了我在 Android 开发、Windows 服务端、Python 工具、网络投屏、蓝牙 HID、ONNX Runtime 推理、实时图像处理和跨端系统调试方面的综合能力,适合用于远程控制、移动端视觉识别、局域网投屏、AI 辅助工具和软硬件交互类项目开发。