我的核心技术栈以Python为中心,精通Django、Flask及FastAPI等主流框架,能够根据业务场景灵活选型,快速构建RESTful API及复杂的Web应用。在数据处理方面,我熟练运用Pillow、OpenCV等库进行图像预处理。并且熟悉大模型后端开发和多种视觉模型的训练和部署。
基于YOLO与视觉大模型的融合式智慧公路车辆检测与分析系统
在该项目中,我担任核心后端开发角色,负责设计并实现了一套创新的车辆检测与分析流水线。为解决传统模型识别能力有限的问题,我实践了“YOLO高效发现,大模型深度理解”的两级架构。首先,利用YOLOv8模型对视频流进行实时处理,快速定位车辆目标并裁剪,有效过滤了90%以上的无效背景。随后,我将这些目标图像传递给视觉大模型,进行精细化识别(如型号、颜色)和复杂场景理解(如事故检测、违章行为分析)。
整个后端服务基于FastAPI构建,确保了高并发下的低延迟响应。该方案成功地将系统的实时性与分析深度完美结合。