- 数据处理:熟练使用Python(Pandas、OpenCV)清洗图像数据(去模糊、去冗余、格式统一),通过数据增强(翻转、裁剪、色域变换、Mosaic拼接)提升数据集多样性,适配YOLO数据输入要求。
- 标注工具:精通LabelImg、LabelMe标注目标框(VOC/YOLO格式),能处理分类、检测、分割等标注任务;会用LabelStudio批量修正标注错误,保证标注精度(如IOU>0.9)。
数据采集与清洗:收集工厂3个月零件生产图像(共8000张,含划痕、变形、无缺陷3类),用Python+OpenCV批量处理:去除模糊图像(通过清晰度算法筛选,保留7200张)、统一分辨率为640×640,转换为YOLO格式。数据增强与标注:针对小缺陷(如<5mm划痕)样本少的问题,设计“小目标增强策略”——对小缺陷区域单独裁剪后缩放拼接,结合Mosaic、MixUp增强,将数据集扩充至2.1万张;用LabelImg标注目标框,通过LabelStudio批量校验,标注准确率达98.5%(IOU>0.92)
手动收集并标注了明火烟雾数据集,将其放在指定的datasets文件夹中,包含images和labels两个子文件夹,分别存放图片和标注信息。在Pycharm中创建fire - smoke.yaml文件,配置数据集路径和类别信息(nc为2,类别是fire和smoke)。下载YOLO
准备了带标注的车辆数据集,采用YOLO格式。利用YOLOv8预训练模型,通过少量代码修改即可训练,支持GPU加速。训练完成后,结合PyQt5图形界面工具进行部署,实现了图片、文件夹、视频、摄像头等多种输入方式的实时检测功能,能准确识别出每一帧中的目标车辆并标注其类别。