熟悉python与C++,深耕深度学习领域,专注于目标检测、OCR识别与图像分类。从锚框回归到像素级文字解析,再到细粒度类别判别,构建端到端的智能感知链路。用高效代码驱动模型训练与推理,赋能视觉系统精准理解图像语义——让机器不仅看得见,更读得懂、分得清。
1.目标检测方面:车牌定位,证件定位,文本行定位
2.OCR识别方面:身份证、驾驶证等证件类识别以及小语种识别,例如:日语,阿拉伯文、泰文等
3.图像分类:证件分类、文档分类
主要做阿拉伯文数据合成,模型搭建,模型训练、测试。搭建libtroch编译环境,写阿拉伯文后处理,封装相应的c++接口,以便后续调用,
这是一套基于 ONNXRuntime 的智能车牌定位识别系统,系统融合了 YOLO11-OBB 旋转目标检测模型与 LPRNet/CRNN 车牌字符识别模型,实现了车牌的自动检测、旋转框定位、透视矫正、字符识别以及结果可视化显示。整个工程采用 Python + PyQt5 开发,