大语言模型微调部署,本地知识库构建,扣子RAG智能体工作流。Wav2Lip,Ultralight-Digital-Human,DINet数字人; Hunyuan文生图。 计算机视觉,OCR 人脸识别 RotatedYolo Paddleocr Python、LangChain、向量数据库、OpenAI API Python, Shell Web框架: Django, Flask, Fastapi python 第三方库:langchain,transformers,vllm Transformer架构: 深入理解Transformer, BERT, GPT系列
Proment部分:严格按照提示词写作要求(角色,背景,任务,写作要求,限制条件等),不断和clude3,openai,deepseek等对话优化各部分功能提示词精简tokens和通过客户使用记录迭代提示词
微调部分:通过对比测试DeepSeek-R1-Distill-Qwen-14B(2*4090),Qwen2.5-14B-Instruct-GPTQ-Int8
(2*4090),Qwen2___5-32B-Instruct-GPTQ-Int8(A100),Llama等的lora微调效果重新训练。数据清洗,用训练好的模型进行数据润色扩充,本地模型服务搭建,本地知识库构建,扣子RAG智能体工作流。
项目概述: 使用旋转目标检测模型在面单中找到功能区域包括: 收件人, 寄件人, 三段码, 条形码,对收件人 寄件人 三段码的文字区域使用不同模型进行ocr识别和再排版,条形码使用像素分布进行解析,照片质量限制的文字使用超分算法和ocr大模型进行再识别.
使用工控机和白色频闪光源及130万像素海康威视工业相机连续抓拍图片,8万张自动保存图片2万张人工保存图片2万张不同光源焦距图片,共12万张图片10个类别(包括好枣微变形变形鸟啄红裂黑裂肉干瘦干黑斑黄皮),使用vott标注,后期使用训练得到的模型自动标注数据集节省大量时间.
人脸识别:静默人脸活体检测和人脸识别
环境: Python Android
项目概述: 储物柜通过人脸识别存取物品,为防止人为攻击加有活体检测
Proment部分:严格按照提示词写作要求(角色,背景,任务,写作要求,限制条件等),不断和clude3,openai,deepseek等对话优化各部分功能提示词精简tokens和通过客户使用记录迭代提示词 微调部分:通过对比测试DeepSeek-R1-Distill-
开发环境: RotatedYolo Paddleocr GPU NPU Android RK3399 Python 项目概述: 使用旋转目标检测模型在面单中找到功能区域包括: 收件人, 寄件人, 三段码, 条形码,对收件人 寄件人 三段码
开发环境: RotatedYolo Paddleocr GPU NPU Android RK3399 Python 项目概述: 使用旋转目标检测模型在面单中找到功能区域包括: 收件人, 寄件人, 三段码, 条形码,对收件人 寄件人 三段码