编程与基础:Python、Git、Linux、Shell
AI框架与模型:PyTorch、Transformers、LangChain、YOLO、OpenCV
数据处理与算法:Pandas、NumPy、Scikit-learn、特征工程、模型调优
服务与部署:FastAPI、Docker、Redis、Celery、PostgreSQL
大模型应用:熟悉 RAG 全链路开发,掌握 LangChain 框架,有企业级知识库系统开发经验。
项目名称:基于RAG架构的企业级智能知识库问答系统
项目背景: 针对企业内部文档分散、信息检索效率低下的痛点,开发了一套基于检索增强生成(RAG)技术的智能问答系统,实现文档的精准解析与自然语言交互。
核心技术栈: Python, LangChain / LlamaIndex, FastAPI, ChromaDB / Milvus, OpenAI API / 智谱AI, Docker。
核心职责与成果:
文档处理与向量化: 利用 LangChain 构建文档加载器,支持PDF、Word、Markdown等多种格式。采用语义分块(Semantic Chunking)技术替代传统的固定长度分块,结合 BAAI/bge-large-zh 嵌入模型,将文本向量化存入向量数据库,有效提升了检索的上下文连贯性,检索命中率(Hit Rate)提升约15%。
检索与生成优化: 设计混合检索(Hybrid Search)策略(倒排索引 + 向量检索),结合 RRF(倒数排名融合)算法重排结果,解决了关键词匹配与语义理解的互补问题。
服务封装与部署: 基于 FastAPI 构建异步API服务,实现了流式输出(Streaming)功能。利用 Docker 进行容器化部署,并接入了前端对话界面,系统平均响应耗时控制在 2s 以内,显著减少了人工查阅文档的时间成本
项目名称:AIGC 内容生成平台(后端架构)
项目背景: 参与开发一款面向营销人员的AI内容生成平台,支持根据关键词一键生成营销文案、海报图以及口播脚本。
核心技术栈: Python, Django / FastAPI, Celery, Redis, PostgreSQL, Stable Diffusion, GPT。
核心职责与成果:
异步任务调度: 由于文生图和长文本生成耗时较长,采用 Celery + Redis 构建异步任务队列。设计了任务状态机(Pending -> Processing -> Success/Failed),支持客户端轮询和WebSocket推送两种方式获取生成结果,解决了高并发下的请求阻塞问题。
多模态接口集成: 封装了对外的API层,统一对接了开源大模型(LLaMA 3)和文生图模型(Stable Diffusion XL)。实现了动态Prompt工程,根据用户输入动态拼接负面提示词(Negative Prompt)和风格化词缀,有效控制了生成内容的可控性。
并发优化: 针对SDXL模型显存占用高的问题,实现了模型预加载和单例模式,结合 asyncio 协程处理IO密集型请求,系统吞吐量(QPS)提升了 3倍。
MarketingGenius —— AI营销内容生成平台 一、项目概述 MarketingGenius 是一款面向数字营销人员的智能化内容创作工具,旨在解决营销人在多平台内容生产中的效率瓶颈。平台通过集成大语言模型与视觉生成技术,实现"关键词输入→多形态内容输出&
作品介绍:PersonaCore —— 虚拟角色实时对话系统 一、项目背景 随着大语言模型技术的突破,虚拟数字人正从简单的问答机器人向具有情感连接能力的智能伙伴演进。在虚拟陪伴领域,用户渴望获得超越工具属性的情感支持;在智能客服场景,企业需要更具品牌人格的服务形象;在教育娱乐