【项目简介】 一款面向垂直领域的智能出题与知识管理系统。利用 RAG(检索增强生成) 技术,整合电商评论、社交媒体及官方文档等多源异构数据,实现基于大模型的高质量试题自动化生成与校验,打通“采集-清洗-生成-质检-交付”全流程。
【核心职责】 后端架构设计与核心开发。采用 FastAPI (Async) + SQLAlchemy 构建高性能异步后端,负责系统架构设计、AI 模型对接及核心业务落地。
【技术亮点】
RAG 知识引擎(核心):构建基于 ChromaDB 的向量知识库,结合 OCR 图文提取技术,实现“语义检索 + 元数据过滤”的混合检索策略,有效解决大模型知识幻觉问题。
智能生成与 AI 质检:设计多线程并发出题引擎,创新引入自动化质量评分机制(RLHF 思想),从严谨性、相关性等维度实时剔除劣质题目,显著提升可用率。
高并发与体验优化:利用 SSE (Server-Sent Events) 技术实现爬虫与生成任务的毫秒级实时进度推送,解决长耗时任务的用户体验瓶颈。
【技术栈】
后端: FastAPI, Python (Async)
AI/数据: LLM (Qwen/GPT-4), ChromaDB, LangChain 思想
工具: Playwright (数据采集), Pandas (清洗)