一个企业内部知识库问答系统,让员工用自然语言直接问公司文档里的内容,不用再去各种地方翻手册。
员工每次找什么信息要么在内网搜关键词搜一堆不相关的,要么直接发微信问同事占用别人时间。这件事用关键词搜索是解不好的,用户嘴里说"怎么请假",文档标题写的是"假期申请流程",字面对不上。这就是 RAG 的典型场景。
架构上分成两条管道:离线索引管道(文档上传 → 解析 → 分块 → Embedding → 存 PGVector)和在线查询管道(查询改写 → 混合检索 → RRF 融合 → Reranker 精排 → 上下文裁剪 → 引用溯源 → 流式生成)。
技术栈:Spring AI 1.1 + Spring Boot 3.5 + Java 21 + PostgreSQL/PGVector + Redis + MinIO,
模型:通义千问 qwen-plus 做生成,text-embedding-v3 做向量化,gte-rerank 做精排。