本项目主要面向企业内部文档场景打造的智能问答系统,提供文档上传、解析、检索与AI问答功能,支持基于知识库的精准问答与离线兜底服务。
1.设计并实现GoAPI网关,统一文档上传、对话、健康检查、转发等接口,对接PythonAI服务
完成PDF/Word/Excel多格式文档解析与分块,搭建Chroma向量+BM25双索引与RRF融合检索
2.基于LangChain封装HybridRetriever与生成链,对接通义千问qwen-max实现智能问答
3.配置环境变量管理密钥,无LLMKey时自动切换抽取式兜底,支持离线可用
4.采用Go网关+PythonAI微服务分离架构,便于独立部署与扩展
5.设计MD5集合缓存与去重策略,向量库加载前基于文件哈希值进行重复检测,命中相同的文件时直接跳过,避免重复向量化,提升加载速度。
6.会话历史管理:redis存储会话历史,设置时间有效期,但文档向量、用于AI检索的数据放入向量库中直接对接LangChain。
7.ReAct推理模式:在工具调用阶段引用ReAct循环(思考-行动-观察),agent先思考工具选择,执行后观察结果与目标对比,判断任务完成度。