1. 全文检索与智能知识库(基于 Elasticsearch)
设计多源数据同步机制,将 审批记录、制度文档、会议纪要、上传文件 自动抽取文本并索引至 ES
使用 Elasticsearch 的 IK 分词器 + 同义词库 优化中文搜索体验,支持模糊匹配、高亮显示、相关性排序
实现 权限感知搜索:用户仅能检索其有权限访问的文档(通过 ACL 字段过滤)
查询响应时间 < 300ms(千万级文档量),支持按类型、部门、时间范围组合筛选
2. AI 智能问答引擎(RAG 架构)
基于 LangChain + Qwen 大模型 API 构建 RAG(检索增强生成)系统
用户提问(如“年假怎么申请?”) → 自动检索知识库 → 注入上下文 → 调用大模型生成精准回答
支持 多轮对话记忆 与 引用溯源(回答中附带原文链接)
通过 向量嵌入(text-embedding) + ES kNN 搜索 提升语义匹配准确率
敏感问题自动拦截,确保回答符合企业合规要求
3. 灵活可配置的 OA 审批流程引擎
自研 可视化流程设计器(前端拖拽节点),支持会签、或签、条件分支、自动跳过等复杂逻辑
审批状态机持久化至 PostgreSQL JSONB 字段,支持动态扩展表单字段
集成 企业微信/钉钉通知,审批超时自动提醒
提供 审批数据分析看板:平均处理时长、驳回率、高频审批人等
4. 高性能文件与视频服务
文件存储采用 MinIO 对象存储,支持断点续传、分片上传(>2GB 大文件)
视频上传后自动触发 Celery 异步任务:
调用 FFmpeg 转码为 H.264 格式(适配多端播放)
生成关键帧缩略图
提取音频用于后续语音转文字(ASR)
前端使用 Video.js + HLS 实现流畅播放、倍速、画质切换
所有文件访问受 RBAC 权限控制,URL 带时效 Token 防盗链
5. 系统可靠性与工程实践
全链路 Docker 容器化部署,Kubernetes 编排(测试环境)
关键操作(如审批提交、文件删除)记录 审计日志,满足 ISO 27001 合规
使用 Redis 分布式锁 防止审批重复提交
编写 Pytest + Playwright 自动化测试,覆盖核心业务流