大模型 & Agent 架构:LangChain、LangGraph、ReAct、Function Calling
RAG & GraphRAG:Milvus 向量检索 、 BM25 混合检索 、 Cross encoder 重排序 、 Neo4j 图探索
模型微调:LoRA 参数高效微调、无监督 SimCSE 对比学习
部署与推理:Docker、FastAPI、Ollama、vLLM
多模态 Agent-RAG 法律问答系统
使用 MinerU 完成 PDF 文本/表格解析,结合 CLIP 多模态向量融合、BLIP 向量重排
针对法律领域语料进行 LoRA 句向量微调,提升语义检索准确性
构建 Milvus + BM25 混合检索,并使用 Cross Encoder 进行 rerank,大幅提升召回率与问答效果
引入 GraphRAG 流程,支持复杂多跳推理与知识关系探索
通过 Function Calling 注册工具扩展知识来源
使用 Docker + FastAPI 部署,完成镜像打包与端口暴露,实现在线服务化