我近期主导的一个核心项目,正是将知识图谱与大模型深度融合,打造面向企业知识库的智能问答系统。项目整体基于 Python 生态开发,为了处理每日产生的海量用户行为日志和异构数据源,我使用 Spark 构建了分布式数据处理管道,高效完成了数据清洗、特征提取和知识关联分析,将处理时间从小时级压缩到分钟级。在此基础上,利用 Neo4j 构建了包含百万级实体与关系的领域知识图谱,并集成大语言模型设计了智能体架构,让其具备多轮对话、上下文理解与任务分解能力。在实际问答流程中,我通过 NLP 技术实现用户意图的精准分类和实体链接,将问题映射到知识图谱子图后,采用检索增强生成(RAG)策略,使大模型能够基于结构化知识给出高可靠性、带溯源的答案。同时,我还引入推荐算法,根据用户画像和历史反馈对候选答案进行个性化排序,提升了信息匹配度。该项目上线后,核心场景的问答解决率提升超过 35%,也切实验证了知识图谱增强大模型在真实业务中的稳定性和准确性。