项目 1:搜索查询理解与意图改写平台(LLM + RAG)
基于文心大模型构建的搜索 Query 语义理解平台,通过向量检索(pgvector/Milvus)+重排序(Cross-Encoder)+LLM 结构化输出,实现 Query 的意图识别、槽位抽取与多候选改写,并为召回系统提供可直接消费的 JSON 结果。系统支持 DAU 级在线流量,延迟 <80ms,显著提升长尾 Query 的召回覆盖与 CTR 表现。
技术栈:Python、FastAPI、Redis、ClickHouse、pgvector/Milvus、PaddleNLP Embedding、ERNIE/Qianfan LLM、RAG、ReRank、Prometheus/Grafana。