1.核心后端与分布式架构:精通 Go/Python,擅长设计高并发微服务。熟练掌握 MySQL(分库分表)、PostgreSQL 及向量数据库(如 Milvus、PGVector)。深入使用 Redis(缓存/消息队列)、Kafka,并基于 Docker、Kubernetes 与 Helm 实现容器化编排与云原生部署。熟悉 gRPC、Prometheus/Grafana 监控体系及 AWS/Aliyun 云服务。
2.算法模型与AI工程化:深入掌握 PyTorch、TensorFlow 框架及 Transformers 生态。具备大语言模型(LLM)的全流程能力,包括预训练数据构建、指令微调(SFT)、奖励模型训练与人类反馈强化学习(RLHF)。熟练运用 LangChain、LlamaIndex 构建复杂Agent与RAG(检索增强生成)应用,并精通使用 vLLM、TGI 进行大模型的高性能推理服务化部署。熟悉模型量化(GGUF、AWQ)、LoRA/QLoRA微调等轻量化技术,以及DSPy 等最新编程框架。
3.系统整合与优化:擅长将大模型能力封装为标准化、低延迟的API服务,并通过弹性伸缩、动态批处理、持续推理等技术优化资源利用率与成本。关注从数据管道、模型训练、服务部署到在线学习的完整MLOps闭环,能利用 MLflow、Weights & Biases 进行实验追踪与管理。
1.千万级用户智能客服系统:基于微服务架构整合LLM,使用LangChain与RAG技术,结合Milvus向量数据库,实现95%的自动应答率,日均处理问答2000万次。
2.电商个性化推荐平台:构建融合Transformer与协同过滤的混合模型,通过Kafka实时处理用户行为,使用Redis缓存热点推荐,将点击率提升18%,支撑亿级商品库。
3.跨模态内容审核引擎:部署多模态模型(图像、文本、视频),通过GPU集群实现并发推理,建立自动化审核流水线,每日处理内容超1亿条,准确率99.5%。
4.金融风控与预测系统:开发时序预测与异常检测模型,整合实时交易数据流,利用特征工程与XGBoost/LightGBM模型,将风险识别提前至毫秒级,减少30%潜在损失。
5.智慧城市交通流预测平台:利用图神经网络(GNN)与时空数据建模,处理海量IoT传感器数据,通过云原生服务部署,实现区域流量预测准确率88%,助力动态调度。
6.企业级知识管理与问答中台:为客户构建私有化RAG系统,微调嵌入模型,集成OA与数据库,实现非结构化文档智能检索,将知识查找效率提升70%。
7.AI低代码应用开发平台:设计可视化编排界面,后端封装LLM、OCR、语音等AI能力为标准化API,支持快速组合与部署,已上线超500个企业定制化AI应用。
| 角色 | 职位 |
| 负责人 | 软件开发 |
| 队员 | 后端工程师 |
基于微服务架构整合LLM,使用LangChain与RAG技术,结合Milvus向量数据库,实现95%的自动应答率,日均处理问答2000万次。.客服系统的实时对话、知识库检索与运营看板。
构建融合Transformer与协同过滤的混合模型,通过Kafka实时处理用户行为,使用Redis缓存热点推荐,将点击率提升18%,支撑亿级商品库。推荐平台的商品瀑布流、实时推荐理由与算法指标看板。