技术:1. 大模型推理与部署架构(LLM Infra): 深耕大模型推理服务体系。深入理解 vLLM、SGLang、llama.cpp 等主流推理后端的底层原理,熟练掌握 PagedAttention 内存管理机制、Continuous Batching(连续批处理)及 FlashAt
项目:项目一:Xinference 企业级大模型分布式推理系统 - 项目角色:核心研发 / 算法研究 - 项目描述: 参与研发了一款高性能的大模型部署与管理框架,旨在解决大模型落地过程中部署复杂、资源调度难的问题。系统提供与 OpenAI 兼容的标准 API,支持从模型下载到生命
案例: 中文知识图谱构建与更新系统
技术:1、熟悉Python和常用的开源库,熟练使用Django/Flask等主流的web开发框架; 2、熟悉Mysql,mongoDB, Redis,Es,队列等数据库的使用和优化; 3、对进程、线程、协程、异步、非阻塞有一定了解和使用 4、对linux系统基础知识及原理了解较深
项目:项目描述: 爱信诺企服是在线财税专业服务平台,服务于企事业单位的财税从业人员,致力解决企业财 税从业者日常工作的问题,通过开票软件、开票系统的线上故障申报和远程服务,让用户足不出户解 决财税软件问题,该平台还为用户提供国税、地税、所得税最新的政策和相关政策,让用户了解最新
案例: 爱信诺企服平台