编程语言:Java、Go、Python
AI 与大数据框架:TensorFlow、PyTorch、模型蒸馏、分布式训练
(DeepSpeed/FSDP)、大模型推理优化(vLLM/TensorRT)
高并发架构:微服务、分布式缓存、消息队列、弹性扩缩容、全链路监控与治理
云原生与中间件:Docker、Kubernetes、Redis、Kafka、ClickHouse、MySQL
大模型相关经验:视觉与多模态模型服务优化、推理加速、模型蒸馏、Token 消耗优
化、算力动态调度
快手(2020.03 – 2023.03)
后端架构师 | 基础技术部
项目一:Kwaipilot 大模型推理与服务架构
主导大模型推理平台的后端架构设计,整合 Python、TensorFlow 等技术栈,构建高
可用、低延迟的大模型服务架构。
针对 40B 参数大模型存在的“过度思考”和算力消耗问题,设计并实施模型蒸馏与轻
量化方案,压缩模型规模的同时保持精度。
构建动态资源调度与弹性伸缩系统,显著提升推理效率,支持日均千万级请求,
Token 消耗降低 80%,推理性能提升 3 倍。
实现模型服务容器化与资源隔离,显著提升资源利用率,大幅降低服务器成本。
项目二:KMock 平台(核心 Mock 工具系统)
项目三:全链路问题定位平台
项目四:流量录制与回放平台
滴滴 (2015.10-2020.03)
软件开发工程师 | 大数据平台 埋点治理体系建设(0-1 项目)
职责:负责人,制定埋点规范与流程,开发管理平台 技术栈:Golang、MySQL、Kafka、Http Socket 成果:
• 建立全公司埋点管理体系,埋点质量提升 60%,可查率 100% • 支撑日均 10 亿+数据采集,服务 20+业务线
| 角色 | 职位 |
| 负责人 | java工程师 |
| 队员 | 产品经理 |
| 队员 | 前端工程师 |
| 队员 | 后端工程师 |