猿急送>

杭州其它兼职程序员

ID：421035

sunshine 有团队

架构工程师

公司信息：
杭州深度求索人工智能基础技术研究有限公司

工作经验：
2年

兼职日薪：
500元/8小时

兼职时间：
下班后
周六
周日
可工作日远程

所在区域：
杭州
拱墅

技术能力

Python、C/C++、CUDA、Go、Shell、yTorch、DeepSpeed、Megatron-LM、vLLM、TensorRT-LLM、Transformers、Ray、Kubernetes、Docker、SLURM、NCCL、RDMA、大模型训练与推理、MoE架构设计、分布式并行策略（TP/PP/DP/EP）、模型量化与压缩、Transformer优化、KV Cache管理、FlashAttention

项目经验

我主导设计了基于Megatron-LM + DeepSpeed的分布式训练框架，实现Expert Parallelism与Tensor/Pipeline Parallelism的混合并行策略。支持最大32K卡扩展，MFU（模型浮点利用率）达到52%，千亿参数模型收敛时间缩短35%。

团队情况

整包服务：微信公众号开发微信小程序开发 PC网站开发 H5网站开发

角色	职位
负责人	架构工程师
队员	产品经理
队员	UI设计师
队员	前端工程师
队员	后端工程师

案例展示

VortexInfer推理引擎

基于Megatron-LM+DeepSpeed构建的千卡级大模型训练系统。自研MoE Expert负载均衡算法，支持TP/PP/DP/EP四维混合并行，最大扩展至32K GPU。MFU达52%，千亿模型收敛时间缩短35%。
OmniScale

从零搭建千亿参数MoE大模型的训练基础设施。设计了基于Megatron-LM + DeepSpeed的分布式训练框架，实现Expert Parallelism与Tensor/Pipeline Parallelism的混合并行策略。自研MoE Expert负载均衡算法，优化All-
VortexInfer

面向企业客户的LLM推理部署需求，基于vLLM + TensorRT-LLM构建高吞吐、低延迟的推理系统。集成Continuous Batching、PagedAttention、FP8 KV Cache量化。自研请求调度算法，支持模型热加载与A/B测试框架。

查看案例列表（含更多 0 个案例）

相似人才推荐

联系需求方端客服

热门标签列表

程序员接私活程序员兼职企业外包外包案例

热门城市人才

北京兼职程序员上海兼职程序员广州兼职程序员深圳兼职程序员杭州兼职程序员成都兼职程序员天津兼职程序员重庆兼职程序员武汉兼职程序员西安兼职程序员南京兼职程序员长沙兼职程序员苏州兼职程序员厦门兼职程序员福州兼职程序员合肥兼职程序员济南兼职程序员青岛兼职程序员大连兼职程序员长春兼职程序员沈阳兼职程序员哈尔滨兼职程序员石家庄兼职程序员太原兼职程序员无锡兼职程序员南昌兼职程序员洛阳兼职程序员郑州兼职程序员南宁兼职程序员珠海兼职程序员宁波兼职程序员昆明兼职程序员东莞兼职程序员贵阳兼职程序员温州兼职程序员佛山兼职程序员中山兼职程序员海口兼职程序员常州兼职程序员兰州兼职程序员呼和浩特兼职程序员乌鲁木齐兼职程序员海外兼职程序员其他兼职程序员山东兼职程序员远程兼职程序员

热门城市职位

北京程序员招聘上海程序员招聘广州程序员招聘深圳程序员招聘杭州程序员招聘成都程序员招聘天津程序员招聘重庆程序员招聘武汉程序员招聘西安程序员招聘南京程序员招聘长沙程序员招聘苏州程序员招聘厦门程序员招聘福州程序员招聘合肥程序员招聘济南程序员招聘青岛程序员招聘大连程序员招聘长春程序员招聘沈阳程序员招聘哈尔滨程序员招聘石家庄程序员招聘太原程序员招聘无锡程序员招聘南昌程序员招聘洛阳程序员招聘郑州程序员招聘南宁程序员招聘珠海程序员招聘宁波程序员招聘昆明程序员招聘东莞程序员招聘贵阳程序员招聘温州程序员招聘佛山程序员招聘中山程序员招聘海口程序员招聘常州程序员招聘兰州程序员招聘呼和浩特程序员招聘乌鲁木齐程序员招聘海外程序员招聘其他程序员招聘山东程序员招聘远程程序员招聘

热门人才推荐

热门职位推荐

iOS工程师Android工程师前端工程师后端工程师嵌入式工程师UI设计师产品经理测试工程师运维工程师游戏工程师运营/编辑其它

找人才 | 接项目 | 招聘专员 | 京ICP备16030138号-1 | Copyright © 2015-2026 猿急送