ID:396011

Huanxeshi、 有团队

AI解决方案架构师

  • 公司信息:
  • 微软
  • 工作经验:
  • 7年
  • 兼职日薪:
  • 1800元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 其他
  • 全区

技术能力

1. AI工程化全栈能力
构建企业级MLOps流水线,覆盖从PyTorch/TensorFlow模型训练到ONNX/Triton推理服务部署全周期,历史项目实现客户部署周期缩短60%
设计动态资源调度算法,在微软任职期间开发的云计算优化系统
掌握AutoML技术栈优化能力,集成贝叶斯优化与神经网络架构搜索(NAS)技术

2. 高并发系统架构设计
主导过日均10亿+调用量的分布式系统重构(谷歌文档协作平台),采用Celery+Redis+RabbitMQ技术栈实现吞吐量300%提升 - 精通微服务治理,基于Istio服务网格实现API调用链路的99.99%可用性保障
设计过支撑百万QPS的实时分析系统,使用Flink+ClickHouse技术组合将数据处理延迟压降至50ms内

3. 数据基础设施优化
重构Spark数据管道实现TB级数据处理延迟降低40%,制定《大数据治理规范V3》成为Meta内部技术标准
搭建实时用户行为分析看板,通过Kafka+KSQL+Superset技术栈驱动DAU提升25%
开发过PB级数据湖的智能分区策略,减少存储成本35%的同时提升查询效率

4. 云原生与DevOps体系
设计多云适配架构(AWS/GCP/Azure),开发Kubernetes Operator实现跨云集群的自动伸缩
构建CI/CD工具链,集成SonarQube+Jaeger+Prometheus实现代码质量/性能/安全的三位一体监控
编写Ansible自动化部署框架,将生产环境部署耗时从2小时压缩至15分钟

项目经验

微软核心项目:企业级AI中台开发
技术挑战:客户AI模型训练存在资源浪费严重(GPU利用率<35%)、跨团队协作低效(手动配置环境占30%工时)、多云环境适配成本高等痛点。

创新方案与实施:
1. 全自动MLOps流水线
基于PyTorch构建容器化训练框架,集成Kubeflow实现动态资源调度
开发“自适应批处理算法”,根据GPU显存自动调整训练批次大小,提升利用率至78%
设计“多云抽象层”,支持AWS/GCP/Azure异构算力统一管理,减少环境迁移成本60%

2. 智能资源预测系统
采用LSTM时间序列模型预测GPU需求峰值(预测误差<8%)
实现抢占式实例与预留实例的混合调度策略,综合成本降低42%
构建“弹性伸缩决策树”,自动触发横向扩展(Pod数量)与纵向升级(GPU型号)

3. 协作效能提升工具链
开发“模型版本沙盒环境”,支持多团队并行实验(隔离冲突率从25%降至3%)
创建自动化报告生成器,整合TensorBoard日志与成本监控数据,节省工程师20%分析时间

商业价值与技术成果:
成本优化:年节省云计算支出280万美元(资源利用率提升120%)
效率突破:客户模型部署周期从21天压缩至8天(提速62%)
技术创新:获3项美国专利(US11235821B2/US11455321B2/US11605021B2),涵盖动态调度算法与多云适配架构
工程影响:方案被微软Azure Machine Learning服务部分集成,支撑全球500+企业客户AI落地

技术验证体系:
通过百万级并发训练任务压力测试(峰值调度10,000+ GPU实例)
安全防护:实现RBAC权限控制+VPC网络隔离,通过SOC2合规审计
代码质量:核心模块单元测试覆盖率92%,SonarQube技术债务评级A

团队情况

  • 整包服务: PC网站开发   H5网站开发   WebApp开发   
角色 职位
负责人 AI解决方案架构师
队员 后端工程师

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服