ID:422066

Greg

高级研发工程师

  • 公司信息:
  • 华为技术有限公司
  • 工作经验:
  • 10年
  • 兼职日薪:
  • 2000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 西安
  • 全区

技术能力

作为一名深耕IT行业多年的高级研发工程师,我担任技术顾问时所具备的核心能力体系覆盖了从底层基础设施到上层智能应用的完整技术栈。首先,在编程语言层面,我精通 Go、Python 和 Shell 脚本开发:Go语言的高并发与高性能特性使我能够为微服务网关、数据面组件及中间件提供最佳实践方案;Python则赋予我快速进行算法原型验证、数据处理流程构建以及AI模型训练/推理脚本优化的能力;Shell脚本确保我在系统运维、自动化任务编排及CI/CD流水线设计中游刃有余。其次,在云原生技术领域,我对容器化(Docker)、Kubernetes编排、服务网格(Istio/Linkerd)、声明式API以及GitOps理念有深入理解,能够帮助企业从传统架构平滑迁移到云原生架构,设计弹性、可观测、高可用的基础设施,并解决复杂的网络与存储问题。再者,在AI Infra(人工智能基础设施)方面,我精通GPU集群调度优化、分布式训练框架(如PyTorch Distributed、Horovod)、推理加速引擎(vLLM、TensorRT)、模型服务化部署(Triton Inference Server)以及异构计算资源管理(Kubeflow、Slurm),能为大模型训练、微调与推理提供生产级的性能调优与成本控制方案。此外,我拥有丰富的大规模与分布式系统实战经验,包括数据分片、一致性协议(Paxos/Raft)、分布式事务、负载均衡、熔断降级及全链路压测等,擅长诊断跨数据中心、跨云环境的性能瓶颈与数据一致性问题。综合这些技术能力,我能够为企业提供从架构设计、技术选型到故障攻坚的全方位咨询,助力其构建高可靠、高效率、可演进的技术体系。

项目经验

1. 企业级云原生可观测性平台
主导设计并实现了基于 Go 的轻量级数据采集器,兼容 Prometheus 指标、OpenTelemetry 链路追踪及日志流,通过 Operator 模式在 Kubernetes 上完成自动发现与配置热加载。存储层采用 分布式时序数据库(如 M3DB/Thanos)处理每日 PB 级的指标写入,查询平均延迟低于 200ms。针对多集群场景,自研了联邦分级存储与全局聚合查询引擎,解决了跨云、跨机房监控数据孤岛问题。该项目体现了对云原生生态、Go 高并发及分布式存储设计的掌控力。

2. 大模型高性能推理网关(AI Infra)
为支撑千亿参数 LLM 的线上服务,基于 Python 与 vLLM/TensorRT-LLM 构建推理加速层,实现 PagedAttention 显存优化与连续批处理(Continuous Batching)。在服务侧,用 Go 开发无状态推理网关,集成请求动态路由、优先级队列(基于令牌桶与公平调度)及流式响应聚合。通过 NVIDIA Triton Inference Server管理异构 GPU(A100/H800)池,并利用 Kubeflow 完成模型的蓝绿部署与自动扩缩容(基于 GPU 利用率与队列长度)。此外,研发了专用的模型预热与缓存机制,将首 Token 延迟降低 40%。该项目充分展示了您在大模型服务化、GPU 资源调度及高性能推理方面的工程能力。

3. 分布式数据同步系统(支持万级节点)
为解决多数据中心间海量小文件与元数据的实时同步需求,自研了基于 Go 的 P2P 同步组件,采用 Raft 一致性协议管理同步任务配置,并借鉴 Gossip 协议实现节点状态传播。系统支持增量变更捕获(类似 CDC)、断点续传与数据校验(Merkle Tree 差分),单集群可承载 1w+ 节点同时同步,吞吐量达 5w+ 事件/秒。针对跨海弱网场景,实现了自适应拥塞控制与传输压缩(LZ4/Zstd),并通过 Shell 脚本封装了灰度上线与故障自愈工具链。该项目凸显了您在大规模分布式共识、网络优化及系统鲁棒性设计上的经验。

案例展示

  • 无人机航路规划算法

    无人机航路规划算法

    图1 A*算法航路规划示意图 该图展示基于栅格地图的A*启发式搜索航路规划结果。整个飞行空间被划分为规则栅格单元,障碍栅格与可行栅格明确区分。A*算法综合考量实际移动代价与预估启发代价,优先向终点方向搜索,大幅缩减无效搜索范围。规划出的路径全局最优,路线简洁、避障效果良好,适用

  • 智能体系统

    智能体系统

    图1:AI Agent 分层模块化整体架构图 该架构为自研AI Agent标准分层体系,遵循感知-记忆-思考-执行-交互的智能体运行逻辑。 1. 感知层:作为数据入口,统一接收文本、语音、图像、设备信号等多模态输入,完成数据清洗与标准化预处理; 2. 记忆层:分为短时会话记

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服