我具有工程与技术管理经验,全面掌握从需求分析、系统架构设计到稳定上线的完整交付流程。精通 Java、Go、Python 与 Node.js,可在大型微服务与 Serverless 架构间自由切换;擅长利用 Spring Cloud、Dubbo、Istio 等技术实现高可用、弹性伸缩与限流熔断。具备深厚的数据库功底,熟悉 MySQL、PostgreSQL、MongoDB、ClickHouse 与 Redis、Kafka 等中间件的性能调优及高可用部署。广泛实践 DevOps 与 GitOps,能基于 Kubernetes、Docker、Terraform、ArgoCD 构建自动化 CI/CD 与灰度发布体系,实现分钟级回滚。曾主导多条千万级日活业务的性能压测与容量规划,平均将资源成本下降 30% 以上。对云原生 Observability 有系统经验,能够整合 Prometheus、Grafana、Jaeger 与 Loki 打造统一监控、链路追踪与日志平台。近年深耕 AIGC 与大模型应用,熟悉 OpenAI、Claude、Kimi、DeepSeek 等多模型融合调度,并在金融、零售与政企场景中落地智能客服、文档摘要与代码生成。注重工程质量,倡导领域驱动设计、可观测性优先与零信任安全理念,致力于用高效、可维护的技术方案持续创造业务价值。
国际化电商平台负责核心交易系统重构,通过引入分布式事务编排与 Saga 补偿机制,将单体架构拆分为 40 余个微服务,配合 Kubernetes 弹性伸缩,双 11 峰值订单处理能力从 3 万 TPS 提升至 12 万 TPS,系统可用性稳定保持在 99.99%。同时基于 Istio 服务网格实现灰度发布与流量镜像,结合自研实时监控大屏,故障发现时间缩短至 30 秒以内。
在国内头部金融科技公司牵头建设下一代数据中台,采用 Flink + Kafka + ClickHouse 实现准实时数仓,支持上百条流式指标秒级刷新;通过维度建模与元数据治理,提高数据复用率 45%,支撑智能风控与精准营销场景。项目期间主导落地 GitOps 流水线与“数据即代码”理念,使数据模型与 ETL 作业版本化管理,大幅降低回溯成本。
为大型零售集团打造全链路观测平台,整合 Prometheus、Grafana、Jaeger、Loki 与 Alertmanager,形成统一指标、日志、链路追踪与告警中心。结合成本透视与容量预测算法,帮助运营团队在旺季提前两周完成资源调度,降本增效约 35%。此外以 OpenPolicyAgent 构建细粒度 RBAC 与审计体系,确保多租户场景下的数据安全与合规。
最近在智能客服领域落地多模态大模型平台,设计混合调度框架整合 OpenAI、Claude、Kimi、DeepSeek 等模型,并利用向量数据库进行长上下文检索,平均回答精准率提升至 93%,成功服务金融、政务与教育客户,显著提升用户满意度与运营效率。