Kubernetes, Docker, Jenkins, Ansible, Go, Python, Shell scripts, Java, Javascript, SQL, Flask, Spring, MyBatis,
技术核心能力
容器化与云原生:精通 Docker/Kubernetes 架构设计,主导 WebSphere Commerce 容器化改造(镜像体积压缩 50%,部署时间从 4 天缩短至 4 小时)。
AIOps 与可观测性:深度落地 Instana 全链路监控平台,实现用友 PaaS 平台故障定位效率提升 700%(bug 解决周期从 7 天→1 天)。
数据库优化:主导 ClickHouse 成本优化工程(ARM64 节点替换、读写分离架构),推动 SaaS 平台运营成本降低 40%+。
CI/CD 与自动化:重构 ClickHouse Operator 全流程 Pipeline,开发 Keeper 集群控制器(移除 ZooKeeper 依赖),贡献至开源社区。
核心项目经验
1. Instana 监控平台技术落地(IBM)
技术攻坚:为用友 IUAP 平台定制 Instana 架构,完成 ClickHouse/Cassandra 集群性能调优,通过 2000+TPS 压测验证。
效率提升:设计故障定位方法论,结合 Instana 链路追踪功能,帮助客户将应用性能问题排查时间从 72 小时压缩至 8 小时。
2. ClickHouse SaaS 成本优化工程(IBM)
架构重构:实施 "存储分层 + 读写分离" 架构,冷数据迁移至 S3 存储(存储成本降低 60%),引入 ARM64 节点替代 x86(计算成本降低 35%)。
自动化落地:基于 Jenkins+Ansible 开发弹性伸缩脚本,实现集群资源利用率动态监控(CPU/GPU 阈值触发自动缩容),日均节省资源消耗 25%。
3. ClickHouse Operator 开源项目(IBM)
核心开发:主导 Keeper 集群控制器开发(Go 语言),通过 CRD 自定义资源实现无 ZooKeeper 部署,代码被合并至 ClickHouse 官方仓库。
CI/CD 优化:重写 Tekton CI Pipeline,引入 Flux CD 实现灰度发布,部署效率提升 3 倍,发布故障率降至 0.5% 以下。
4. WebSphere Commerce 容器化改造(IBM)
技术重构:采用 Docker Multistage 构建优化镜像,基于 Kubernetes 设计 StatefulSet 部署方案,实现微服务化拆分(原单体应用拆分为 12 个容器服务)。
成果量化:镜像体积从 1GB 压缩至 500MB,CI/CD 流水线耗时从 24 小时缩短至 3 小时,获客户 "年度技术突破奖"。
技术栈与工具
开发语言:Java/Python/Go(主导 ClickHouse Operator 开发)、COBOL(CBOD 核心系统改造)
容器与云:Docker/Kubernetes/OpenShift、Helm/Argo CD(CI/CD 自动化)
数据库:ClickHouse/Cassandra/PostgreSQL(FIPS 合规改造)、Elasticsearch/Kafka(日志链路处理)
DevOps:Jenkins/Ansible/Tekton CI、Prometheus/Grafana(监控体系搭建)
在 AWS 上,透过 Ansible 脚本来将原本运行在 Intel 或 AMD 的节点迁移到 ARM64 以降低营运成本。 在 图一 里,addReplica.yml 负责现存的 ClickHouse 集群添加新的 ARM64 节点。removeReplica.yml 负
在 Kubernetes,ClickHouse Operator 管理的集群里,进行数据无损缩容自动化 这是一组 Python 脚本:(Shard removal.png) disable_write_to_last_n_shards.py 负责将准备移除的 shard
1. 基础镜像流水线 通过预构建包含核心依赖包的基础镜像,将后续流水线执行效率提升数倍,Dockerfile 集中管理于 tekton/dockerfiles,镜像存储于 us.icr.io/chop-tmp,为全流程加速奠定基础。 2. 镜像扫描流水线 创新实现 “