Kubernetes, Docker, Jenkins, Ansible, Go, Python, Shell scripts, Java, Javascript, SQL, Flask, Spring, MyBatis,
**将 Instana 卖进用友**
成功协助 IBM 销售将 Instana 这个监控平台卖进用友,并成为其 PaaS 平台 IUAP 的一部分。
通过对产品架构的了解,我帮用友搭建 Instana 供其内部使用,并通过了严格的性能测试。
我教他们如何高效地使用 Instana。透过 Instana 提供的高可观测性,用友知道 bug 在哪,也能快速找到性能的瓶颈在哪。以前解一个 bug 要一周,使用了 Instana 后,只要一天就能搞定。
通过及时的回应与有效支持,我们终于将 Instana 卖进用友。
**推动 Instana SaaS 降低 ClickHouse 运营成本**
SaaS 是对成本非常敏感的,想要有好的盈利,就必须去除不必要的浪费。因此,我推动透过一下几个方面来降低 ClickHouse 的成本:
1. 使用较便宜的节点 (如:ARM64 的虚机)
2. 缩容
3. 读写分离
4. 存储分层 (将冷数据移到较便宜的盘,甚至是 S3 bucket)
这里使用了 Jenkins 和 Ansible 作为调度工具。
**提供 IBM build 的 ClickHouse Operator**
作为该项目的负责人,我重写了所有的 CI / CD pipeline 以优化它们的执行效率。并进一步扩展一些 use cases,比如重发布及发布到 IBM Catalog。
我为这个 operator 开发了一个新的 controller 用来管理 ClickHouse Keeper 集群,去除了对 ZooKeeper 的依赖,简化系统的整体架构。我还将这个功能反馈回开源社区。
**Instana 本地安装**
带领本地团队对数据库层 (clickhouse, cassandra, postgres, elasticsearch, kafka 及 zookeeper) 的 FIPS 合规进行修改及验证,从而扩大产品的客户群。
在 AWS 上,透过 Ansible 脚本来将原本运行在 Intel 或 AMD 的节点迁移到 ARM64 以降低营运成本。 Topoloy.png 里,是该 SaaS 环境的 purple 集群。左边是 ClickHouse 集群负责提供数据支持,右边是许多与之交互的 K
在 Kubernetes,ClickHouse Operator 管理的集群里,进行数据无损缩容自动化 这是一组 Python 脚本:(Shard removal.png) disable_write_to_last_n_shards.py 负责将准备移除的 shard