熟悉主流Linux操作系统。
熟练使用Shell、Python、Go处理相关任务。
熟悉WEB服务器系统的配置和软件服务器塔建如Apache/Nginx、Tomcat。
熟悉MySQL、Oracle、Redis、Mongodb数据库部署和相关SQL操作。
熟悉Nagios、Zabbix、Cacti、Prometheus等开源监控软件。
熟练使用Keepalived、lvs、Haproxy使用。
熟悉使用Kubernetes容器服务编排,及了解云原生生态周边产品如argocd、Terraform、Velero、Service Mesh等使用。
熟悉使用jenkins、tekton、jenkins、gitlab runner等工具结合argocd的使用。
项目:阿里云私有云平台维护
项目描述:基于阿里云天基私有化部署平台维护,2regoin,管理1500+服务器承载200+生产环境业务,300+测试环境业务环境。
1、负责协调阿里云产品升级,对于阿里云产品升级方案的风险把控分析。
2、负责协助业务组阿里云产品,使用期间出现的业务问题处理。
3、负责阿里云私有化平台底座巡检。
4、负责协助业务组国产化迁移测试。
项目:财务中台
项目描述: 2000多家线下门店财务数据核对,核销平台,基础设施阿里云,前端vue,后端java项目,主要解决财务人工核账单数据,减少人工失误。
1、负责传统部署方式迁移到k8s集群工作。
2、负责基于kubesphere周边,集成jenkins,argocd自动化流水线工作的建设。
3、负责istio引入灰度发布。
4、业务容器监控及告警建设,及业务容器异常内存快照下载通知。
5、业务容器日志采集告警。
项目:音视频直播平台
项目描述: 音视频直播平台。项目基础设施建立在阿里云(30台服务器、redis、mongodb、rds、es、im、zk、nfs、nas)、相关第三方平台(声网、数美、神策)。系统由前后端组成,前端为安卓和iOS,后端为java基于springcloud框架。
1、负责线上版本发布。
2、负责配合开发人员排查解决工作相关问题。
3、负责ci/cd平台的完善。现有繁琐的jenkins配置优化,将公用部分抽离到jenkins的共享库,使用pipeline编辑流水线,再接入argocd的cd功能对接到k8s集群,实现gitops的部署方式,更加方便快速回滚,以及notification接入对接dingtalk,当部署至k8s集群的应用正常后发送到dingtalk消息。
4、负责将现在运行的系统逐步迁移至k8s环境中,目前测试和预发布已接入k8s集群。
5、负责apk打包环境的建设。安卓渠道包过多导致,开发人员本地release产出过慢,然后将build环境放在jenkins的动态slave做打包环境,将build时间由小时压缩之至分钟。
6、负责promethheus监控和警告建设。完善未成形的grafana+prometheus监控平台,告警方式通过alertmanager请求python编辑的转接器发送到dingtalk实现警告。
7、负责日志采集完善,基于阿里云sls。java日志采集格式处理,以及动态的接入对应的project调整。
1,测试/预发布/生产环境版本升级发布。 2,传统部署迁移到k8s业务环境,自动发布流程设计。 3,协助开发对于生产环境图片优化,减少图片浏览开销,节约成本。
1、负责线上版本发布。 2、负责配合开发人员排查解决工作相关问题。 3、负责ci/cd平台的完善。现有繁琐的jenkins配置优化,将公用部分抽离到jenkins的共享库,使用pipeline编辑流水线,再接入argocd的cd功能对接到k8s集群,实现gitops的部署方式