深度参与区块链交易所运维,负责Filecoin、Chia、Ironfish、Solana等公链节点的部署、升级与维护。
参与Web3项目投研及技术评估,制定并实施自动化运维策略,开发自动化脚本。
精通Linux/Unix服务器管理与维护,熟悉Windows服务器运维。
熟练使用Shell、Python编写自动化脚本,具备Fabric、Ansible、Selenium、saltstack、Terraform等自动化工具的应用经验,拥有Jenkins、GitLab CI、GitOps等DevOps工具搭建与维护经验。
熟悉阿里云、腾讯云、AWS等公有云平台部署与运维,
具备Docker、Docker Compose,kubernetes等容器化部署能力。
熟悉防火墙、Linux Virtual Server(LVS)、HAProxy、漏洞评估工具、网络协议、VPN等设备配置,
熟练执行数据备份、恢复及灾备方案设计,并具备安全防护措施和jumpserver堡垒机审计经验。
熟练使用夜莺监控系统、Prometheus、ELK等监控与日志分析工具,具备报警策略设计和日志分析经验,通过监控平台实时捕捉系统异常,快速定位并解决故障。
拥有丰富的跨部门协作和团队管理经验,曾在生产主管及PMC岗位积累了流程优化、ERP系统应用等管理经验,擅长将管理经验转化为运维流程改进,提升整体系统稳定性。
项目一:Filecoin 存储挖矿运维项目
担任:运维工程师
负责从硬件选型(高性能 CPU、GPU 加速、NVMe 存储)到软件部署(Lotus 全节点、Miner、worker)的整体规划与实施。
设计并落地 Fabric + saltstack自动化运维体系,实现集群一键部署、升级、备份与恢复,日常运维工时降低 40%。
集成 Prometheus/Grafana/夜莺监控链路,建立关键指标告警与故障自愈流程。
安全架构涵盖防火墙规则、JumpServer 堡垒机审计管理,确保私钥与 RPC 接口访问受控。
项目上线后,系统 SLA 达到 99.99%,全面支撑业务快速扩张与持续高可用运行。
项目二:搭建交易服务后端平台
目标:主导交易平台的部署、测试交付,确保平台稳定运行并进行日常维护。
技术细节:
基础环境搭建:利用脚本自动初始化,批量部署JDK、Nginx、Redis等运行环境,解决了传统手动部署效率低、易出错的问题。
自动发布平台搭建:搭建Jenkins自动发布平台,实现软件的自动化发布、升级和部署,减少人工干预,提高发布效率。
安全与监控管理:规划安全组策略,严格管理登陆权限,添加监控客户端,实时监控平台运行状态,及时发现并处理潜在安全隐患。
流程优化与文档输出:参与作业流程优化,制定标准化运维流程,输出详细的运维文档,提高团队协作效率。
脚本编写与自动化:编写运维脚本,实现大部分运维操作自动化,如系统巡检、故障处理等,提高运维效率。