项目职责与成果:
一、代码层整改与可观测性建设
(1)协助开发团队将 .NET Core 3.1 服务升级至 .NET Core 6.0,优化性能与内存管理
(2)引入 Prometheus + Grafana 构建性能监控体系,采集 GC 堆使用、请求响应延迟、错误率等指标
(3)接入 Skywalking 实现调用链追踪,优化链路性能瓶颈
(4)建立 ELK 日志平台,日志通过 Kafka+Logstash 管道统一采集展示
(5)配置 Apollo 配置中心,实现多环境(dev/test/prod)下配置统一管理
二、Kubernetes 容器平台部署与集成
(1)部署生产级高可用 Kubernetes 集群,结合 IngressGateway 实现流量转发控制
(2)设计并实施自动化部署流程:基于 Jenkins Pipeline 实现从代码 → 编译 → 镜像构建 → 部署 → 回滚全流程
(3)编写 Dockerfile 多阶段镜像、k8s 资源清单(Deployment/Service/Ingress/ConfigMap/Secret)
(4)利用命名空间 + RBAC 进行多环境隔离与权限控制,增强系统安全性
(5)配置 NetworkPolicy 限制 Pod 间通信;部署 HPA、Liveness/Readiness 探针实现应用自愈与弹性伸缩
(6)使用 Velero 构建集群级别的备份与灾难恢复机制,支持 etcd + 应用数据完整快照
三、数据库与中间件系统整合
(1)部署 PostgreSQL 主从架构 + Pgpool-II 实现读写分离,配置哈希路由策略提高缓存命中率
(2)MySQL 聊天/认证/历史库使用主从流复制并启用故障转移,提高业务连续性
(3)Redis、MQ、Apollo 全部以集群方式部署,MQ 通过 VirtualHost 实现多环境逻辑隔离
(4)编写并定期执行数据库全量 + 增量备份脚本,数据同步至阿里云 OSS 存储