linux+windows服务器运维(项目部署+服务器配置+自动化发布)
运维开发:shell,go,python
大模型运维(GPU选型,大模型本地部署调优)
cicd:jenkins + 自动化
监控运维(系统&&日志 监控+告警)
云运维:阿里云、华为云
安全运维
python自动化识别异常ip,自动风控异常请求,保证系统安全
自动化运维
基于react和go开发本地离线的自动化运维平台,支持多个纯离线环境,自动升级业务,监控系统情况,管理操作容器
成本运维:
主导并落地 20W/月的阿里云服务器成本降低到17W/月,单月节省3W
自建离线运维平台 公司业务需要本地部署多个离线的环境,为方便快速升级,一个人前后端(react + go)一起开发,最终为一个20M的linux二进制程序支持在国产系统及armCPU环境先运行(1、系统监控2、升级管理3、容器管理) 业务架构(react+ java + py
1、 python自定位恶意ip并拉黑 python3+esapi+nginx+lvs+firewalld 难点:1、涉及系统较多2、对于恶意ip的定义及封禁的阈值设定 2、资产管理,对于vm虚拟机信息管理 python3+flask+明道云+vm 难点:1、不同网络环境
保密环境下的大模型离线部署 1、dify + vllm + modelscope 纯离线环境安装运行 dify离线环境自动化安装(程序及插件),大模型vllm参数调优,升级