熟悉AWS阿里云、腾讯云平台操作;熟悉SaltStack、Ansibe自动化工具,熟练Linux、系统运维、MySql、Mongo、postgresql等数据库;熟悉Python、Shel、Java;熟
1.平台部署与架构优化
-负责物联网感知平台在Kubernetes集群上的部署与优化,使用Helm进行应用管理,提升部署效率。
使用Docker容器化技术,优化平台微服务的部署与管理,减少资源占用并提升系统性能。
2.监控与告警系统搭建
使用Prometheus+Grafana搭建监控系统,实时监控平台的核心指标(如设备接入数、数据吞吐量、服务器负载等)
配置告警规则,通过邮件、短信等方式及时通知运维团队,确保故障在5分钟内响应并处理。
-使用Zabbix对服务器硬件资源(CPU、内存、磁盘等)进行监控,确保硬件资源的合理分配与使用。
3.数据库管理与优化
负责IoTDB(物联网时序数据库)的部署与优化,支持海量时序数据的高效存储与查询
4.自动化运维与CICD流程
-使用Jenkins搭建持续集成持续部署(CICD)流程,实现平台应用的自动化构建、测试与部署
-编写Python和Shell脚本,自动化处理日常运维任务(如日志清理、数据备份、服务重启等),提升运维效率
-使用Ansible进行批量服务器配置管理,减少人工操作,降低出错率。
1.平台部署与架构优化 -负责物联网感知平台在Kubernetes集群上的部署与优化,使用Helm进行应用管理,提升部署效率。 使用Docker容器化技术,优化平台微服务的部署与管理,减少资源占用并提升系统性能。 2.监控与告警系统搭建 使用Prometheus+Graf
1.AI模型开发与优化 模型开发:负责构建、训练和调优深度学习模型,特别是针对儿童教育场景的大语言模 型(LLM)和多模态模型。这些模型能够理解儿童的语音指令、文本输入,并提供相应的反馈。 性能优化:通过优化模型的性能和准确性,确保机器人在实际使用中的响应速度和交互质量。