一:搭建一套量化研究环境与数据服务框架(研究同学依赖它进行日常实验。系统依赖: - **数据接入**:WebSocket 对接上游行情/数据服务(ws://<mainHost>)。
内容:- **存储依赖**:MySQL、文件目录(pkl 数据目录/备份目录/产出目录等)。
- **运行环境**:Python 虚拟环境;部分机器可选 GPU(CUDA 生态)。
具体职责:现需要一位运维/交付工程师把该环境在新机器上
**标准化部署并稳定运行**:研究同学只关心“能用”,不需要处理依赖冲突、权限、路径、守护、日志与告警。
### 你将负责(核心职责) - **服务器从零搭建** - 从可 SSH 连接开始完成初始化:账号与权限、磁盘分区与挂载、基础网络/防火墙、时钟同步与基础安全配置。 - GPU 机器(如有):NVIDIA 驱动/CUDA 安装与验证。 - **环境标准化与发布** - 在目标 Linux 服务器完成 Python/venv 与系统依赖安装,固化安装步骤与版本约束(requirements/constraints 或等价方案)。 - 规划并落地目录结构与权限(pkl 目录、备份目录、日志目录、产出目录),确保磁盘容量与读写权限满足长期运行。 - **配置与安全** - 将环境差异(主机、端口、目录、账号)以环境变量/外部配置方式注入,避免敏感信息入库。 - MySQL 连接可用、权限最小化(只读/读写边界明确),并能快速定位连接问题(socket/TCP、权限、网络)。 - **服务部署与守护** - 拉起主入口(main/start.py)并实现生产级守护:systemd(或等价方案)开机自启、崩溃重启、优雅停止。 - **稳定性与可观测性** - 保障与上游 WebSocket 的连通性与稳定性(网络、DNS、超时、重连策略验证),并提供故障排查手册。 - 监控与告警:进程存活、CPU/内存、磁盘、日志关键错误(Prometheus/节点监控/脚本均可,形式不限但需可验收)。 ### 必备要求(硬技能) - **Linux 运维能力**:熟悉 systemd、进程管理、资源限制、日志与轮转、权限与目录规范。 - **服务器初始化经验**:能独立完成从零搭建与交付(装系统、磁盘/RAID/挂载、网络/防火墙、账号权限、基础安全、时间同步、监控告警、备份与可恢复验证)。 - **网络排障能力**:能定位 WebSocket/HTTP 连通性问题(防火墙、端口、DNS、超时、丢包等)。 - **Python 基础**:能管理 venv、依赖冲突定位、运行入口脚本与排错(不要求算法/研究背景)。 - **MySQL 基础**:连接与权限排障、基础可用性验证(socket/TCP)。
二 人才要求:有搭建经验
三 参考产品 :市面上多因子量化系统
四 合作方式:远程开发,周期2月以内,一般1月就可以