•负责医院多源核心数据(HIS/LIS/PACS/电子病历等)的ETL全流程搭建与运维,基于DTSphere Bridge工具构建数据集成通道,实现批量与实时数据的采集、清洗、转换及加载,保障数据同步成功率≥99.9%。
•主导数据转换规则设计与优化,针对超1GB医疗影像及检验数据启用流式解析插件;配置表输出插件单次提交记录数5000-10000条,通过增量标记字段(更新时间戳)实现增量同步,同步延时控制在5秒内,确保无数据积压。
•负责医疗数据标准化落地,严格遵循ICD-10疾病编码、国家药品编码等行业标准,统一数据格式(JSON下划线命名法)及字段类型(时间字段统一为yyyy-MM-dd HH:mm:ss格式);启用数据检验插件,实现数据格式合规率100%,核心字段(患者ID、就诊时间)非空校验均达标。
•搭建数据质量监控体系,配置非空校验、格式一致性校验、数值合理性校验等规则;每日通过Bridge数据对账模块核对源端与目的端数据,确保数据差异率为0%,数据质量规则执行率100%。
•负责ETL作业调度体系运维管理,统筹512个并发作业全生命周期;优化任务依赖关系,避免同一时间启动超50个作业;监控通道使用率≤80%,设置核心任务重试次数≥3次,实现作业调度准时率≥99.5%,慢任务(执行时长>1小时)优化率≥30%。
•负责服务器资源与ETL任务监控,通过Zabbix/Prometheus工具实时跟踪CPU(使用率≤70%)、内存(使用率≤80%)、磁盘(使用率≤85%)等资源占用情况;开发Shell自动化脚本(含日志清理、配置备份、数据对账等功能),按规范每周清理30天前过期日志,每月完成ETL配置全量备份并异地加密存储。
•负责ETL全流程故障处理,针对转换任务失败、增量漏数、数据格式错误等问题建立紧急故障响应机制,确保15分钟内响应;通过日志分析精准定位插件配置、字段映射等问题根源,实现故障恢复时间≤30分钟,保障临床诊疗、医保结算、科研数据等核心业务连续性。
•参与数据安全合规体系建设,实现ETL传输过程SSL/TLS加密;对敏感患者数据(身份证号、手机号等)采用SM4/AES加密算法加密处理并脱敏存储;定期开展接口权限审计,清理无效授权,确保日志留存时长≥90天,全面符合医疗数据安全相关规范。