一、数据建模能力(核心专长)
方法论:精通维度建模(Kimball星型/雪花模型),能根据业务场景灵活选型。
模型设计:擅长概念模型、逻辑模型、物理模型的全流程设计,尤其擅长面向数仓/数据湖的模型构建。
模型治理:制定模型设计规范、命名标准、主数据与参考数据管理策略,确保模型的一致性与可扩展性。
二、ETL 架构与开发能力
性能调优:善于优化映射逻辑、SQL 语句、分区策略、并行度及索引,解决大数据量下的 ETL 瓶颈。
调度与编排:熟练使用 Control-M等调度工具,设计复杂的任务依赖与容错重跑机制。
三、数据库与 SQL 能力
关系型数据库:深度掌握 Oracle的高级 SQL 编写、存储过程、窗口函数、查询优化。
SQL 规范:能建立团队 SQL 编写规范,推动代码可读性、可维护性及性能达标。
四、数据质量与治理
数据质量:掌握 质量规则配置、清洗与稽核流程设计。
元数据管理:推动血缘解析、影响分析、元数据采集。
数据标准:参与制定企业数据标准,确保模型及 ETL 落地标准一致。
五、业务分析与咨询能力
需求翻译:能将业务指标、分析需求转化为合理的多主题模型及 ETL 处理逻辑。
架构建议:基于数据量、时效性、团队能力给出整体架构建议(离线/实时,ETL 选型,分层方案)。
培训与赋能:沉淀团队知识库,组织技术培训,提升开发人员建模与 ETL 设计水平。
北京银行零售风险数据集市
该项目根据零售风险数据中贷前、贷后、风控进件等维度进行维度建模,包括不限于:固定化报表模型支撑、驾驶舱大屏模型支撑等主
题模型设计。将开发数据交付于业务进行客户风险评估等。
项目职责:
项目管理:负责负责客户沟通协调工作,产品前后台功能沟通及设计,组织协调数据开发技术人员进行项目开发工作,个人承担相关项
目文档撰写、工作任务分配、项目排期计划和项目进程监控工作,敦促系统如期交付。
需求分析:对接客户,收集客户相关需求和各上下游系统接口需求,进行需求分析和优化。
功能设计:根据项目需求独立进行数据模型设计和开发设计。进行数据开发设计。
模型设计:根据业务需求调研,完成数据库模型设计,完成维度建模。
数据处理:根据提供的数据,按照约定的接口规范,编写SQL和脚本语言Shell,KE加速后通过SmartBI展现,实现报表开发。
北京银行对公数据集市
此项目将行内数据湖对公数据经过存储过程、脚本、SQL的深度加工完成各类下发工作、报表工作及指标/标签的开发。
项目职责:
项目管理:项目改造功能确认范围,依据范围进行功能模块划分,对项目进度排期,按进度推进,同客户沟通项目中的风险点。
需求分析:根据行内报表需求,明确数据来源、业务口径。根据需求对模型以及代码进行针对性优化。
数据建模:参与对公数据集市标签层宽表建设、应用层的账户、客户、机构三大粒度建设,梳理数据对应的处理流程,拆分业务流程
。
数据处理:批量加工共计500+个存储过程,120+个模型,配合开发30+报表,1000+个任务。
数据校验:从生产申请相应的脱敏数据,模拟生产流程,下发数据文件给报表系统或下游系统,供业务进行测试。
北京银行科技管理集市
该项目根据行内人员、项目、系统等维度进行管理指标开发,包括不限于:绩效、考勤、重大项目等主题指标开发。将开发数据交付于
管理层行员进行绩效评估等管理。
项目职责:
项目管理:负责负责客户沟通协调工作,产品前后台功能沟通及设计,组织协调数据开发技术人员进行项目开发工作,个人承担相
关项目文档撰写、工作任务分配、项目排期计划和项目进程监控工作,敦促系统如期交付。
需求分析:对接客户,收集客户相关需求和各上下游系统接口需求,进行需求分析和优化。
功能设计:根据项目需求独立进行数据模型设计和开发设计。进行数据开发设计。
模型设计:根据数据入库校验平台需求调研,完成数据库模型设计,并对数据进行验证。
数据处理:根据提供的数据,按照约定的接口规范,编写SQL和脚本语言Shell,实现指标开发。
北京银行特征集市
搭建特征集市是行内针对行外数据进行统一加工、统一数据挖掘并进行统一管理。数据来源由中数、万德wind、大智慧DZH、朴道汇
法、司法、工商、数库等多个外部数据厂商提供,由特征集市提供指标设计、模型设计与指标开发。
项目职责:
项目管理:主导从标签/指标设计、系统建模、功能设计及开发、上线交付整体项目管理工作,对项目进度和质量负责。
数据建模:通过目标和源系统调研,做源、目标系统的映射梳理,进行模型设计,解决不同数据时效性所影响的数据交付。
数据开发:按照模型设计,将上游数据加工成指标/标签,使用CTM完成自动化加载。
我主导设计并落地了一套四层数据仓库架构(ODM→FDM→SDM→ADM),覆盖从数据湖贴源接入、增量归档、业务主题宽表加工到最终应用层交付的全流程。该作品的核心功能包括: 数据分层建模:划分临时层、基础层、整合层、应用层,明确存储中心与计算中心的职责边界,通过离线调度任务实现逐
多源灾害表统一接入:整合“历史重大灾害事件点数据”“气象灾害_历次低温/霜冻致灾因子调查表”“森林火灾历史数据”“北京历史地震事件”等十余个源系统表(来自应急管理、气象、林业等部门),通过四层数据架构(ODM→FDM→SDM→ADM)实现异构数据的标准化入库。 精细化业务规则校