掌握一下java开发相关技术:
Java, JUC
Redis, Mysql,spark SQL
Spring, SpringBoot, SpringCloud
Docker, Linux
K8S
良好的自学能力和自我驱动,项目中出现的bug能快速定位并解决
项目一: SAP Prism ETL
开发环境及技术:
Java,SpringBoot, Spark SQL, Eureka, Delta Lake, Docker,
Spring Cloud
项目简介:
项目主要负责负责应用端数据的提取,转换,持久化。应用端的数据通过上游的 Ingestion 微服务将数据放入到数据湖中(Delta Lake),Delta Lake 中数据以 parquet 格式存储在 AWS S3 上。 ETL主要通过 OpenFeign 调用 Metadata Service 接口,获取 parquet 文件的路径然后通过 Spark 加载文件数据到内存中,基于 ETL definition 生成 SQL,Spark SQL 根据生成的 SQL 对内存数据进行过滤,之后对提取的数据根据 ETL definition 的定义做其他处理,完成后对数据格式做转换,将处理完成的数据放到目标数据库中做下游的数据分析和展示。
责任描述:
1、 根据实际业务需要,完成 ETL definition 的生成2、 编写部分 ETL definition 的后续处理代码逻辑
3、 编写应用端数据数据更新场景下,数据存储时逻辑
4、 编写数据库表与表之间的主外键字段生成逻辑
5. 编写 Dockerfile 和 Jenkinsfile,实现在部署项目时,项目中test cases 的运行,生成 sonar scan report。
项目2: SAP Ariba Analysis
开发环境及技术:
Java , Spring , Docker, Ariba Web Framework, Ariba Query Language, Ariba Metadata Language
项目简介:
Ariba Analysis 项目主要是通过数据加载任务,实现不同应用的业务数据,例如 Sourcing,Buyer,同时完成业务数据的数据分析生成数据分析报告。UI 框架使用的是 Ariba Web Framework,数据分析报告可以支持单表和多表,通过 Ariba Query Language 生成数据查询语句,对于每个 fact/dimension 的数据结构解析则是通过 Ariba Metadata Language。 系统主要涵盖一下主要模块:
Create Reports Module: 业务数据生成模块Reporting Module: 数据报告生成模块
Schema Manager: 触发数据加载任务,schema 切换功能。User Manager:User 权限设置,分组设置
Customization Manager: 自定义 template,flex field 等责任描述:
1. 实现 flex field 相关功能
2. 实现 Sourcing reporting API 接口功能
3. Migration data load 的业务实现,以及页面相关 log 文件列表展示