我擅⻓数仓开发、ETL、数据治理、BI 报表、Python 重复工作流自动化、padas数据处理以及图表化、网站数据爬虫。
先后做过电信、华为音乐、服装零售、银行金融等项目,能独立负责从数据接入、清洗、分层建模、指标标签开发到调度上线、质量监控的全流程工作。
技术上我精通 SQL、Shell、Python,熟练使用目前通用的各类数据库,比如mysql、oracle、db2、tdsql、gbaee、postgrel、greenplum等
数据同步工具DataStage、DataX、Kettle等
开发调度工具Airflow、Azkaban等
Hadoop大数据组件hive、SparkSQL、Sqoop、StarRocks等
时序数据库使用经验包括TDengine、InfluxDB
BI开发工具:Fine Report有两年开发经验,其他的工作需要也能很快上手
做得比较好的一个项目是服装行业,主要是全流程给予最大限度去做,具体项目做的是宝胜国际阿迪达斯品牌前期 4 个区部的推广业务,提供业务铺货、返仓、下
沉等模块决策数据支持,负责整个项目开发过程中所有技术问题解决,包括整个项目的数据 ETL 、调度、指标、标签、以及遇到的问题解决排查,另外兼顾其他项目技术支持和额外的一些工具开发。
主要的工作内容是为业务加工标签,用户标签、商品标签,渠道标签,用户标签包括:年龄段、性别、地域(几线城
市)、消费能力(高中低)、尺码偏好等等,商品标签包括品类、风格、季节、价格段、颜色等等, 渠道标签包括(线
上、门店),平台(各大电商平台)、门店类型(旗舰店、加盟店、授权店)等。