ID:398361

星空下的繁华

高级数据开发工程师

  • 公司信息:
  • 上海元初数智科技有限公司
  • 工作经验:
  • 7年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 上海
  • 浦东

技术能力

Pandas(数据清洗/转换)、PySpark(分布式ETL)、SQLAlchemy(ORM),Hadoop生态(HDFS/YARN)、Hive/SQL、Spark/Map-Reduce等分布式计算框架,大数据离线和实时处理能力,数据分析工具如Tableau、Power BI,Quick BI,永洪,帆软报表,Flume, Sqoop, Kafka Connect, Airflow

项目经验

数据管道开发​
​技术栈​:Kafka + Spark Structured Streaming + Hudi
​案例​:
搭建电商实时数据管道,处理峰值100万条/秒用户行为数据
实现端到端延迟<5秒,替代原批处理方案(小时级延迟)
数仓建模与优化​
​技术栈​:Hive LLAP + Kylin + Python UDF
​创新点​:
开发动态标签引擎​:SQL规则标签(Hive) + 模型标签(Python UDF)混合计算
利用Python实现增量建模​:自动识别新增分区,历史数据跳过计算(节省70%资源)
数据治理​
​工具链​:Great Expectations(数据质量) + Atlas(元管理) + Python自动化脚本
​成果​:
通过Python自动生成数据血缘图谱,覆盖2000+表字段溯源
数据质量规则覆盖率从35%提升至92%

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服