ID:401184

欢仔

大数据技术经理

  • 公司信息:
  • 明源云
  • 工作经验:
  • 11年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

个人优势:
1、深耕大数据领域多年,积累深厚专业知识与丰富实战经验​
2、成功主导多个大数据项目从 0 到 1 全流程推进,有较强的项目管理能力​
3、在技术选型、架构设计、数据仓库搭建及数据治理方面经验丰富,擅于定制高效技术方案
4、多年的java开发、大数据开发与团队管理经验

技术栈:
1、深入理解Java、Python核心机制,有良好的编码能力
2、掌握 Java并发编程,AQS实现原理、线程池任务调度策略、volatile可见性/禁止指令重排、synchronized锁升级
3、深入理解 JVM内存模型(堆/栈/元空间)、类加载机制(双亲委派/自定义ClassLoader)
4、熟悉垃圾回收策略,GC算法,各类垃圾回收器
5、精通Hadoop生态体系(HDFS/Yarn/MapReduce),具备TB级集群性能调优经验
6、熟悉Hive数据仓库设计与优化(分区/分桶/压缩),可开发UDF/UDAF函数解决复杂ETL问题
7、深度掌握Spark内核(DAG调度/内存管理/Shuffle机制),熟悉使用RDD、SparkSQL开发,并能进行性能优化
8、熟悉Flink实时计算引擎(Checkpoint/State TTL/时间窗口),主导端到端Exactly-Once流处理项目
9、精通Kafka架构和工作原理,ISR机制/副本同步/零拷贝
10、熟悉Hbase分布式框架,理解读写原理,结合Phoenix提升查询效率
11、熟悉StarRocks查询引擎,表模型、雾化视图

项目经验

产业BG大数据平台
软件架构: 整体采用Lambda架构
离线: hadoop + hive + spark + starrocks + datax
实时: flink cdc + kafka + hbase + phoenix + flink + starrocks
项目描述:
项目采取Lambda架构,分为实时/离线两部分,离线架构用datax T+1 将业务库表同步到hdfs上; 计算引擎采用hive on spark,用于执行数仓sql;查询引擎是starrocks,用于olap数据分析;并以此构建数据仓库 ods->dwd->dws->ads,以宽表、报表、指标、接口 提供数据服务
实时架构通过flink cdc 实时采集业务库binlog日志,维度表数据通过phoenix写入hbase,事实表数据写入kafka表队列;dwd层通过flink任务将kafka表队列数据与hbase维度表数据进行关联操作生成宽表,并siink到starrocks或kafka dwd表队,dws层通过flink任务将kafka dwd表队列数据聚合计算后写入starrocks
责任描述:
1、负责大数据平台的架构设计,技术选型、难点技术攻克
2、负责离线/实时数据仓库的设计与规划
3、负责数据仓库建模,宽表和指标设计与制定
4、参与Flink流式计算的代码开发,与性能优化
5、负责平台SLA保障与数据质量监控

案例展示

  • 产业BG大数据平台

    产业BG大数据平台

    1、负责大数据平台的架构设计,技术选型、难点技术攻克 2、负责离线/实时数据仓库的设计与规划 3、负责数据仓库建模,宽表和指标设计与制定 4、参与Flink流式计算的代码开发,与性能优化 5、负责平台SLA保障与数据质量监控

  • HJ大数据平台

    HJ大数据平台

    1、负责这整个大数据平台架构设计、搭建、技术选型、性能优化,实现平台从0到1的过程 2、参与数据同步与ETL开发、数据仓库设计,数据模型设计 3、参与宽表、指标、报表、hive自定义函数的开发

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服