技术:Hadoop、Yarn、Hdfs、MapReduce、Zookeeper、Hive、Hbase、Shell、MySQL、Impala、 Spark( Spark Core、Spark SQL、Spark Streaming)、Sqoop、Dolphinscheduler、Kerb
项目:中国xx客户网络服务数据分析平台 项目责任描述: 1. 参与数仓项目的分层设计; 2. 负责对数据进行清洗入仓;按照数据类型多目录输出,按天存储在指定目录,使用 hive 加载,按照数据日 期分区存储; 3. 负责使用 superset 报表对接预计算结果,并进行报表统计; 4
案例: spark、python大数据