发表评论取消回复
相关阅读
相关 离线数仓 (四) --------- 用户行为数据采集模块
目录 一、集群所有进程查看脚本 二、Hadoop安装 1. HDFS存储多目录 2. 集群数据均衡 3. 支持 LZO
相关 黑马Hive+Spark离线数仓工业项目--数仓主题应用层ST层构建(1)
数仓主题应用层ST层构建 1. 构建ST层:数据应用层 掌握每个主题的聚合指标和聚合的维度 \- 工单主题 \- 油站主题 \- 回访主题 \- 安装
相关 Hive+Spark离线数仓工业项目--数仓维度层DWS层构建(1)
维度建模回顾:建模流程 目标:掌握维度建模的建模流程 实施 step1-需求调研:业务调研和数据调研 \- 了解整个业务实现的过程 \- 收集所有数据使用人员对
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(2)
MR的Uber模式 目标:了解MR的Uber模式的配置及应用 实施 \- Spark为什么要比MR要快 \- MR慢 \- 只有Map和Reduce阶段,每个阶
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(1)
数仓设计及数据采集 1. \\数据仓库设计\\ \- 建模:维度建模:【事实表、维度表】 \- 分层:ODS、DW【DWD、DWM、DWS】、APP \- \
相关 Hive+Spark离线数仓工业项目实战--环境构建(3)
项目环境配置 根据需求实现项目环境配置 实施 \- 注意:所有软件Docker、Hadoop、Hive、Spark、Sqoop都已经装好,不需要额外安装配置,启动即可
相关 Hive+Spark离线数仓工业项目实战--项目介绍及环境构建(2)
Docker的介绍 了解Docker的基本功能和设计 \- 为什么要用Docker? \- 什么是Docker? 路径 \- step1:生产环境的问题
相关 离线数仓和实时数仓架构与设计
前言:离线数仓和实时数仓架构与设计讲解 离线数仓和实时数仓架构与设计 一、数仓架构演变(场景驱动) 二、离线大数据架构 三、离线数仓分层 四、离
还没有评论,来说两句吧...