发表评论取消回复
相关阅读
相关 离线数仓 (一) --------- 数据仓库概念
目录 -------------------- 数据仓库 (Data Warehouse),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(2)
MR的Uber模式 目标:了解MR的Uber模式的配置及应用 实施 \- Spark为什么要比MR要快 \- MR慢 \- 只有Map和Reduce阶段,每个阶
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(1)
数仓设计及数据采集 1. \\数据仓库设计\\ \- 建模:维度建模:【事实表、维度表】 \- 分层:ODS、DW【DWD、DWM、DWS】、APP \- \
相关 大数据-数仓-数仓工具:Hive(离线数据分析框架)【替代MapReduce编程;插入、查询、分析HDFS中的大规模数据;机制是将HiveSQL转化成MR程序;不支持修改、删除操作;执行延迟较高】
![在这里插入图片描述][20210125191658808.png] Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和
相关 大数据-数仓-离线数据分析-Hive(一):简介【海量结构化数据分析工具】【基于Hadoop】【将结构化的数据文件映射为一张表,并提供HQL查询功能】【本质:将HQL转化成MR程序】【慢;无法实时】
![在这里插入图片描述][54cd2cc597a44ded9b229bec383a5920.png_pic_center] ![在这里插入图片描述][46a89f4355fc
相关 大数据之CDH数仓(11) | 数仓之即席查询数仓搭建
目录 Impala安装 添加服务 选择Impala服务 角色分配 配置Impala 启动Impa
相关 数据仓库ADS层-离线数仓-大数据
目标:当日、当周、当月活跃设备数 -------------------- 1. 活跃设备数统计 create external table ads_uv_co
相关 数据仓库DWS层-离线数仓-大数据
目标:统计当日、当周、当月活动的每个设备明细 -------------------- 1. 每日活跃设备明细 create external table dw
相关 数据仓库DWD层-离线数仓-大数据
dwd层 > 对ODS层数据进行清洗(去除空值,脏数据,超过极限范围的数据,行式存储改为列存储,改压缩格式) -------------------- 启动日志表
相关 数据仓库ODS层-离线数仓-大数据
ods层 启动日志表 字段line -json数据。根据时间分区 step1. 创建启动日志表,启动line为json数据 CREATE EXTE
还没有评论,来说两句吧...