发表评论取消回复
相关阅读
相关 离线数仓 (一) --------- 数据仓库概念
目录 -------------------- 数据仓库 (Data Warehouse),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等
相关 Hive+Spark离线数仓工业项目--ODS层及DWD层构建(1)
目标:自动化的ODS层与DWD层构建 实现 \- 掌握Hive以及Spark中建表的语法规则 \- 实现项目开发环境的构建 \- 自己要实现所有代码注释 \
相关 数仓开发之DWD层(二)
目录 三:流量域用户跳出事务事实表 3.1 主要任务 3.2 思路分析 3.3 图解 3.4 代码 四:交易域加购事务事实表 4.1 主要任务 4.2 思路
相关 数据仓库ADS层-离线数仓-大数据
目标:当日、当周、当月活跃设备数 -------------------- 1. 活跃设备数统计 create external table ads_uv_co
相关 数据仓库DWS层-离线数仓-大数据
目标:统计当日、当周、当月活动的每个设备明细 -------------------- 1. 每日活跃设备明细 create external table dw
相关 数据仓库DWD层-离线数仓-大数据
dwd层 > 对ODS层数据进行清洗(去除空值,脏数据,超过极限范围的数据,行式存储改为列存储,改压缩格式) -------------------- 启动日志表
相关 数据仓库ODS层-离线数仓-大数据
ods层 启动日志表 字段line -json数据。根据时间分区 step1. 创建启动日志表,启动line为json数据 CREATE EXTE
相关 数仓实战04:数仓搭建-DWD层
> 1)对用户行为数据解析 > 2)对核心数据进行判空过滤。 > 3)对业务数据采用维度模型重新建模,即维度退化。 1.用户行为启动表数据解析 1.1创建启动
相关 实时数仓DWD层业务数据处理解决思路
DWD层业务数据 在实时数仓中业务数据的变化,可以通过Maxwell或者canal等工具采集到,采用MaxWell将全部数据统一写入一个Topic中, 这些数据包括业务数
还没有评论,来说两句吧...