发表评论取消回复
相关阅读
相关 离线数仓 (四) --------- 用户行为数据采集模块
目录 一、集群所有进程查看脚本 二、Hadoop安装 1. HDFS存储多目录 2. 集群数据均衡 3. 支持 LZO
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(2)
MR的Uber模式 目标:了解MR的Uber模式的配置及应用 实施 \- Spark为什么要比MR要快 \- MR慢 \- 只有Map和Reduce阶段,每个阶
相关 Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(1)
数仓设计及数据采集 1. \\数据仓库设计\\ \- 建模:维度建模:【事实表、维度表】 \- 分层:ODS、DW【DWD、DWM、DWS】、APP \- \
相关 Flume采集日志写到Hdfs(数仓项目)
目录 Flume版本选择 项目流程 Flume核心配置 启动flume agent采集数据 思考问题
相关 电商离线数仓-拉链表(面试常问)
拉链表详解 拉链表概念 拉链表更新数据 拉链表形成过程 如何使用拉链表 拉链表概念 拉链表,记录每条信息的生命周期为单位,一旦记录的生命周
相关 电商离线数仓-业务数仓指标(GMV主题/转化率主题)
GMV和转化率 GMV主题 GMV的概念 GMV表的创建 GMV表里导入数据 转化率 转化率概念
相关 电商离线数仓项目-用户每日行为宽表(重点!!)
为什么要建立宽表? 需求目标,把每个用户单日的行为聚合起来组成一张多列宽表,以便之后关联用户维度信息后进行不同角度的统计分析。 分析宽表 以用户为主体,今天下了多
相关 电商离线数仓项目-数仓分层哪几层?/数仓为什么要分层?
电商离线数仓 数仓分成哪几层? 数仓为什么要分层? 电商离线数仓项目中的数仓 数仓分成哪几层? 1、ODS层(原始数据层):存放原始数据,直接加
相关 电商离线数仓项目-生产Flume数据采集的配置(配置文件详解)
我们经常一提到Flume,就要想到Flume的三个部件,Source,Channel,Sink.这三个部件构成了Flume数据传输的通道. 在我们这个项目当中,收集Flum
还没有评论,来说两句吧...