发表评论取消回复
相关阅读
相关 数仓工具—Hive执行引擎(18)
Hive 执行引擎 前面我们已经搭建起了Hive 的基础环境,每次当你使用客户端的时候,你就会看到这样的一串日志,提示我们不要再使用MR 去执行hive sql 了
相关 数仓工具—Hive实战之对比分析(15)
对比分析 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,当然最终的目的 。它可以非常直观地看出事物某方面
相关 数仓工具—Hive实战之留存分析(8)
留存分析 留存的定义其实很简单,那就是如果用户昨天使用了我们的平台,今天也使用了那说就是留存用户,也就是一日留存,同理如果明天还来的话,那就是两日留存,举个例子如果用户在
相关 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步、增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数
相关 数仓工具—Hive实战之漏斗分析(6)
转化分析(漏斗分析/路径分析) 漏斗分析模型是企业实现精细化运营、进行用户行为分析的重要数据分析模型,其精细化程度影响着营销管理的成败,以及用户行为分析的精准度。 究竟
相关 数仓工具—Hive实战之会话分析(4)
会话分析 会话分析主要解决下面几个问题 1. 用户平均会来几次 2. 没次平均逛了几个页面 3. 没次来平均待多久 4. 某个具体页面用户平均停留时长 其实这
相关 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间;或则适用于数据会发生变化,但是大部分是不变的 > 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的
相关 数仓工具—Hive实战之滑动/滚动时间窗口计算(19)
时间滑动计算 今天遇到一个需求大致是这样的,我们有一个业务涉及到用户打卡,用户可以一天多次打卡,我们希望计算出7天内打卡8次以上,且打卡时间分布在4天以上的时间,当然这只
相关 数仓工具—Hive实战之描述性计算(18)
描述性计算 和[Hive实战之事件序列匹配/复杂事件处理][Hive] 一样,这个名字也是我随意起得,名字虽然很随意但是目的不随意,我还是希望能像设计模式一样,将这一类的
相关 数仓工具—Hive实战之 UDF GIS(16)
UDF GIS 什么是GIS GIS,全称Geographic Information System(地理信息系统), 也称为Geographic Informat
还没有评论,来说两句吧...