发表评论取消回复
相关阅读
相关 数仓工具—Hive表的基本操作(3)
1. 创建表 `create table`语句遵从`sql`语法习惯,只不过`Hive`的语法更灵活。例如,可以定义表的数据文件存储位置,使用的存储格式等。 简单一点就
相关 数仓工具—Hive优化
数据过滤 行过滤 行处理:在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤, 列过滤 列处理
相关 数仓工具—Hive实战之对比分析(15)
对比分析 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,当然最终的目的 。它可以非常直观地看出事物某方面
相关 数仓工具—Hive实战之留存分析(8)
留存分析 留存的定义其实很简单,那就是如果用户昨天使用了我们的平台,今天也使用了那说就是留存用户,也就是一日留存,同理如果明天还来的话,那就是两日留存,举个例子如果用户在
相关 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步、增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数
相关 数仓工具—Hive实战之漏斗分析(6)
转化分析(漏斗分析/路径分析) 漏斗分析模型是企业实现精细化运营、进行用户行为分析的重要数据分析模型,其精细化程度影响着营销管理的成败,以及用户行为分析的精准度。 究竟
相关 数仓工具—Hive实战之会话分析(4)
会话分析 会话分析主要解决下面几个问题 1. 用户平均会来几次 2. 没次平均逛了几个页面 3. 没次来平均待多久 4. 某个具体页面用户平均停留时长 其实这
相关 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间;或则适用于数据会发生变化,但是大部分是不变的 > 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的
相关 数仓工具—Hive实战之描述性计算(18)
描述性计算 和[Hive实战之事件序列匹配/复杂事件处理][Hive] 一样,这个名字也是我随意起得,名字虽然很随意但是目的不随意,我还是希望能像设计模式一样,将这一类的
相关 数仓工具—Hive实战之 UDF GIS(16)
UDF GIS 什么是GIS GIS,全称Geographic Information System(地理信息系统), 也称为Geographic Informat
还没有评论,来说两句吧...