发表评论取消回复
相关阅读
相关 数仓工具—Hive实战之UDF解析IP地址(2)
IP 转化为地址 场景 落到ods层的用户日志里面通常都有一个ip字段,在进入dws层的时候,通常数据清洗需要将其转化为类似中国-湖北-武汉的格式,便于后面进行地域
相关 数仓工具—Hive UDF初识(20)
用户自定义函数 hive作为一个sql查询引擎,自带了一些基本的函数,比如`count`(计数),`sum`(求和),有时候这些基本函数满足不了我们的需求,这时候就要写`
相关 数仓工具—Hive实战之对比分析(15)
对比分析 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,当然最终的目的 。它可以非常直观地看出事物某方面
相关 数仓工具—Hive实战之UDF外部依赖文件找不到(14)
关于外部依赖文件找不到的问题 ![image-20210628102127827][] 其实我在上一篇的总结中也说过了你需要确定的上传的db 文件在那里,也就是你在hi
相关 数仓工具—Hive实战之留存分析(8)
留存分析 留存的定义其实很简单,那就是如果用户昨天使用了我们的平台,今天也使用了那说就是留存用户,也就是一日留存,同理如果明天还来的话,那就是两日留存,举个例子如果用户在
相关 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步、增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数
相关 数仓工具—Hive实战之会话分析(4)
会话分析 会话分析主要解决下面几个问题 1. 用户平均会来几次 2. 没次平均逛了几个页面 3. 没次来平均待多久 4. 某个具体页面用户平均停留时长 其实这
相关 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间;或则适用于数据会发生变化,但是大部分是不变的 > 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的
相关 数仓工具—Hive实战之描述性计算(18)
描述性计算 和[Hive实战之事件序列匹配/复杂事件处理][Hive] 一样,这个名字也是我随意起得,名字虽然很随意但是目的不随意,我还是希望能像设计模式一样,将这一类的
相关 数仓工具—Hive实战之 UDF GIS(16)
UDF GIS 什么是GIS GIS,全称Geographic Information System(地理信息系统), 也称为Geographic Informat
还没有评论,来说两句吧...