发表评论取消回复
相关阅读
相关 数仓工具—Hive实战之UDF解析IP地址(2)
IP 转化为地址 场景 落到ods层的用户日志里面通常都有一个ip字段,在进入dws层的时候,通常数据清洗需要将其转化为类似中国-湖北-武汉的格式,便于后面进行地域
相关 数仓工具—Hive实战之UDF分词(1)
UDF 分词 分词 这个是一个比较常见的场景,例如公司的产品有每天都会产生大量的弹幕或者评论,这个时候我们可能会想去分析一下大家最关心的热点话题是什么,或者是我们会
相关 数仓工具—Hive UDF初识(20)
用户自定义函数 hive作为一个sql查询引擎,自带了一些基本的函数,比如`count`(计数),`sum`(求和),有时候这些基本函数满足不了我们的需求,这时候就要写`
相关 数仓工具—Hive实战之对比分析(15)
对比分析 对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性,当然最终的目的 。它可以非常直观地看出事物某方面
相关 数仓工具—Hive实战之UDF外部依赖文件找不到(14)
关于外部依赖文件找不到的问题 ![image-20210628102127827][] 其实我在上一篇的总结中也说过了你需要确定的上传的db 文件在那里,也就是你在hi
相关 数仓工具—Hive实战之留存分析(8)
留存分析 留存的定义其实很简单,那就是如果用户昨天使用了我们的平台,今天也使用了那说就是留存用户,也就是一日留存,同理如果明天还来的话,那就是两日留存,举个例子如果用户在
相关 数仓工具—Hive实战之累计计算(7)
累计计算 对于数仓而言,我们一般都是增量计算,增量数据同步、增量数据计算,然后我们产出每天的指标,大多数情况下都是这样的,但是我们也有很多的指标需要把过去的数据和当前的数
相关 数仓工具—Hive实战之漏斗分析(6)
转化分析(漏斗分析/路径分析) 漏斗分析模型是企业实现精细化运营、进行用户行为分析的重要数据分析模型,其精细化程度影响着营销管理的成败,以及用户行为分析的精准度。 究竟
相关 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间;或则适用于数据会发生变化,但是大部分是不变的 > 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的
相关 数仓工具—Hive实战之 UDF GIS(16)
UDF GIS 什么是GIS GIS,全称Geographic Information System(地理信息系统), 也称为Geographic Informat
还没有评论,来说两句吧...