发表评论取消回复
相关阅读
相关 大数据开发之Hive优化篇5-使用ORC文件格式优化Hive
备注: Hive 版本 2.1.1 文章目录 一.ORC文件格式概述 二.测试ORC性能 2.1 查看两个表存储空间的大小 2
相关 大数据开发之Hive优化篇4-Hive的数据抽样-Sampling
备注: Hive 版本 2.1.1 文章目录 抽样概述 一.随机抽样 二.桶表抽样 三.数据块抽样 参考 抽样概述 当数据量特
相关 大数据开发之Hive优化篇3-Hive的统计信息
备注: Hive 版本 2.1.1 文章目录 一.Hive统计信息概述 1.1 表和分区的统计信息 1.2 列的统计信息
相关 大数据开发之Hive优化篇2-Hive的explain命令
备注: Hive 版本 2.1.1 文章目录 一.Hive explain命令概述 二.Hive explain 案例 参考: 一.Hive
相关 大数据开发之Hive优化篇1-Hive 优化概述
备注: Hive 版本 2.1.1 文章目录 一.Hive的实现原理 二Hive优化 2.1 选择合理的存储格式和压缩格式 2
相关 大数据开发之Hive篇5-Hive数据查询语言
备注: Hive 版本 2.1.1 文章目录 一.Hive SELECT(数据查询语言)概述 二.Select的几个简单例子 2.1 表别名
相关 大数据开发之Hive篇2-Hive数据类型及文件格式
备注: Hive 版本 2.1.1 文章目录 一.Hive的数据类型 1.1 数值类型 2.2 字符类型 2.3 日期
相关 大数据开发之Hive优化篇7-Hive的压缩
备注: Hive 版本 2.1.1 文章目录 一.Hive压缩概述 1.1 常见压缩算法比较 1.2 开启压缩 二.压缩测试
相关 大数据开发之Hive优化篇6-Hive on spark
备注: Hive 版本 2.1.1 一.Hive on Spark介绍 Hive是基于Hadoop平台的数据仓库,最初由Facebook开发,在经过多年发展之后,已
相关 大数据Hive系列之Hive性能优化(全面)
一、介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? > 1. 数据量大不是问题,数据倾斜是个问题。 > 2. jobs数比较多的作业运
还没有评论,来说两句吧...