Hbase-Trying to load more than 32 hfiles to one family of one region

BulkLoad方式优化
- 背景
- 问题分析
- 解决方案
  - 方式一：spark DataFrame写入Hive临时表前进行coalesce(30)
  - 方式二：
- 参考链接

BulkLoad方式优化

背景

项目中使用到Hbase BulkLoad方式插入数据，当数据量较大时或小文件过多时，任务失败：报错：Exception in thread “main” java.io.IOException: Trying to load more than 32 hfiles to one family of one region

问题分析

代码逻辑是将临时存放在hive临时表的数据分别写入到Hive正式表和Hbase中， Hbase是使用BulkLoad方式插入的, 查看了Hive临时表中的数据大小，parquet格式文件，每个15MB左右，在网上查相关异常，也给出了相关的解决方案

解决方案

方式一：spark DataFrame写入Hive临时表前进行coalesce(30)

抱着试下的心态，在写入hive之前减少了分区，结果运行成功

方式二：

hbase-site.xml中设置

<property> 
    <name>hbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily</name> 
    <value>3200</value>
    </property>

重新启动集群

参考链接

https://blog.csdn.net/weixin_40861707/article/details/99976526

Hbase-Trying to load more than 32 hfiles to one family of one region

BulkLoad方式优化

背景

问题分析

解决方案

方式一：spark DataFrame写入Hive临时表前进行coalesce(30)

方式二：

参考链接

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关 Using WebView from more than one process

相关 Hbase-Trying to load more than 32 hfiles to one family of one region

相关 Hibernate 关联映射one-to-one

相关 Performing Push Install adb: error: failed to get feature set: more than one 解决方案

相关 adb: unable to connect for root: more than one device/emulator

相关 many to one

相关 TRIPLE is More Than DOUBLE Plus One

相关 Exception in thread "main" java.io.IOException: Trying to load more than 32 hfiles to one family of

相关 Tomcat: One or more listeners failed to start

相关 Hibernate中many-to-one unique="true" 和one-to-one

随便看看

SpringBoot - Spring 家族的技术体系

鲁大师linux系统打印机驱动怎么安装,鲁大师如何安装打印机驱动安装打印机驱动方法...

一文详解光电容积图 (PPG) 和心电图 (ECG) 基本工作原理

Linux系统安装时报错,mysql在linux系统安装

大数据技术专家18页PPT讲明白数据分析师的价值提升（附下载）

数据中台与传统大数据平台有什么区别？终于有人讲明白了

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表