hive 的介绍和安装

素颜马尾好姑娘i 2022-06-13 10:13 279阅读 0赞

Hive:数据仓库

Apache Hive 是数据仓库软件便于阅读,写作,和管理大型数据集居住在分布式存储使用SQL。结构可以投射到数据已经存储。提供了一个命令行工具和JDBC驱动程序将用户连接到Hive

在搭建Hive之前要首先搭建好Hadoop,关于Hadoop的搭建 参考之前的 hadoop 2.x搭架文档

http://blog.csdn.net/liulihui1988/article/details/73189148

一、Hive 运行模式

  1. 1. 内嵌模式

将元数据保存在本地内嵌的 Derby 数据库中,这是使用 Hive 最简单的方式。但是这种方式缺点也比较明显,因为一个内嵌的 Derby 数据库每次只能访问一个数据文件,这也就意味着它不支持多会话连接。

  1. 2. 本地模式

这种模式是将元数据保存在本地独立的数据库中(一般是 MySQL),这用就可以支持多会话和多用户连接了。

  1. 3. 远程模式

此模式应用于 Hive 客户端较多的情况。把 MySQL 数据库独立出来,将元数据保存在远端独立的 MySQL 服务中,避免了在每个客户端都安装 MySQL 服务从而造成冗余浪费的情况。

二、安装 Hive

  1. 下载地址:http://apache.fayea.com/

apache-hive-2.1.1-bin.tar.gz 解压

  1. tar -zxvf hiveapache-hive-2.1.1-bin.tar.gz -C /usr/local

修改配置文件,命令进入 cd /usr/local/hiveapache-hive-2.1.1-bin/conf 目录下拷贝hive-default.xml.template文件

  1. cp -a hive-default.xml.template hive-site.xml

三、Mysql数据库安装

1、yum命令安装mysql 数据库

  1. yum install mysql-server

这里写图片描述

CentOS7下解决yum install mysql-server没有可用包

执行一下命令:

  1. # wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm
  2. # wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm

mysql-community-release-el7-5.noarch.rpm

  1. # rpm -ivh mysql-community-release-el7-5.noarch.rpm

1:mysql-community-release-el7-5 ################################# [100%]

  1. # ls -1 /etc/yum.repos.d/mysql-community*

/etc/yum.repos.d/mysql-community.repo
/etc/yum.repos.d/mysql-community-source.repo

  1. # yum install mysql-server

mysql数据库安装完成,启动数据库:

  1. service mysql start

查看数据看端口:netstat -tunpl | grep 3306

这里写图片描述

登陆Mysql 设置用户权限,用grant命令对 Mysql数据库设置权限,命令登陆数据库

  1. # mysql
  2. mysql> grant all on *.* to root@'%' identified by 'root';

grant all(所有权限) on(所有数据库) (.)所有表 to root@(用户名)’%’(所有的id地址) identified by ‘root’(密码)

添加centos-node6访问数据库的权限

  1. mysql> grant all on *.* to root@'centos-node6' identified by 'root';

创建一个 hive 数据库

  1. create database hive

修改hive的配置文件

Hive 链接数据库 需要数据库驱动:导入数据库驱动 mysql-connector-java-5.1.35.jar,导入到apache-hive-2.1.1-bin下的lib目录下

  1. scp mysql-connector-java-5.1.35.jar /usr/local/apache-hive-0.13.1-bin/lib/
  2. # cd usr/local/apache-hive-0.13.1-bin/lib/

这里写图片描述

修改配置文件 hive-site.xml

  1. vi hive-sitx.xml

更改链接的数据库服务器

配置对应的数据库服务器

  1. <property>
  2. <name>javax.jdo.option.ConnectionURL</name>
  3. <value>jdbc:mysql://centos-node6/hive</value>
  4. <description>JDBC connect string for a JDBC metastore</description>
  5. </property>

链接数据库 driverClass

  1. <property>
  2. <name>javax.jdo.option.ConnectionDriverName</name>
  3. <value>com.mysql.jdbc.Driver</value>
  4. <description>Driver class name for a JDBC metastore</description>
  5. </property>

对应数据库服务器的 用户名和密码

  1. <property>
  2. <name>javax.jdo.option.ConnectionUserName</name>
  3. <value>root</value>
  4. <description>username to use against metastore database</description>
  5. </property>
  6. <property>
  7. <name>javax.jdo.option.ConnectionPassword</name>
  8. <value>123456</value>
  9. <description>password to use against metastore database</description>
  10. </property>

Hive 登陆本地数据库测试

这里写图片描述

发表评论

表情:
评论列表 (有 0 条评论,279人围观)

还没有评论,来说两句吧...

相关阅读

    相关 hive介绍

    ![70][] hive底层依赖与hdfs和MapReduce,数据存放在hdfs上,运算实现是通过MapReduce。hive本身起到“翻译”的作用,同时也管理一部分元数据