• Linux 下搭建 Hive 环境


    Linux 下搭建 Hive 环境

    作者:Grey

    原文地址:

    博客园:Linux 下搭建 Hive 环境

    CSDN:Linux 下搭建 Hive 环境

    前置工作

    首先,需要先完成

    Linux 下搭建 Kafka 环境

    Linux 下搭建 Hadoop 环境

    Linux 下搭建 HBase 环境

    本文基于上述三个环境已经搭建完成的基础上进行 Hive 的搭建工作。

    Hive 版本:2.2.0

    如果使用的软件版本不一致,请以官方搭建文档为准。

    此外,需要准备一个 MySQL 服务器,我这里准备的 MySQL 服务器 IP 是:192.168.100.129,端口是 3306。

    MySQL 的安装参考:CentOS 7 下安装 MySQL 8.x

    这里用的 MySQL 版本是:5.7.40

    下载地址

    注:目前这个版本的 Hive,用 MySQL 5.7 版本不会报错,用MySQL 8.0 版本会报错,

    MySQL 的 Connector 版本是:5.1.40

    下载地址

    注:确保 master 服务器可以访问这个 MySQL 服务器上的 MySQL 服务。,如果用的 MySQL 版本不同,对应的 Connector 需要下载可适配 MySQL 版本的。

    安装步骤

    Hive 安装在 master 节点上,

    将下载好的 Hive 安装包和 MySQL 对应的 Connector 包上传到 /datalake 目录下

    apache-hive-2.2.0-bin.tar.gz

    mysql-connector-java-5.1.40.tar.gz

    解压这几个安装包

    cd /datalake
    
    tar -zxvf apache-hive-2.2.0-bin.tar.gz
    

    将解压的软件移动到 /usr/local 目录

    cd /datalake
    
    mv apache-hive-2.2.0-bin /usr/local/hive
    

    配置环境变量

    vi /etc/profile
    

    将 Hive 添加到环境变量

    export HIVE_HOME=/usr/local/hive
    export PATH=$PATH:$JAVA_HOME/bin:$ZK_HOME/bin:$KAFKA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$HIVE_HOME/bin
    

    应用环境变量

    source /etc/profile
    

    解压 MySQL 的 Connector 包

    tar -xzvf mysql-connector-java-5.1.40.tar.gz
    

    将 Connector 的 jar 拷贝到 Hive 的 lib 目录中

    cp mysql-connector-java-5.1.40/mysql-connector-java-5.1.40-bin.jar /usr/local/hive/lib/
    

    修改 Hive 的配置文件

    cd $HIVE_HOME/conf && cp hive-default.xml.template hive-site.xml
    

    将 hive-site.xml 的内容设置为

    <configuration>
        <property>
            <name>javax.jdo.option.ConnectionURL</name>
            <value>jdbc:mysql://192.168.100.129:3306/hive?createDatabaseIfNotExist=true</value>
        </property>
        <property>
            <name>javax.jdo.option.ConnectionDriverName</name>
            <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
            <name>javax.jdo.option.ConnectionUserName</name>
            <value>dump</value>
        </property>
        <property>
            <name>javax.jdo.option.ConnectionPassword</name>
            <value>1234</value>
        </property>
        <property>
            <name>hive.metastore.schema.verification</name>
            <value>false</value>
        </property>
        <property>
            <name>datanucleus.schema.autoCreateAll</name>
            <value>true</value>
        </property>
    </configuration>
    

    注:以上配置根据你自定义的 MySQL 来配置,例如用户名密码和连接信息。

    启动 Hive,执行

    hive
    

    查看数据库,已经新建出 Schema

    image

    测试一下,在 hive 中执行如下命令创建一个表

    CREATE TABLE t2(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
    

    image

    创建成功并查看这个表的信息

    访问:http://192.168.100.130:50070/explorer.html#/user/hive/warehouse

    可以查看创建的 t2 表信息

    image

  • 相关阅读:
    ubuntu 设置静态ip
    Mysqldump参数大全
    MySQL主从数据库同步
    MySQL的information_schema的介绍
    mysql的REGEXP 和like的详细研究和解释
    查询语句小技巧
    linux 安装软件,卸载软件 等的几种方式
    正则表达式的神秘面纱
    29
    【转载】关于c++中的explicit
  • 原文地址:https://www.cnblogs.com/greyzeng/p/16803808.html
Copyright © 2020-2023  润新知