• spark2.3.0 配置spark sql 操作hive


    spark可以通过读取hive的元数据来兼容hive,读取hive的表数据,然后在spark引擎中进行sql统计分析,从而,通过spark sql与hive结合实现数据分析将成为一种最佳实践。配置步骤如下:

     1、启动hive的元数据服务

    hive可以通过服务的形式对外提供元数据读写操作,通过简单的配置即可
      编辑 $HIVE_HOME/conf/hive-site.xml,增加如下内容:
    <property>
    <name>hive.metastore.uris</name>
    <value>thrift:// master:9083</value>
    </property>

      启动hive metastore
    [root@master apache-hive-1.2.2-bin]# ./bin/hive --service metastore  1>/dev/null  2>&1  &

      查看 metastore:
    [root@master apache-hive-1.2.2-bin]# jobs
    [1]+  Running                 ./bin/hive --service metastore > /dev/null 2>&1 &
    2、spark配置
        将hive的配置文件拷贝给spark
    将 $HIVE_HOME/conf/hive-site.xml copy $SPARK_HOME/conf/
    [root@master apache-hive-1.2.2-bin]# cp ./conf/hive-site.xml /usr/local/spark-2.3.0/conf/
       将mysql的jdbc驱动包拷贝给spark
    将 $HIVE_HOME/lib/mysql-connector-java-5.1.12.jar copy或者软链到$SPARK_HOME/lib/
    [root@master lib]# cp ./mysql-connector-5.1.8.jar /usr/local/spark-2.3.0/jars/
    3、启动spark-sql的shell交互界面

       [root@master lib]# spark-sql  

     4、在spark sql 中执行hive操作

    spark-sql> show databases;
    2018-06-27 09:52:08 INFO  CodeGenerator:54 - Code generated in 461.952527 ms
    default
    hive
  • 相关阅读:
    server-conf-PPTConf
    client-autoReport-ppt
    client-autoReport-common
    浏览器书签导出
    微信公众号JSAPI支付-多公众号向同一商户号支付的问题解决
    Kettle 4.4.0 通过 Java 代码 输出日志到表
    spring tx:advice事务配置
    Spring异常捕获而且回滚事务的方法
    移动端服务器i-jetty下载编译安装及问题解决系列
    I-Jetty部署war包到安卓手机
  • 原文地址:https://www.cnblogs.com/abcdwxc/p/9232558.html
Copyright © 2020-2023  润新知