• spark-sql-04-spark连接hive的几种方式


    配置spark

    目录:/opt/bigdata/spark-2.3.4-bin-hadoop2.6/conf
    [root@ke03 conf]# vi spark-env.sh
    配置:export HADOOP_CONF_DIR=/opt/bigdata/hadoop-2.6.5/etc/hadoop

    cp  /opt/bigdata/hive-2.3.4/conf/hive-site.xml  ./

    <configuration>
      <property>
        <name>hive.metastore.uris</name>
        <value>thrift://ke03:9083</value>
      </property>
    </configuration>

    目录:/opt/bigdata/spark-2.3.4-bin-hadoop2.6/bin

    启动:

    [root@ke03 bin]# ./spark-shell --master yarn

    观看: http://ke03:8088/cluster
    Spark shell一直在运行,只要spark-shell不退出,一直连接
    
    日志:Spark session available as 'spark'.
    启动日志图
    
    测试:
    scala> spark.sql("show tables").show
    +--------+---------+-----------+
    |database|tableName|isTemporary|
    +--------+---------+-----------+
    | default|   test01|      false|
    | default|   test02|      false|
    | default|   test03|      false|
    +--------+---------+-----------+

    方式二:

    [root@ke03 bin]# ./spark-sql master yarn

    spark-sql> show tables;
    2021-02-16 04:33:02 INFO  CodeGenerator:54 - Code generated in 367.646292 ms
    default    test01    false
    default    test02    false
    default    test03    false
    8080没有任务(无论增删查都没有)

    ----------------------------------------------------------------        spark使用类似hiveserver2方式  -----------------------------------------------------------------

    目录:/opt/bigdata/spark-2.3.4-bin-hadoop2.6/sbin

    ./start-thriftserver.sh --master yarn

    jps:多了一个进程 SparkSubmit (后台运行)
    8080启动了:Thrift JDBC/ODBC Server  不退出程序,一直连接

    目录:/opt/bigdata/spark-2.3.4-bin-hadoop2.6/bin

    ./beeline  // 只要能和ke03这台机器通讯,就可以直接连接
    !connect jdbc:hive2://ke03:10000    // hive2连接  原因是模仿hive的

    验证:spark数据与hive数据同步

    0: jdbc:hive2://ke03:10000> show tables;
    +-----------+------------+--------------+--+
    | database  | tableName  | isTemporary  |
    +-----------+------------+--------------+--+
    | default   | test01     | false        |
    | default   | test02     | false        |
    | default   | test03     | false        |
    +-----------+------------+--------------+--+
  • 相关阅读:
    杂项收集,包括-发邮件、二维码生成、文件下载、压缩、导出excel
    SQL2008删除大量数据
    优秀程序设计的18大原则
    多线程基础
    SQL金典
    [读书笔记]高效程序员的45个习惯:敏捷开发修炼之道
    Unity 查找资源引用工具
    Unity自动生成各种机型分辨率效果工具
    Unity Editor模式 Invoke()函数 失效
    Unity 特效 粒子 自动播放
  • 原文地址:https://www.cnblogs.com/bigdata-familyMeals/p/14521453.html
Copyright © 2020-2023  润新知