spark 数据流输出

1、save to hdfs json file

spark.sparkContext.setLogLevel("error")
val  data=spark.read.json("hdfs://cslcdip/home/dip/lzm/sparkdata/people.json")
data.write.mode("overwrite").json("hdfs://cslcdip/home/dip/lzm/sparkdata/result")

SaveMode指定文件保存时的模式。

Overwrite：覆盖

Append：追加

ErrorIfExists：如果存在就报错

Ignore：如果存在就忽略

2、save to hdfs parquest

val spark:SparkSession=sparkBuilder.master("local[2]").enableHiveSupport().getOrCreate()
    spark.sparkContext.setLogLevel("error")
    val  data=spark.read.json("hdfs://cslcdip/home/dip/lzm/sparkdata/people.json")
    data.write.mode("overwrite").parquet("hdfs://cslcdip/home/dip/lzm/sparkdata/result")
    val data2=spark.read.parquet("hdfs://cslcdip/home/dip/lzm/sparkdata/result/*")
    data2.show()

3、save to mysql

4、save to hive

  spark.sql("use bd")
  spark.sql("insert overwrite table b_province_center select * from tiger.b_province_center ")

相关阅读:
java中的注解
jQuery中的pushStack
jenkins+maven+svn构建项目，及远程部署war包到tomcat上
mysql中的find_in_set的使用
svn的使用总结
poi导出excel，以字符串格式输出数字
eclipse中在整个工程中查找一个字符串的步骤
Android Service学习
Android生成签名文件
开源移动医疗应用框架：mHealhDroid及APP

原文地址：https://www.cnblogs.com/students/p/14274021.html