• spark 文件位置报错


    任务提交指令:

    spark-submit --class orderinversioninspark.RelativeFrequency ~/soft/temp/bigdataAnalysis.jar 2 /input/inputfile.txt /outputfi

    异常部分信息如下:

    Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file://input/inputfile.txt
    at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)

    at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)

    at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)

    按理说,默认应该寻找HDFS目录下的文件,现在却找的是本地文件。具体原因想了很久也没想明白,待续。

    附上自己的解决方案:

    spark-submit --class orderinversioninspark.RelativeFrequency ~/soft/temp/bigdataAnalysis.jar 2 hdfs://master:8020/input/inputfile.txt /outputfi0

    即添加完整的hdfs URL。

    另外,若要使用本地文件的话那么URL改为:file:///home/centos/soft/files/inputfile.txt
    ————————————————
    版权声明:本文为CSDN博主「Julian Win」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/perfer258/article/details/80714407

  • 相关阅读:
    Document
    JavaScript
    day6 双向循环及pass、break、continue的使用以及for循环
    day5 isinstance&代码块&分支&while循环
    day4:运算符
    day3:强制类型转换&自动类型转换&变量缓存机制
    day2:Number,tuple,str,list,set,dict
    day1:注释和变量
    线段树区间修改+查询区间和
    Prim/Kruskal求最小生成树
  • 原文地址:https://www.cnblogs.com/chang09/p/15877713.html
Copyright © 2020-2023  润新知