• window环境下使用sbt编译spark源码


      前些天用maven编译打包spark,搞得焦头烂额的,各种错误,层出不穷,想想也是醉了,于是乎,换种方式,使用sbt编译,看看人品如何!

      首先,从官网spark官网下载spark源码包,解压出来。我这边使用的是1.4.0版本。

      然后,我们需要把sbt配置好,配置很简单,无非就是SBT_HOME什么的,大家可以参考官网给出的安装配置手册

      在window的命令行模式下进入刚刚解压的spark源码目录下,我们根据官网提示的命令输入:

    sbt -Pyarn -Phadoop-2.3 assembly
    

     

      然后等待编译完成。。。

      中途报错!!!

      定睛一看,哦!原来是提示没有git命令,于是,我从git官网下载了git,安装并配置好环境变量,这个配置也很简单。

      继续编译,心情不好,所以把命令打的更长了:

    sbt -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver assembly
    

      长时间的等待中。。。先去看看hadoop的权威指南。。。

      失败,失败,又是失败!

      又回到原点,转向了maven。我发现,maven在编译整个spark源码的时候很容易出错,而且出错了找起来也比较麻烦。于是,我决定一个一个小文件夹编译,发现,真的可以诶。现在正在编译小文件夹中的pom.xml。。。

      编译完成,讲根目录下的pom.xml修改,删除没必要的module,否则,maven编译测试的时候还是出错,只需要剩下该有的就行。

      

  • 相关阅读:
    FastApi 进阶
    flask为多个接口添加同一个拦截器的方法
    记一次flask上传文件返回200前端却504的问题
    Python在项目外更改项目内引用
    go mod 拉取私有仓库
    go跳出多层循环的几种方式
    Zap简单使用
    记一次Goroutine与wg导致的问题
    go判断字符串是否是IP地址
    SpringBoot的启动流程
  • 原文地址:https://www.cnblogs.com/cstzhou/p/4633909.html
Copyright © 2020-2023  润新知