• Hadoop应用测试


    以下是我实际在虚拟机中测试完成的例子,
    使用easy_hadoop的bash脚本需要改两个路径 ,
    还有pig的路径,使用8.1的stable版本
    部署完成之后,要注意使用hadoop这个账号来运行
    mkdir input && cd input
    echo "aa" >1.txt
    echo "bb" >> 1.txt
    echo "aa" >> 1.txt
    echo "zz" >2.txt
      352  bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
      353  sudo -u hadoop bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
      354  sudo -u hadoop bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount input output

      356  sudo -u hadoop bin/hadoop dfs -ls output/
      357  sudo -u hadoop bin/hadoop dfs -cat output/part-r-00000
    Hadoop应用测试
    2009年07月16日 星期四 13:18

    Hadoop部署完成后,进行示例测试。hadoop-0.18.3目录下包含了hadoop-0.18.3-examples.jar,里面包含很多示例。下面测试一下最著名的wordcount。

    开启HDFS,如下:

    $ cd /home/howard/hadoop-0.18.3

    $ bin/hadoop/start-dfs.sh

    在本地目录建立input目录,并在其中新建file01.txt和file02.txt。编辑这两个txt,分别写入:Hello Hadoop Goodbye Hadoop、Hello World Bye World。然后把本地的这个目录拷贝到HDFS中,我在这个地方犯了错误,以为本地的已经就在HDFS中了,导致拷贝时找不到目录。

    $ bin/hadoop dfs -copyFromLocal /home/howard/input input     //前面的路径是本地input目录,后面的input表示 存放在HDFS中

    接下来,就可以执行wordcount了。要运行jar必须开启服务,

    $bin/start-all.sh

    $bin/hadoop jar hadoop-0.18.3-examples.jar wordcount input output   //运行wordcount,结果存放在output目录中

    下面就可以查看输出结果,

    $ bin/hadoop dfs -cat output/part-00000 结果如下:

    Bye         1

    Goodbye 1

    Hadoop   2

    Hello        2

    World     2

    这是一个典型的MapReduce示例。

    另外,如果在HDFS中有不需要的目录(里面包含文件),可以使用下面的命令删除。

    $ bin/hadoop dfs -rmr /user/howard/output

    如果是空目录,则用$ bin/hadoop dfs -rm /user/howard/output

  • 相关阅读:
    Mac下好玩的终端命令
    【bzoj3441】乌鸦喝水
    LeetCode[39]: 组合总和
    打击盗版,支持原创
    状态模式(State)-设计模式
    webpack核心概念
    吴裕雄--天生自然TensorFlow高层封装:Estimator-自定义模型
    吴裕雄--天生自然TensorFlow高层封装:Estimator-DNNClassifier
    吴裕雄--天生自然TensorFlow高层封装:Keras-TensorFlow API
    吴裕雄--天生自然TensorFlow高层封装:Keras-多输入输出
  • 原文地址:https://www.cnblogs.com/lexus/p/2390002.html
Copyright © 2020-2023  润新知