• HBase读取数据卡住长时间不返回的原因分析


    这些天做HBase,但是遇到Hbase连接上之后读取数据的时候,一直卡在那儿,程序既不报错也不结束,让我好生纠结,困扰我一整天。现在问题终于解决,现在写了一段Demo代码,具体如下:

    public static void main(String[] args) throws IOException {
        System.setProperty("hadoop.home.dir", "f:/hadoop/hadoop-common-2.2.0-bin-master");
        conf = new Configuration();
        conf.set("hbase.zookeeper.quorum", "192.168.179.216,192.168.179.215");
        conf.set("hbase.zookeeper.property.clientPort", "2181");
        conf.set("zookeeper.znode.parent", "/hbase");
    
        try {
            // establish the connection to the cluster.
            Connection connection = ConnectionFactory.createConnection(conf);
            // retrieve a handle to the target table.
            table = connection.getTable("MyTable");
    
            Scan scan = new Scan();
            System.out.println("Scan object instantiated");
            ResultScanner scanner = table.getScanner(scan);
            System.out.println("ResultScanner object instantiated");
            for(Result res: scanner){
                System.out.println(Bytes.toString(res.getRow()));
                System.out.println("Next iteration");
            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
           // close everything down
           if (table != null) table.close();
           if (connection != null) connection.close();
       }
    }

    在我的实际项目中,当程序执行到table = connection.getTable("MyTable")时,程序就一直卡在那儿,也不报任何错误。我束手无策,但是任务很多也很着急我不得不想尽一切办法来解决,于是我陷入了深深地思考,这个过程是及其痛苦的….
      我写了测试类,找出log,忍着一句一句往下看,终于看到程序一直在不断的进行连接,一直不停的重试,突然让我明白或许是我的hosts配置有问题,导致程序解析主机名出现错误,一直重新连接尝试。简单来说就是hosts文件中配置的主机名和真实主机名不一致,并且还加入了额外的hosts配置信息干扰到了正确解析主机名。
      因此我运行demo程序的工作机没有配置任何额外的hosts,连接ZooKeeper时直接使用的IP地址,但是HBase Client 底层在进行操作时可能引入了主机名反向连接,作为完全干净的工作机当然找不到对应的服务器,就不断地在后台重试导致生成了上述的日志。当我把出现问题的两个hosts记录加入到工作机后,问题解决。折腾了一天终于就这么点问题,终于搞定。
      通过上述错误可知,Hadoop集群中hostname一定要与hosts文件中配置的名称一致,并且力求保证集群映射关系的纯净,不要把其他不相干的业务也部署在其中,引起不必要的麻烦。

    本文来自博客园,作者:秋华,转载请注明原文链接:https://www.cnblogs.com/qiu-hua/p/13752679.html

  • 相关阅读:
    vue router路由懒加载
    vue router动态路由
    vue router路由跳转
    vue router-link属性
    vue router mode
    vue router
    vuecli脚手架
    R读取大文件速度太慢?来试试能提速两千倍的fread
    基于RAINBOW的单倍型全基因组关联分析(haplotype-based GWAS)教程
    今日Vlog:Jmeter中那些循环
  • 原文地址:https://www.cnblogs.com/qiu-hua/p/13752679.html
Copyright © 2020-2023  润新知