放假了,放假了:http://blog.csdn.net/skywalker_only/article/details/17076851
nucht2.2.1爆出如下异常:
Exception in thread "main" org.apache.gora.util.GoraException: java.lang.RuntimeException: java.lang.IllegalArgumentException: Not a host:port pair: �17195@Master.HadoopMaster.Hadoop,60000,1390615520310
at org.apache.gora.store.DataStoreFactory.createDataStore(DataStoreFactory.java:167)
at org.apache.gora.store.DataStoreFactory.createDataStore(DataStoreFactory.java:135)
at org.apache.nutch.storage.StorageUtils.createWebStore(StorageUtils.java:75)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:221)
at org.apache.nutch.crawl.Crawler.runTool(Crawler.java:68)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:136)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:250)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
是因为hbase版本过高,gora不支持hbase,
http://blog.csdn.net/skywalker_only/article/details/17076851
该段评论的url链接为https://issues.apache.org/jira/browse/GORA-201,大家可以自己阅读一下更多的讨论。
从这些讨论中可以得到gora-hbase是支持hbase-0.92.X版本的,所以在尝试最新的hbase版本失败后,笔者决定将hbase的版本将为0.92.1,
读者可以从http://archive.apache.org/dist/hbase/下载自己喜欢的版本。下面这些问题都是在使用Nutch-2.2.1和HBase-0.92.1的过程出现的问题,
后面会做些修改gora-hbase源码,实现hbase最新版本接口的方法的尝试,至于成功与否不敢保证。
http://blog.csdn.net/chenwei825825/article/details/12281741 mapreduce工作机制相关,写的还不错~
hbase : http://www.linuxidc.com/Linux/2011-11/47236.htm hbase 开发环境搭建
http://www.cnblogs.com/xia520pi/archive/2012/06/04/2534533.html mapreduce 开发小例子 一堆一堆~~
http://blog.csdn.net/weijonathan?viewmode=contents 不错的 博客~~
http://blog.sina.com.cn/s/blog_76a8411a0101b9qd.html zookeeper
http://blog.csdn.net/weijonathan/article/details/8591117 zookerpp