前言
对于hadoop,hbase由于项目紧张原因好几个月没有时间认真的来总结下了,最近有一些空,就来继续的把项目中用到的一些技术实际的写出来,动动手,好久没有写东西了,都生疏了,说起hadoop,公司还在用相对比较古老的hadoop && hbase 0.20.* 级别的老版本了,这点充分说明日本人不想折腾,能跑的就好,针对企业用户最主要的是稳定,而且访问量也不是很大,所以关注的不对,但是对于技术发烧友的我来说,当然想尝试新的版本的了,从去年开始就一直关注hadoop2 的beta版本,现在虽然说发布了一个稳定版本,但是大部分还是在沿用老版本,本次说的版本是cloudera公司的 CDH4.4 ,目前最新的稳定版本,本次的目的是想把现有的一些应用迁移到新版本上,而不是在基础的安装和了解.
配置CDH4.4
本次不使用安装版本,就直接用了 cloudra已经打包好的虚拟机系统,我选择的是virtualbox的分支,因为在mac上virtualbox是免费开源的,目前来看跑的还算可以. 下载cdh4.4的地址:http://www.cloudera.com/content/support/en/downloads/download-components/download-products.html
下载下来的虚拟机是2.5G,解压开来就可以了.
开起来机器配置不够的话,还是感觉比较卡的说,这些问题还是有的. 启动之后见如下图:
进入CDH的管理中心页面:
帐号和密码都是 cloudera , cloudera 进去之后就可以手动启动 hadoop,hbase了,这里启动后下次开机后这些服务将自动启动了.
HBase的操作
本次不是用默认自带的HBase shell, 使用公司(www.bit-ware.co.jp)自己开发的HBashShellPro来进行操作演示. 首先在github上下载HBaseShellPro:
https://github.com/bit-ware/HBaseShellPro/tree/0.94 使用方法:
|
列出表
|
创建表
|
写入和读取测试
|
结语
本次先写入到这里,验证了环境是正常的. 使用Cloudera的配置环境省去了配置的修改问题,但是要了解整个过程还是得多读资料,了解实际的组成和系统的流程,以便于更好的了解和使用HBase.