#1 Hadoop+HBase+ZooKeeper三者关系图
#4 分布式服务框架 Zookeeper -- 管理分布式环境中的数据
#5 Hive
#6 hbase介绍
#1 Hadoop+HBase+ZooKeeper三者关系图
- 日志处理: Hadoop擅长这个
- 抓住本拉登: 并行计算
- ETL: 每个人几乎都在做ETL(Extract-Transform-Load)工作 Netezza关于使用Hadoop做ETL任务的看法)
- 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
- 机器学习: 比如Apache Mahout项目
- 数据发布与订阅(配置中心)
- 负载均衡
- 消费负载均衡:
- 命名服务(Naming Service)
- 分布式通知/协调
- 集群管理与Master选举
- 分布式锁
- 分布式队列
#4 分布式服务框架 Zookeeper -- 管理分布式环境中的数据
#5 Hive
Hive实战: http://blog.csdn.net/sutine/article/details/5653137
hive是hadoop上面数据处理工具,用来把数据查询的sql语句翻译成mapreduce程序方便执行查询。
Yahoo内部有一个类似的项目,叫做PIG。和Hive一样,PIG也是搭在HDFS和MapReduce之上的。