使用 NoSQL 数据库分析大规模数据
IBM的开发者站点的这个整理对入门和学习比较有效
1. NoSQL 入门
NoSQL 数据库被更多的人所关注是因为它在解决大规模数据的可扩展性上有它独到的解决方案。无模式的数据存储模型与传统的关系型数据库有着本质上的区别,但是它们并不像想象中那么难以使用。
2. 流行 NoSQL 数据库实用指南
现在,您已经对 NoSQL 有了一些基本的认识,是时候去认识一些目前流行的数据库了。学习针对 MongoDB、CouchDB、Amazon 的 SimpleDB 和 Google AppEngine 数据存储服务推出的实用指南。
3. 使用 MapReduce 分析分布式数据
大规模数据解决方案中的一项重要技术就是 MapReduce,它是一个由 Google 提出的用于处理大规模、分布式数据集的编程模型以及实现。在这里了解 Apache Hadoop,一个 MapReduce 的开源实现,它在 IBM 的大规模数据解决方案中起到了重要的作用。