1. 对大型任务的细粒度的容错机制. 1hr的任务,中间数据有错误或者失败,可以容错重做
2. 对异构系统,异构存储的集群环境中的数据处理的良好支持.
3. 相比于SQL,MapReduce提供了一个支持更复杂的数据操作的框架
摘录自:
MapReduce: A Flexible Data Processing Tool, Jeffrey Dean, Sanjay Ghemawat
http://cacm.acm.org/magazines/2010/1/55744-mapreduce-a-flexible-data-processing-tool/fulltext
感叹:Cloud Computing 如同Grid Computing,火上那么2年,终究需要沉淀一点核心技术下来