原帖:http://www.itpub.net/thread-1409964-1-1.html
什么是GREENPLUM?
对于非常多IT人来说GREENPLUM是个陌生的名字。简单的说它就是一个与ORACLE, DB2一样面向对象的关系型数据库。我们通过标准的SQL能够对GP中的数据进行訪问存取。GREENPLUM与其他普通的关系型数据库的差别?
本质上讲GREENPLUM是一个关系型数据库集群. 它实际上是由数个独立的数据库服务组合成的逻辑数据库。与RAC不同,这样的数据库集群採取的是MPP架构。例如以下图所看到的
它的组件分成三个部分MASTER/SEGMENT以及MASTER与SEGMENT之间的高效互联技术GNET。当中MASTER和SEGMENT本身就是独立的数据库SERVER。不同之处在于,MASTER仅仅负责应用的连接,生成并拆分运行计划,把运行计划分配给SEGMENT节点,以及返回终于结果给应用,它仅仅存储一些数据库的元数据,不负责运算,因此不会成为系统性能的瓶颈。这也是GREENPLUM与传统MPP架构数据库的一个重要差别。
SEGMENT节点存储用户的业务数据,并依据得到运行计划,负责处理业务数据。也就是用户关系表的数据会打散分布到每一个SEGMENGT节点。当进行数据訪问时,首先全部SEGMENT并行处理与自己有关的数据,假设须要segment能够通过进行innterconnect进行彼此的数据交互。 segment节点越多,数据就会打的越散,处理速度就越快。因此与SHARE ALL数据库集群不同,通过添加SEGMENT节点server的数量,GREENPLUM的性能会成线性增长。
GREENPLUM适用场景?
GREENPLUM尽管是关系型数据库产品,它的特点主要就是查询速度快,数据装载速度快,批量DML处理快。并且性能能够随着硬件的加入,呈线性添加,拥有很良好的可扩展性。因此,它主要适用于面向分析的应用。比方构建企业级ODS/EDW,或者数据集市等等。
GREENPLUM执行的平台?
GREENPLUM执行在X86架构的硬件平台上,眼下支持的操作系统包含32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS
GREENPLUM的前景?
GREENPLUM 诞生于2003年硅谷,2010/07 EMC收购了GREENPLUM,并把GREENPLUM作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展非常快,在国内市场发展也非常快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,终于选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应用。
怎样学习GREENPLUM?
正是由于产品发展速度非常快,可是在相关人才上存在非常大缺口。因此,我个人觉得对于各位有兴趣的技术人员来说,是一个非常好的职业发展机会。以个人经验来说,仅仅要有其他关系型数据库的基础,尤其是POSTGRESQL或者INFORMIX基础的(由于GREENPLUM是在POSTGRESQL基础上开发出来的),非常容就能够上手学习并掌握GREENPLUM。
GREENPLUM的手冊写的很好,全然能够作为入门的教材使用。其软件本身也是软性LICENSE,用于学习研究全然免费,并且与生产环境并无不同,这与ORACLE全然一样。
怎样下载GREENPLUM的资料?
官方途径能够从站点 HTTP://gpn.greenplum.com上下载手冊和软件。但国内因为网络问题,可能不太好用。希望论坛或者哪位同志能提供一个好用的网盘,我愿意与大家分享相关软件和资料。