MPP数据库
版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/lyc417356935/article/details/45033069
MPP数据库定义
MPP即大规模并行处理(Massively Parallel Processor )。 在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据 库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。
大规模并行处理(MPP)架构
Vertica无共享MPP的特点
- 无特殊节点
- 所有节点对等
- 可通过任意节点查询或加载数据
- 实时加载与查询同步进行
目前常见的MPP架构数据库
1.GREENPLUM
2.DB2 DPF架构数据库
3.vertica mpp数据库
为什么选择MPP
• PB级别的分析需求
- 传统数据库无法支持大规模集群与PB级别数据量
- 性能受限
- 扩展性受限
- 成本高昂
• 软硬件一体机成本高昂、扩展受限
- 生产扩容、测试、开发、容灾都需新购同型号一体机(机柜)
- 跨代兼容性问题
• In-memory技术太贵而且不成熟
- 内存成本高
- TB级别以下,不适合大数据量
• Hadoop技术的先天不足
- Hive等sql-on-hadoop性能太慢
- SQL兼容性与支持不足
- 数据安全性无法保证
大数据之惑,面对越来越庞大的数据,企业如何利用好大数据值得思考,HADOOP,MPP,PPT在精彩,还是一步步的转变。