公众号:matinal
本文作者:matinal
前言部分
大家可以关注我的公众号,公众号里的排版更好,阅读更舒适。
正文部分
此处声明一点,很多乱七八糟的网站或者人转载文章的时候不注明出处,也不通知本人。该当何罪。
我们都知道SAP HANA的费用很高,原因就是内存数据库,内存计算,大部分要归功于硬件的支撑
而SAP还有个产品也是处理大数据的,就是BW,现在BW4也推出了
但是在这个互联网发达的时代里,数据增长想当迅速,因此问题出现了
SAP提供了将热量数据存储在由HANA直接管理的基于磁盘的商店(动态分层)中的选项
这比HANA在内存中便宜得多,从而提高了解决方案的价格到内存比例
随着客户对存储和处理数据需求的增长,SAP必须提供一种利用Big Data / Hadoop作为冷库的方法
个普遍的策略是使用SDA通过Hive或Spark访问Hadoop
大多数人不知道的是,这不是利用Hadoop的好方法(此处应有得意表情,O(∩_∩)O哈哈~)
通过简单地将查询发送到Hadoop,数据将返回给HANA进行处理
HANA是发送数据的,所以SDA不是大数据的正确方法
HANA需要能够将其查询注入Hadoop节点并利用Hadoop的处理能力
例如,要对非常大的数据集进行转换,无法将其加载到HANA内存中
所以,重要嘉宾出场了,就是主咖出场了,我们的SAP Vora来了
SAP Vora是位于Hadoop中Spark的顶层的层。
SAP Vora的作用只是让HANA利用Hadoop来处理密集的工作。
当然还有其他作用,例如支持符合HANA的层次结构和货币。
Vora的缺点在于其对Hadoop集群的规模要求是三倍,并增加了SAP许可成本。
这可能会暂时损害SAP的大数据。
但是,Vora仍然是新的,随着时间的流逝,我们将看到更多的改进,也许是SAP更可行的许可策略。