• 【HANA系列】SAP Vora(SAP HANA和Hadoop)简析


    公众号:matinal
    本文作者:matinal
     

    前言部分

    大家可以关注我的公众号,公众号里的排版更好,阅读更舒适。

    正文部分

    此处声明一点,很多乱七八糟的网站或者人转载文章的时候不注明出处,也不通知本人。该当何罪。

    我们都知道SAP HANA的费用很高,原因就是内存数据库,内存计算,大部分要归功于硬件的支撑

    而SAP还有个产品也是处理大数据的,就是BW,现在BW4也推出了

    但是在这个互联网发达的时代里,数据增长想当迅速,因此问题出现了

    SAP提供了将热量数据存储在由HANA直接管理的基于磁盘的商店(动态分层)中的选项

    这比HANA在内存中便宜得多,从而提高了解决方案的价格到内存比例

    随着客户对存储和处理数据需求的增长,SAP必须提供一种利用Big Data / Hadoop作为冷库的方法

    个普遍的策略是使用SDA通过Hive或Spark访问Hadoop

    大多数人不知道的是,这不是利用Hadoop的好方法(此处应有得意表情,O(∩_∩)O哈哈~)

    通过简单地将查询发送到Hadoop,数据将返回给HANA进行处理

    HANA是发送数据的,所以SDA不是大数据的正确方法

    HANA需要能够将其查询注入Hadoop节点并利用Hadoop的处理能力

    例如,要对非常大的数据集进行转换,无法将其加载到HANA内存中

    所以,重要嘉宾出场了,就是主咖出场了,我们的SAP Vora来了

    SAP Vora是位于Hadoop中Spark的顶层的层。

    SAP Vora的作用只是让HANA利用Hadoop来处理密集的工作。

    当然还有其他作用,例如支持符合HANA的层次结构和货币。

    Vora的缺点在于其对Hadoop集群的规模要求是三倍,并增加了SAP许可成本。

    这可能会暂时损害SAP的大数据。

    但是,Vora仍然是新的,随着时间的流逝,我们将看到更多的改进,也许是SAP更可行的许可策略。

  • 相关阅读:
    Apollo与ROS
    QT windeployqt
    自定义QGraphicsItem
    ROS与C++
    aptitude与apt-get
    解决tcp粘包问题
    网络中两台主机通信
    I/O多路复用之select、poll、epoll
    Nginx命令行控制
    C++11
  • 原文地址:https://www.cnblogs.com/SAPmatinal/p/11183813.html
Copyright © 2020-2023  润新知