• 【HANA系列】SAP HANA数据处理的理解与分析一


    公众号:matinal
    本文作者:matinal
     

    前言部分

    大家可以关注我的公众号,公众号里的排版更好,阅读更舒适。

    正文部分

    SAP HANA处理大量数据速度快的机制理解

    1:HANA使用列存储的数据管理优化数据存取

    从列去读取数据库表,其他忽略

    2:对于内存和CPU之间的访问速度差异,增加内核,压缩数据

    3:使用列存储技术高效利用CPU的缓存。

    行存储数据的读取方式容易造成内存的数据读取及高速缓存的丢失

    4:利用新型CPU预读取的技术夹克数据的读取

    就是读取一个缓存数据的同时,预读另一个缓存数据。

    HANA采用了行列混合的存储模式

    即在单一数据库系统中,能支持两种不同的数据存储模式。

    传统意义上数据库表是一个二维表,由行和列组成。

    行存储方式包含一条记录中所有的数据

    而列存储方式则包含这一列中所有数据。

    如下图演示:

    这样一个数据库表的话,

    行存储如下:

    列存储如下:

    一般认为,列存储对数据的读取优于行存储

    行存储对数据的更新更加好。

    所以,列存储适用于以下情况:

    1:大量数据的统计计算和访问只会在需要访问的某几个单列中进行

    2:对于需要经常对表结构进行改动的或者扩展的情况

    3:对很多行记录和列字段进行频繁操作

    4:当最主要的列中有很多重复数据的情况,可以对其进行数据压缩

    行存储使用于以下情况:

    1:在某个时间点只处理单行的记录。

    2:需要访问这一记录的所有列信息,避免跳跃式访问读取。

    3:列中包含最主要的不重复数据。

    4:没有快速聚合或进行快速查询的需要。

    5:数据库表中的记录不太多的情况。

    更多内容,关注我的公众号吧。

  • 相关阅读:
    js 与 asp.net 验证控件冲突解决方法
    图片处理(给图片加水印)
    JS打开窗口
    ASP.NET编程中的十大技巧
    【ASP.NET】FCKeditor 2.6 + Asp.Net 设置
    XML文件设置树形结构(无限级)原创
    利用vs.net快速开发windows服务(c#) (转载)
    C#反射 学习
    C#解压RAR压缩文件(转载测试通过)
    SQL显示字段信息
  • 原文地址:https://www.cnblogs.com/SAPmatinal/p/11183257.html
Copyright © 2020-2023  润新知