• HBase数据模型(2)


    HBase数据模型(1)
    HBase数据模型(2)

    1.0 HBase的版本version,是一个用长整型表示的。由Rowkey、Column(列族和列)、Version组合在一起称为HBase中的一个单元格。

    2.0 排序,Get和Scan操作返回的是经过排序的数据。返回的数据首先按行字典排序,其次是列族,然后是列修饰符(cloumn qualifier),最后是时间戳反向排序,最新的在最前面。

    3.0 连接查询,实现jion操作有两种方法:要么写入HBase的时候已经做好连接;要么查询表并在应用层实现连接。

    4.0 计数器,IncrementColumnValue(简称ICV)是HBase的计数器,可以完成一些计算页面浏览量(PV)等的操作。

    5.0 原子操作,仅供对行级别的原子性,也就是对同一个Key下的数据进行的两个操作,在实际执行的时候是会串行的执行,保证了每一行KeyValue对不会被破坏。

    6.0 行锁,RegionServer提供了一个行锁特性,保证了只有一个客户端能获取一行数据相应的锁,同时对该行进行修改。

    7.0 自动分区

    • HBase中的表数据会被分拆很多个Region,Region可以动态扩展并且HBase保证Region的负载均衡。
    • Region实际上是行键排序后的按则分割的连续的存储空间。
    • Region的自动分区动作是split和compaction
    • 刚刚创建的的表只有一个Region,随着数据的写入,达到Region上限配置时,Region会按照中间键自动地拆分成两个大致相等的Region,每个Region由一个RegionServer管理,一个RegionServer处理器管理者许多个Region。
    • 每个Region包含起始Rowkey的记录,不包含结束Rowkey的记录。
    • 每个RegionServer可以管理大约100 ~ 1000个Region,每个Region的大小可以是1 ~ 20GB。
    • 当一个Region进行拆分时,首先要将该Region下线(offline),拆分完后新的Region在上线(online),下线的Region暂时不可用,不过由于速度极快,通常不会对数据的读写造成影响。

    8.0 CAP原理

    一致性(Consistency):所以节点在用一时间具有相同的数据。

    可用性(Availability):保证每个请求不管成功或者失败都有响应。

    分区容忍性(Partition tolerance):系统中任意信息的丢失或失败不会影响系统的继续运作。
    HBase数据模型(1)
    HBase数据模型(2)

  • 相关阅读:
    阿里Canal中间件的初步搭建和使用
    深入理解Java String类
    深入理解Java中的String
    Docker 容器数据卷(挂载)
    在docker容器下利用数据卷实现在删除了mysql容器或者镜像的情况下恢复数据
    EFK(Elasticsearch+Filebeat+Kibana)收集容器日志
    Docker 容器日志占用空间过大解决办法
    四种软件架构,看看你属于哪个层次
    Kubernetes 如何只授予某一 Namespace 的访问权限
    Docker实验Docker的网络配置
  • 原文地址:https://www.cnblogs.com/lanzhi/p/6467699.html
Copyright © 2020-2023  润新知