• HBase数据模型(2)


    HBase数据模型(1)
    HBase数据模型(2)

    1.0 HBase的版本version,是一个用长整型表示的。由Rowkey、Column(列族和列)、Version组合在一起称为HBase中的一个单元格。

    2.0 排序,Get和Scan操作返回的是经过排序的数据。返回的数据首先按行字典排序,其次是列族,然后是列修饰符(cloumn qualifier),最后是时间戳反向排序,最新的在最前面。

    3.0 连接查询,实现jion操作有两种方法:要么写入HBase的时候已经做好连接;要么查询表并在应用层实现连接。

    4.0 计数器,IncrementColumnValue(简称ICV)是HBase的计数器,可以完成一些计算页面浏览量(PV)等的操作。

    5.0 原子操作,仅供对行级别的原子性,也就是对同一个Key下的数据进行的两个操作,在实际执行的时候是会串行的执行,保证了每一行KeyValue对不会被破坏。

    6.0 行锁,RegionServer提供了一个行锁特性,保证了只有一个客户端能获取一行数据相应的锁,同时对该行进行修改。

    7.0 自动分区

    • HBase中的表数据会被分拆很多个Region,Region可以动态扩展并且HBase保证Region的负载均衡。
    • Region实际上是行键排序后的按则分割的连续的存储空间。
    • Region的自动分区动作是split和compaction
    • 刚刚创建的的表只有一个Region,随着数据的写入,达到Region上限配置时,Region会按照中间键自动地拆分成两个大致相等的Region,每个Region由一个RegionServer管理,一个RegionServer处理器管理者许多个Region。
    • 每个Region包含起始Rowkey的记录,不包含结束Rowkey的记录。
    • 每个RegionServer可以管理大约100 ~ 1000个Region,每个Region的大小可以是1 ~ 20GB。
    • 当一个Region进行拆分时,首先要将该Region下线(offline),拆分完后新的Region在上线(online),下线的Region暂时不可用,不过由于速度极快,通常不会对数据的读写造成影响。

    8.0 CAP原理

    一致性(Consistency):所以节点在用一时间具有相同的数据。

    可用性(Availability):保证每个请求不管成功或者失败都有响应。

    分区容忍性(Partition tolerance):系统中任意信息的丢失或失败不会影响系统的继续运作。
    HBase数据模型(1)
    HBase数据模型(2)

  • 相关阅读:
    NGINX location 在配置中的优先级
    CentOS 系统启动流程
    微软输入法正则bug
    uniapp改变页面背景色
    路由Router
    vue-cli3替换默认的title和图标(区别脚手架vue-cli2版本)
    浏览器报错 Refused to apply style from 'http://******' because its MIME type ('text/html') is not a supported stylesheet MIME type, and strict MIME checking is enabled.
    禁止浏览器后退
    前端构建工具(webpack-gulp-grunt-rollup...)
    鼠标经过小箭头(状态伪类需求)
  • 原文地址:https://www.cnblogs.com/lanzhi/p/6467699.html
Copyright © 2020-2023  润新知