高级数据类型是为了解决特殊的业务而存在
Bitmaps
Bitmaps 类型的基础操作
-
获取指定 key 对应偏移量的 bit 值
gitbit key offset
-
设置指定 key 对应偏移量上的 bit 值,value 只能是 1 或 0
setbit key offset value
如果 offset 的值过大,比如 1000000,我们设置过程中,最好使用 offset = offset - 1000000,这样可以减少设置时间
Bitmaps 类型的扩展操作
-
对指定 key 按位进行交、并、非、异或操作,并将结果保存到 destKey 中
bitop op destKey key1 [key2...]
- and: 交
- or: 并
- not: 非
- xor: 异或
-
统计制定 key 中 1 的数量
bitcount key [start end]
Bitmaps 使用场景
业务场景
电影网站
- 统计每天某一部电影是否被点播
- 统计每天有多少部电影被点播
- 统计每周/月/年有多少部电影被点播
- 统计年度哪部电影没有被点播
业务分析
- 用每天的日期作为 key,用电影的 id 值作为 setbit 命令的 offset 参数,并规定的 value 值为 1 则被点播过,为 0 则未被点播。形如:
setbit 20200416 2 1
表示2020-04-16这一天,id 为 2 的电影被点播 - 统计每周的话,利用这一周的天数据进行 or 位运算,然后再统计结果中 1 的总个数,统计月、年也是这样的
总结:redis 应用于信息状态统计
HyperLogLog
- HyperLogLog 是用来做基数统计的,运用了LogLog的算法
- 基数是数据集去重后元素个数
HyperLogLog 类型的基本操作
-
添加数据
pfadd key element [element ...]
-
统计数据
pfcount key [key ...]
-
合并数据
pfmerge destkey sourcekey [sourcekey...]
业务场景
- 统计独立 UV
解决方案
- 原始方案:存储每个用户的 id(字符串)
- 改进方案:Bitmaps,存储每个用户状态(bit)
- 全新的方案:HyperLogLog
总结:redis 应用于独立信息统计
注意事项
- 用于进行基数统计,不保存数据,只记录数量而不是具体数据
- 核心是基数估算算法,最终数值存在一定误差
- 误差范围:基数估计的结果是一个带有 0.81% 标准错误的近似值
- 耗空间极小,每个 hyperloglog key 占用了 12k 的内存用于标记基数
- pfadd 命令不是一次性分配 12k 内存使用,会随着基数的增加内存逐渐增大
- Pfmerge 命令合并后占用的存储空间为12k, 无论合并之前数据量多少
GEO
用于经纬度存储及计算
GEO 类型的基本操作
-
添加坐标点
geoadd key longitude latitude member [longitude latitude member ...]
例如:
geoadd china 116.33333 39.93333 beijing
在 china 地图集里 beijing 坐标为 16.3333, 39.93333 -
获取坐标点
geopos key member [member ...]
-
计算坐标点距离
geodist key member1 member2 [unit]
-
根据坐标求范围内的数据
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
-
根据点求范围内数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
with 开头的参数都是用来增加展示信息的
[count count] 数据结果集中的范围
还有额外的参数 asc 或 desc 就是升序降序 -
获取指定点对应的坐标 hash 值
geohash key member [member ...]
注意事项
- geo 只计算水平位置距离,不计算垂直位置距离,有误差
- reidis 命令中所有的 with 开头的参数,都是用来给展示结果增加指定信息的
总结:redis 应用于地理位置计算