Redis set

Redis set
目录
set 类型
- 新的存储需求：存储大量的数据，在查询方面提供更高的效率
- 需要的存储结构：能够保存大量的数据，高效的内部存储机制，便于查询
- set 类型：与 hash 存储结构完全相同，仅存储键，不存储值（nil）,并且值是不允许重复的
set 类型数据的基本操作
- 添加数据
  
  sadd key memeber1 [memeber2]
- 获取全部数据
  
  smembers key
- 删除数据
  
  srem key member1 [member2]
- 获取集合数据总量
  
  scard key
- 判断集合中是否包含制定数据
  
  sismember key member
set 应用

1、业务场景

每位用户首次使用今日头条时会设置3项爱好的内容，但是后期为了增加用户的活跃度、兴趣点，必须让用户对其他信息类别逐渐产生兴趣，增加客户留存度，如何实现

1.1、业务分析
- 系统分析出各个分类的最新或最热点信息条目并组织成 set 集合
- 随机挑选其中部分信息
- 配合用户关注信息分类中的热点信息组织成展示的全信息集合
1.2、解决方案
- 随机获取集合中指定数量的数据
  
  srandmember key [count]
- 随机获取集合中的某个数据并将该数据移出集合
  
  spop key
总结：redis 可以应用于随机推荐信息检索，例如热点歌单推荐，热点新闻推荐、热卖旅游线路，应用 APP 推荐，大 V 推荐等等

2、业务场景

脉脉为了促进用户间的交流，保障业务成单率的提升，需要让每位用户拥有大量的好友，事实上职场新人不具有更多的职场好友，如何快速为用户积累更多的好友

新浪微博为了增加用户热度，提高用户留存性，需要微博用户在关注更多的人，以此获得更多的信息或热门话题，如何提高用户关注他人的总量

QQ新用户入网年龄越来越低，这些用户的朋友圈交际圈非常小，往往集中在一所学校甚至一个班级中，如何帮助用户快速积累好友用户带来更多的活跃度

微信公众号是微信信息流通的渠道之一，增加用户关注的公众号成为提高用户活跃度的一种方式，如何帮助用户积累更多关注的公众号

美团外卖为了提升成单量，必须帮助用户挖掘美食要求，如何推荐给用户最适合自己的美食

2.1、解决方案
- 求两个集合的交集、并集、差集
```
sinter key1 [key2] // key1, key2 都代指 set 名称
sunion key1 [key2]
sdiff key1 [key2]
```
- 求两个集合的交集、并集、差集并存储到制定集合中
```
sinterstore destination key1 [key2] // destination 是一个 set 名称
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
```
- 将指定数据从原始集合中移动到目标集合中
```
smove source destination member // source, destination 都带至 set 名称，member 是成员
```
总结：
- redis 应用于同类信息的关联搜索，二度关联搜索，深度关联搜索
- 显示共同关注（一度）
- 显示共同好友（一度）
- 由用户 A 出发，获取到好友用户 B 的好友信息列表（一度）
- 由用户 A 出发，获取到好友用户 B 的购物清单列表（二度）
- 由用户 A 出发，获取到好友用户 B 的游戏充值列表（二度）
3、业务场景

集团公司共具有 12000 名员工，内部 OA 系统中具有 700 多个角色，3000 多个业务操作，2300 多种数据，每位员工具有一个或多个角色，如何快速进行业务操作的权限校验

3.1、解决方案
- 依赖 set 集合数据不重复的特征，依赖 set 集合 hash 存储结构特征完成数据过滤与快速查询
- 根据用户 id 获取用户所有角色
- 根据用户所有角色获取用户所有操作权限放入 set 集合
- 根据用户所有角色获取用户所有数据全选放入 set 集合
总结：redis 应用于同类型不重复数据的合并操作

4、业务场景

公司对旗下新的网站做推广，统计网站的 PV（访问量），UV（独立访客），IP（独立IP）。
PV：网站被访问次数，可通过刷新页面提高访问量
UV：网站被不同用户访问的总次数，可通过 cookie 统计访问量，相同用户切换 IP，UV 不变
IP：网站被不同 IP 地址访问的总次数，可通过 IP 地址统计访问量，相同 IP 不同用户访问，IP 不变

4.1、解决方案
- 利用 set 集合的数据去重特征，记录各种访问数据
- 建立 string 类型数据，利用 incr 统计日访问量（PV）
- 建立 set 模型，记录不同 cookie 数量（UV）
- 建立 set 模型，记录不同 IP 数量（IP）
总结：redis 应用于同类型数据的快速去重

5、业务场景

黑名单

资讯类信息类网站追求高访问量，但是由于其信息的价值，往往容易被不法分子利用，通过爬虫技术，快速获取信息，个别特种行业网站信息通过爬虫获取分析后，可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件，电商刷评论、刷好评。

同时爬虫带来的伪流量也会给经营者带来错觉，产生错误的决策，有效避免网站被爬虫反复爬取成为每个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后，需要将此类用户进行有效的屏蔽，这就是黑名单的典型应用。

ps: 有些小型网站需要爬虫为其带来一些流量。

白名单

对于安全性更高的应用访问，仅仅靠黑名单是不能解决安全问题的，此时需要设定可访问的用户群体，依赖白名单做更为苛刻的访问验证。

5.1、解决方案
- 基于经营战略设定问题用户发现、鉴别规则
- 周期性更细满足规则的用户黑名单，加入 set 集合
- 用户行为信息达到后于黑名单进行比对，确认行为去向
- 黑名单过滤 IP 地址：应用于开放游客访问权限的信息源
- 黑名单过滤设备信息：应用于限定访问设备的信息源
- 黑名单过滤用户：应用于基于访问权限的信息源
总结：redis 应用于基于黑名单与白名单设定的服务控制

set 类型数据操作的注意事项
- set 类型不允许数据重复，如果添加的数据在 set 中已经存在，将只留一份
- set 虽然与 hash 的存储结构相同，但是无法启用 hash 中存储值的空间
相关阅读:
记录一下最近面试的总结
 网络模块相关面试题
 JVM 之类加载器
 一段简单的关于字符串的 Java 代码竟考察了这么多东西
 LeetCode 链表题 ( Java )
MD5 加盐加密
 SpringMVC 学习笔记
 [redis]dict和rehash
[redis]SDS和链表
 [go]包和工程管理
原文地址：https://www.cnblogs.com/wuyongqiang/p/12657100.html

set 类型

set 类型数据的基本操作

set 应用

1、业务场景

1.1、业务分析

1.2、解决方案

2、业务场景

2.1、解决方案

3、业务场景

3.1、解决方案

4、业务场景

4.1、解决方案

5、业务场景

5.1、解决方案

set 类型数据操作的注意事项