Hello, 大家好,偶然浏览到一篇大牛的技术博客,佩服之余,作为搬运工的我,自然是下意识地搬运过来,鉴于复制粘贴印象较浅(纸上得来终觉浅,绝知此事要躬行),还是逐字码下来。内容比较长, 笔者我花了一下午才整理完。希望能帮到你。
这篇博客摘录了比较常见的Redis的面试题以及比较全面的Redis知识,不仅仅是为了面试,工作中也可以来这里找灵感。覆盖面我感觉是挺全的。
1、什么是Redis?
Redis是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库。
Redis与其他key-value缓存有下面的三个特点:
(1)Redis支持数据的持久化,可以将内存中数据保存在磁盘中,重启的时候可以再次加载进行使用。
(2)Redis不仅仅支持简单的key-value类型数据,同时还提供了list, set, zet, hash等数据结构的存储。
(3)Redis支持数据备份, 即 maser-slave模式的数据备份。
Redis优势:
(1)性能极高 读110000次/s, 写 81000次/s.
(2)丰富的数据类型-Redis支持二进制案例的string, list, hashes, Sets以及
zset(有序集合)的数据集合的存储。
(3)原子-Redis的所有操作都是原子性的, 单个操作支持原子性, 多个操作也支持,通过 MULTI和EXEC指令包起来。
(4)丰富的特性-Redis还支持publish/subscribe,通知, key过期等特性。
Redis和其他的key-value的存储不同点?
(1)Redis有着更为复杂的数据结构并且提供对他们的原子性操作,这是一个与其他数据库不同的进化路径, 其数据结构都是基于基本的数据结构的对程序员透明,无需进行额外的抽象。
(2)Redis运行在内存中但是可以进行持久化存储到硬盘中,所以在对不同数据集进行高速读写时需要权衡内存,因为数据量不能大于硬盘内存,在内存数据库另一个最大的优点是,相比在磁盘中的相同的复杂的数据结构, 在内存中操作起来非常简单。这样Redis可以做内部很多复杂的事情,同时在磁盘格式方面他们是紧凑的已追加的方式产生的, 因为他们并不需要进行随机访问。
2.Redis的数据类型?
支持五种数据类型:string(字符串), hash(哈希),list(列表), set(集合), zset(有序集合)。实际项目中比较常用的是string, hash如果你是中高级用户,还需要加上下面的几种数据结构,HyperLogLog、Geo、Pub/Sub。如果还玩过Redis Module,像 BloomFilter,RedisSearch,Redis-ML,面试官的眼睛就开始发亮了。
3.使用Redis有哪些好处?
(1)速度快,因为其数据存储在内存中, 类似于HashMap, HashMap的优势就是查找和操作的时间复杂度都是O1
(2)支持丰富的数据类型, 支持 string、list、set、Zset、hash等。
(3)支持事务, 操作都是原子性的,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行。
(4)丰富的特性:可用于缓存,消息,按照key设置过期时间,过期以后将会自动删除。
4.Redis相对于Memcached的优势?
(1)Memcached所有的值均是简单的字符串,Redis支持更丰富的数据类型。
(2)Redis的速度比Memcache快很多。
(3)Redis可以持久化数据。
5.Memcache和Redis的区别都有哪些?
(1)存储方式:前者是将数据全部存储在内存之中,断电以后会挂掉,数据不能超过内存大小。Redis有部分是存在硬盘上的,这样能保证数据的持久性。
(2)数据类型支持类型前者较后者比较少。
(3)使用底层模型不同,它们之间底层实现方式以及与客户端之间通信应用协议不一样。Redis直接自己构建了VM机制, 因为一般的系统直接调用系统函数的话,会浪费一定时间去移动和请求。
6.Redis是单进程单线程的?
Redis是单进程单线程的, Redis利用队列技术将并发访问变成串行访问,消除了传统数据库串行控制的开销。
7.一个字符串类型的值能存储最大容量是多少?
512M。
8.Redis持久化的机制是什么?各自优缺点。
两种机制: RDB和AOF机制:
1、RDB Redis DataBase 持久化方式:是指的用数据集快照的方式半持久化模式,记录Redis数据库的所有键值对,在某个时间点将数据写入一个临时文件,持久化结束后,用这个临时文件替换上次持久化的文件,达到数据恢复。
优点:
(1)只有一个文件dump.rdb, 方便持久化。
(2)容灾性好,一个文件可以保存到安全的磁盘。
(3)性能最大化, fork子进程来完成写操作,让主进程继续处理命令,所以是IO最大化,使用单独子进程来进行持久化, 主进程不会进行任何的IO操作, 保证了Redis的高性能。
(4)相对于数据集大时,比AOF的启动效率更高。
缺点:
数据安全性比较低, 是因为它是间隔一段时间进行持久化,如果在持久化期间Redis发生故障,会发生数据丢失,所以适用于数据要求不严谨的时候。
2、AOF Append Only File持久化方式: 是指的将所有命令行记录以redis命令请求的格式完全持久化保存为AOF文件。
优点:
(1)数据安全, aof持久化可以配置appendfsync属性, 有always, 每一次进行操作的时候就记录到aof文件中一次。
(2)通过append模式写文件, 即使中途服务器宕机,可以通过redis-check-aof工具解决数据一致性问题。
(3)AOF 机制的rewrite模式。AOF文件没被rewrite之前(文件过大时会对命令进行合并重写),可以删除其中的某些命令(比如误操作的flushall)
缺点:
(1)AOF 文件比RDB文件大, 而且恢复速度慢
(2)数据集大的时候,比rdb启动效率低。
9.Redis常见性能的问题和解决的方案:
(1)Master最好不要写内存快照, 如果Master写内存快照,save命令调度rdbSave函数,会阻塞主线程的工作,当快照比较大的时候对性能是很有影响的,会出现间断性暂停服务
(2)如果数据比较重要,某个Slave开启AOF备份数据,策略设置为每秒同步
(3)为了主从复制的速度和连接的稳定性,Master和Slave最好在同一个局域网
(4)尽量避免在压力很大的主库上增从库
(5)主从复制不要用图状结构,用单向链表结构更为稳定,即: Master←Slave1←Slave2←Slave3....这样的结构方便解决单点故障问题, 实现Slave对Master的替换, 如果Mater挂了,可立即启用Slave1作为Master, 其他不变。
10.Redis过期键的删除策略
(1)定时删除: 在设置键的过期时间的同时,创建一个定时器(timer), 让定时器在键的过期时间来临时,立即执行对键的删除操作。
(2)惰性操作:放任键过期不管,但是每次从键空间获取键的时候,都检查取得的键是否过期,过期的话,就删除, 否则返回该键。
(3)定期删除:每隔一段时间程序就对数据库进行一次检查,删除里面的过期键,至于要删除多少过期键,以及要检查多少个数据库, 由算法决定(暂时未研究)。
11.Redis的回售策略(淘汰策略)?
volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰。
volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰。
volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰。
allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰。
allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰。
no-enviction(驱逐):禁止驱逐数据。
这6种机制volatile和allkeys规定了是对已设置过期时间的数据集淘汰数据还是从所有的数据集淘汰数据, 后面的lru、ttl以及random是三种不同淘汰策略,再加上一种 no-enviction永不回收的策略。
使用策略规则:
(1)如果数据呈现幂律分布,即一部分访问频率高, 一部分访问频率低, 则使用allkeys-lru。
(2)如果数据呈现平等分布, 即访问频率差别不大, 使用allkeys-random
12.为什么Redis要把数据放到内存中?
Redis为了达到最快的读写速度将数据都读到内存中,并通过异步的方式将数据写入磁盘,所以Redis具有快速和数据持久化的特征, 如果不放在内存中,硬盘IO严重影响Redis的性能, 在内存越来越便宜的今天, Redis也将会越来越受欢迎,如果设置了最大的使用内存,则数据已有的记录数达到内存限值狗不能继续插入新值。
13.了解Redis的同步机制吗?
Redis可以使用主从同步,从从同步。第一次同步时,主节点做一次bgsave,并同时将后续修改操作记录到内存buffer, 待完成后将RDB文件全量同步到复制节点,复制节点接收完成后将RDB镜像加载到内存。加载完成后,再通知主节点将期间修改的操作记录同步到复制节点进行重放就完成了同步过程。
14.Pipeline有什么好处,为什么要用Pipeline?
可以将多次的IO往返时间缩减为一次,前提是pipeline执行的命令之间没有因果相关性。使用redis-benchmark进行压测的时候,可以发现影响redis的QPS峰值的一个重要因素是pipeline批次指令的数目。
15.Redis集群的原理是什么?
1.Redis Sentinal 着眼于高可用, 在master宕机时会自动将slave提升为master, 继续提供服务。
2.Redis Cluster 着眼于扩展性, 在单个Redis内存不足时, 使用Cluster进行分片存储。
16.Redis集群方案什么情况下会导致整个集群不可用?
有A, B, C三个节点的集群, 在没有复制节点的情况下,如果节点B失败了, 那么这个集群就会因缺少5501-11000这个范围的槽而不可用。
17.Redis支持的Java客户端都有哪些?官方推荐的是哪个?
Redisson、Jedis、lettuce 等等,官方推荐使用 Redisson。
18.Jedis和Redisson对比有什么优缺点?
Jedis是Redis的java实现的客户端, 其API提供了比较全面的Redis命令支持;Redisson实现了分布式和可扩展的Java数据结构,和Jedis相比, 功能较为简单,不支持字符串操作,不支持排序、事务、管道、分区等Redis特性。
Redisson 的宗旨是促进使用者对 Redis 的关注分离,从而让使用者能够将精力更集中地放在处理业务逻辑上。
19.Redis如何设置密码以及验证码?
设置密码: config set requirepass 123456
授权密码:auth 123456
20.说说Redis哈希槽的概念
Redis集群没有使用一致性hash,而是引用了hash槽的概念, Redis集群中有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽,几群的每个节点负责一部分hash槽。
21.Redis集群的主从复制模型是怎样的?
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用, 所以集群使用了主从复制模型,每个节点都会有N-1个复制品。
22.Redis集群会有写操作丢失吗?
Redis并不一定保证数据的强一致性, 这就意味着实际情况中集群在特定环境下可能会丢失写操作。
23.Redis集群之间是如何复制的?
主从复制。
24.Redis的最大节点个数是多少?
16384个。
25.Redis集群如何选择数据库?
Redis集群目前无法做数据库选择, 默认在0数据库。
26.如何测试Redis连通性?
使用ping命令。
27.怎么理解事务?
(1):事务是一个单独的隔离操作:事务中所有命令都会序列化、按照顺序地执行。事务在执行的过程中, 不会被其他客户端发来的命令请求所打断。
(2):事务是一个原子操作:事务中的命令要么全部执行,要么都不执行。
28.Redis事务相关的命令有哪几个?
MULTI、EXEC、DISCARD、WATCH
29.Redis key的过期时间和永久有效分别怎么设置?
EXPIRE 和 PERSIST命令
30.Redis 如何做内存优化?
尽可能地使用散列表(hashes), 散列表(是说散列表里面存储的数少)使用的内存非常小,所以应该尽可能的将数据抽象在一个散列表中,比如web系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面。、
31.Redis回收进程是如何工作的?
一个客户端运行了新的命令,添加了新数据,Redis检查内存使用状况,如果大于maxmemory的限制,则根据设定好的策略进行回收。一个新的命令被执行等等,我们不断达到边界然后不断地回收回到边界以下。如果一个命令的结果导致大量内存被使用(例如很大的信息保存到一个新的键中), 不用多久内存限值就会被这个内存使用量超越。
32.都有哪些办法可以降低redis内存使用的状况呢?
如果使用的是32位的Redis实例, 可以好好利用hash,list,sorted set, set等集合类型数据,因为通常情况下很多小的key-value可以用更紧凑的方式存放到一起。
33.Redis内存用完了会发生什么?
达到上限, Redis命令会返回错误信息(但是还是可以正常返回)或者你也可以将Redis当缓存来使用配置淘汰机制, 当Redis达到内存上限是会冲刷掉旧的内容。
34.一个Redis实例最多能存放多少的keys? list、set、sorted set最多能存放多少元素?
理论上Redis可以存放2的32次幂的keys, 并且在实际中进行了测试, 每个实例至少存放了2亿5千万的keys,测试一些较大的值, 任何list、set、sorted set 都可以放置这么多的元素, 换句话说, 存储极限是系统中可用的内存值。
35.MySQL黎明有2000w数据, Redis中只存20w数据, 如何保证Redis中的数据都是热点数据?
可以设置数据淘汰策略。
volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰
allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
no-enviction(驱逐):禁止驱逐数据
36.Redis最适合的场景?
1.会话缓存(Session Cache)
优势:提供持久化,用于维护一个不是严格要求一致性的场景, 比如存储用户的购物车信息。
2.全页缓存(FPC)
除了基本的会话token之外,Redis还提供了很简单的FPC平台,回到一致性问题, 即使重启了Redis实例,因为有磁盘的持久化,用户也不会看到页面即在速度的下降, 这是一个极大改进。
3.队列
其中的list和set可以使得redis能作为一个很好的消息队列平台来使用,其实用方式类似于python的list的insert以及pop的使用,如果你快速的在 Google中搜索“Redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用 Redis 创建非常好的后端工具,以满足各种队列需求。例如,Celery 有一个后台就是使用 Redis 作为 broker,你可以从这里去查看。
4.排行榜/计数器
Redis在内存中对数字进行递减或递增操作实现非常好。集合和有序集合也使得我们在执行这些操作变得非常简单。我们要从排序集合中获取到排名最靠前的 10个用户–我们称之为“user_scores”,我们只需要像下面一样执行即可: 当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行: ZRANGE user_scores 0 10 WITHSCORES Agora Games 就是一个很好的例子,用 Ruby 实现的,它的排行榜就是使用 Redis 来存储数据的,你可以在这里看到。
5.发布/订阅
最后(但肯定不是最不重要的)是 Redis 的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用 Redis 的发布/订阅功能来建立聊天系统
37.假如Redis里面有一亿个key,其中有10W个key是以某个固定的一致的前缀开头的,如何将它们全部找出来?
使用keys可以扫出指定模式的key列表
对方接着问:如果这个Redis正在给线上的业务提供服务,那使用keys指令会有什么问题?
这时记住redis的一个关键特征,单线程, keys指令会导致现场阻塞一段时间,线上服务会停顿,知道指令执行完毕,服务才能恢复,这是可以使用scan指令,可以无阻塞的取出指定的key列表, 但是会有一定的重复概率, 在客户端做一次去重就可以了,但是整体所花费的时间回避直接用keys指令长。
38.如果有大量的key需要设置统一时间过期, 一般需要注意什么?
过于集中的话, 在那个时间点,redis可能会出现短暂的卡顿现象,一般需要在时间上加一个随机值, 使得过期时间分散一些。
39.使用过redis做过异步队列么?怎么用的?
一般使用list结构作为队列, rpush生产消息, lpop消费消息,当没有消息的时候,要适当sleep一会再重试,如果追问可不可以不用sleep呢? list还有一个指令叫blpop, 在没有消息的时候,会阻塞住直到消息到来,追问能不能生产一次消费多次呢?使用pub/sub主题订阅者模式可以实现1:N的消息队列。
如果对方追问 pub/sub 有什么缺点?
在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列如 RabbitMQ等。
如果对方追问 redis 如何实现延时队列?
我估计现在你很想把面试官一棒打死如果你手上有一根棒球棍的话,怎么问的这么详细。但是你很克制,然后神态自若的回答道:使用 sortedset,拿时间戳作为score,消息内容作为 key 调用 zadd 来生产消息,消费者用 zrangebyscore 指令获取 N 秒之前的数据轮询进行处理。到这里,面试官暗地里已经对你竖起了大拇指。但是他不知道的是此刻你却竖起了中指,在椅子背后。
40.使用过Redis分布式锁么,它是怎么回事?
先拿setnx来争抢锁,抢到之后, 再用expire给锁加一个过期时间来防止锁忘记了释放。接着问 在setnx之后执行expire之前进程意外crash了后者要重新维护了,怎么办? 可以故作挠头不知所措, 过一会回答道: 我记得set指令有非常复杂的参数, 这个应该是可以将sernx和expire合成一条指令来用的。对方估计此时心里都乐开花了,嗯,这个小子不错, 招来太值了。
更多面试题可关注我维护的关注号:
回复面试题即可看到你想要的/坏笑.