• Redis学习之Redis概述及原理、基本操作及持久化


     一、Redis介绍

      Redis是一个开源的使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

      它通常被称为数据结构服务器,因为值(value)可以是 字符串(String), 哈希(Map), 列表(list), 集合(sets) 和 有序集合(sorted sets)等类型。可以满足很多应用场景。还提供了键过期,发布订阅,事务,流水线等附加功能。

      Github源码:https://github.com/antirez/redis

      Redis官网:https://redis.io/

    二、Redis使用场景

      存储缓存、投票、会话session、排行榜、计数器、发布订阅、消息队列等,其中最主要的使用场景就是存储缓存和会话Session。

      当用作存储缓存的时候,如下图所示:

              

      第一次访问的时候Redis数据库没有数据,因此先从MySQL中查询,然后再存到Redis内存数据库;第二次访问的时候直接就可以从Redis数据库中得到数据。

      当Redis用作缓存会话Session时。如下图所示:

                  

       所有应用都是对Redis进行访问,这样分布式的应用程序共享一份会话Session。

    三、快速安装

      Redis3.0以前》不支持集群》基于客户端实现

      Redis3.0以后》集群(Redis Cluster)》基于服务端实现
      Redis的安装很简单,如下所示:

    $ wget http://download.redis.io/releases/redis-5.0.5.tar.gz
    $ tar xzf redis-5.0.5.tar.gz
    $ cd redis-5.0.5
    $ make

      关于安装的详细步骤可以参考(Mac版本,Linux上的安装步骤一致):Mac下安装Redis及Redis Desktop Manager

      其余多种模式的部署请参考:Redis学习之4种模式实践及机制解析(单机、主从、哨兵、集群)

      Redis安装目录下常见文件如下:

                

    四、通讯原理概述

      Redis的速度是很快的,基于以下原因:

    • Redis是单进程单线程运行,因此不存在线程切换造成的资源浪费(但是也是缺点,如果命令执行缓慢就会造成阻塞);
    • Redis数据是是安装在硬盘上,但是运行数据是在内存中,访问速度远大于硬盘,避免大量IO。
    • Redis 服务器是基于高效的IO多路复用,效率高。 

      Redis 服务器是一个事件驱动程序, 服务器处理的事件分为时间事件和文件事件两类。

    • 文件事件:Redis主进程中,主要处理客户端的连接请求与相应。
    • 时间事件:fork出的子进程中,处理如AOF持久化任务等。

      由于Redis的文件事件是单进程,单线程模型,但是确保持着优秀的吞吐量,IO多路复用起到了主要作用。简单解释多路复用就是一个线程监听多个套接字,谁先有读写事件就处理谁,减少线程切换开销和IO阻塞,以提高CPU利用率。

      Redis访问过程如下:

            

      I/O多路复用展示:

          

       上面提过,Redis是基于I/O多路复用,然后用C实现的。当接收到请求后,也说过Redis服务器是个事件驱动程序,然后Redis的文件事件分派器就会一直轮询,C源码就是方法aeMain()方法内部一直轮询,然后调用aeProcessEvents(),这个方法就是去调用事件处理器,适配具体的handler(连接应答处理器、命令请求处理器),在适配handler过程中会调用acApiPoll()方法进行系统的适配(Windows、Linux等),然后Linux中调用的是ae_epoll.c文件,也就是这样的过程基于事件实现IO多路复用,效率是很高的。

    五、Redis日常操作

      Redis有五种数据类型,为:字符串(String), 哈希(Map), 列表(list), 集合(sets) 和 有序集合(sorted sets)。关于五种数据类型以及作用请参考:Redis学习之5种数据类型操作、实现原理及应用场景

      五种数据常见操作如下:

      1、字符串

      字符串类型:实际上可以是字符串(包括XML JSON),还有数字(整形 浮点数),二进制(图片 音频 视频),最大不能超过512MB。

    设值命令:
    set key value
    set name monkey ex 20  //20秒后过期 px 20000 毫秒过期
    setnx name monkey  //不存在键name时,返回1设置成功;存在的话失败0
    set age 18 xx  //存在键age时,返回1成功
    
    批量设值:mset name monkey sex boy
    批量获取:mget name sex (
    )
    
    append追加指令:
    set name hello; 
    append name world //追加后成helloworld
    
    字符串长度:
    set monkey '真帅'
    strlen monkey//结果6,每个中文占3个字节(utf-8)
    
    截取字符串:
    set name monkey;
    getrange name 2 4//返回“nke”
    
    计数器:
    CAS(Atomic原子操作)
    incr age //必须为整数自加1,非整数返回错误,无age键从0自增返回1
    decr age //整数age减1
    incrby age 1 //整数age+1
    decrby age 1//整数age -1
    incrbyfloat score 3.3 //浮点型score+3.3
    // 分布式高并发中,可以解决线程安全问题,例如生成唯一号码(订单号)

      2、Hash类型

      哈希hash是一个string类型的field和value的映射表,hash特适合用于存储对象,如:

            

    命令 hset key field value
    设值:hset user:1 name monkey   //成功返回1,失败返回0
    取值:hget user:1 name   //返回monkey
    删值:hdel user:1 age   //返回删除的个数
    计算个数:hset user:1 name monkey; hset user:1 age 18; 
      hlen user:1   //返回2,user:1有两个属性值
    批量设值:hmset user:2 name monkey age 18sex boy   //返回OK
    批量取值:hmget user:2 name age sex   //返回三行:monkey 18 boy
    判断field是否存在:hexists user:2 name   //若存在返回1,不存在返回0
    获取所有field: hkeys user:2   // 返回name age sex三个field
    获取user:2所有value:hvals user:2   // 返回monkey18 boy
    获取user:2所有field与value:hgetall user:2   //name age sex monkey18 18 boy值
    增加1:hincrby user:2 age 1   //age+1
    浮点增加:hincrbyfloat user:2 age 2   //浮点型加2

      3、List集合

      用来存储多个有序的字符串,一个列表最多可存2的32次方减1个元素。

    添加命令:
    rpush monkey c b a   //从右向左插入cba, 返回值3
    lrange monkey 0 -1   //从左到右获取列表所有元素 返回 c b a
    lpush key c b a   //从左向右插入cba
    linsert monkey before b z  //在b之前插入z, after为之后,使 用lrange monkey 0 -1 查看:c z b a
    
    查找命令: lrange key start end   //索引下标特点:从左到右为0到N-1 lindex monkey -1   //返回最右末尾a,-2返回b llen monkey   //返回当前列表长度 lpop monkey   //把最左边的第一个元素c删除 rpop monkey   //把最右边的元素a删除

      4、Set集合

      常用于用户标签,社交,查询有共同兴趣爱好的人,智能推荐。保存多元素,与列表不一样的是不允许有重复元素,且集合是无序,一个集合最多可存2的32次方减1个元素,除了支持增删改查,还支持集合交集、并集、差集;

    exists user   //检查user键值是否存在
    sadd user a b c  //向user插入3个元素,返回3
    sadd user a b   //若再加入相同的元素,则重复无效,返回0
    smembers user   //获取user的所有元素,返回结果无序
    srem user a   //返回1,删除a元素
    scard user   //返回2,计算元素个数

      5、有序集合ZSET

      常用于排行榜,如视频网站需要对用户上传视频做排行榜,或点赞数与集合有联系,不能有重复的成员

    指令: 
    zadd key score member [score member......]
    例子:
    zadd user:zan 200 monkey   //monkey的点赞数1, 返回操作成功的条数1
    zadd user:zan 200 monkey 120 fox 100 lion  // 返回3
    zadd user:zan nx 100 monkey  //键test:1必须不存在,主用于添加
    zadd user:zan xx incr 200 monkey  //键test:1必须存在,主用于修改,此时为300
    zadd user:zan xx ch incr -299 monkey  //返回操作结果1,300-299=1
    zrange user:zan 0 -1 withscores  //查看点赞(分数)与成员名
    zcard user:zan   //计算成员个数, 返回1
    
    排名场景:
    zadd user:3 200 monkey120 fox 100 lee  //先插入数据
    zrange user:3 0 -1 withscores   //查看分数与成员
    zrank user:3 monkey  //返回名次:第3名返回2,从0开始到2,共3名
    zrevrank user:3 monkey  //返回0, 反排序,点赞数越高,排名越前

      6、Redis全局命令

    查看所有键:
    keys *
    
    键总数 :
    dbsize   //2个键,如果存在大量键,线上禁止使用此指令
    
    检查键是否存在:
    exists key   //存在返回1,不存在返回0
    
    删除键:
    del key   //del key, 返回删除键个数,删除不存在键返回0
    
    键过期:
    expire key seconds   //set name test expire name 10,表示10秒过期
    ttl key   // 查看剩余的过期时间
    
    键的数据结构类型:
    type key   //type hello //返回string,键不存在返回none

      7、redis数据库管理

    select 0   //数据库 16个数据库(0-15) 默认都是0库
    flushdb   //清除当前数据库
    flushall  //清楚所有数据库记录
    dbsize  //命令用于返回当前数据库的 key 的数量

    六、Redis持久化

      持久化作用:redis是一个支持持久化的内存数据库,也就是说redis需要经常将内存中的数据同步到磁盘来保证持久化,持久化可以避免因进程退出而造成数据丢失。Redis持久化有两种方式:RDB快照和AOF方式。

      1、RDB

      RDB持久化把当前进程数据生成快照(.rdb)文件保存到硬盘的过程,有手动触发和自动触发手动触发有save和bgsave两命令:

    • save命令:阻塞当前Redis,直到RDB持久化过程完成为止,若内存实例比较大会造成长时间阻塞,线上环境不建议用它
    • bgsave命令:redis进程执行fork操作创建子线程,由子线程完成持久化,阻塞时间很短(微秒级),是save的优化,在执行redis-cli shutdown关闭redis服务时,如果没有开启AOF持久化,自动执行bgsave;

      1.1、Save命令

      由于 save 命令是同步命令,会占用Redis的主进程。若Redis数据非常多时,save命令执行速度会非常慢,阻塞所有客户端的请求。

      因此很少在生产环境直接使用SAVE 命令,可以使用BGSAVE 命令代替。如果在BGSAVE命令的保存数据的子进程发生错误的时,用 SAVE命令保存最新的数据是最后的手段。如图所示:

                 

      1.2、Bgsave命令

      bgsave 命令执行一个异步操作,以RDB文件的方式保存所有数据的快照。如:

    127.0.0.1:6379> bgsave Background saving started

      如图所示:

                

      1.3、save 与 bgsave 对比

              

      操作:

    命令:config set dir /usr/local   //设置rdb文件保存路径
    备份:bgsave   //将dump.rdb保存到usr/local下
    恢复:将dump.rdb放到redis安装目录与redis.conf同级目录,重启redis即可

      1.4、RDB优缺点

      RDB优点:

    • 压缩后的二进制文,适用于备份、全量复制,用于灾难恢复加载RDB恢复数据远快于AOF方式
    • 与AOF相比,在恢复大的数据集的时候,RDB方式会更快一些。
    • 使用bgsave保存,交由子进程进行快照保存,父进程不需要再做其他IO操作,所以RDB持久化方式可以最大化redis的性能。

      RDB缺点:

    • 无法做到实时持久化,每次都要创建子进程,频繁操作成本过高
    • 保存后的二进制文件,存在老版本不兼容新版本rdb文件的问题

      2、AOF

      快照功能(RDB)并不是非常耐久(durable): 如果 Redis 因为某些原因而造成故障停机, 那么服务器将丢失最近写入、且仍未保存到快照中的那些数据。 从 1.1 版本开始, Redis 增加了一种完全耐久的持久化方式: AOF 持久化。
      打开AOF后, 每当 Redis 执行一个改变数据集的命令时(比如 SET), 这个命令就会被追加到 AOF 文件的末尾。这样的话, 当 Redis 重新启时, 程序就可以通过重新执行 AOF 文件中的命令来达到重建数据集的目的。

              

    操作: 
    开启:redis.conf设置:appendonly yes (默认不开启,为no)
    默认文件名:appendfilename "appendonly.aof"

      三种策略always、everysec、no对比

    • always: 不丢失数据 IO开销大,一般SATA磁盘只有几百TPS 每次有新命令追加到 AOF 文件时就执行一次 fsync :非常慢,也非常安全。
    • everysec 每秒进行与fsync:最多丢失1秒数据 可能丢失1秒数据 每秒 fsync 一次:足够快(和使用 RDB 持久化差不多),并且在故障时只会丢失 1 秒钟的数据。推荐(并且也是默认)的措施为每秒 fsync 一次, 这种 fsync 策略可以兼顾速度和安全性。
    • no 不用管 不可控 从不 fsync :将数据交给操作系统来处理,由操作系统来决定什么时候同步数据。更快,也更不安全的选择。

             

      AOF的优点:

    • 使用AOF 会让你的Redis更加耐久: 你可以使用不同的fsync策略:无fsync,每秒fsync,每次写的时候fsync。使用默认的每秒fsync策略,Redis的性能依然很好(fsync是由后台线程进行处理的,主线程会尽力处理客户端请求),一旦出现故障,你最多丢失1秒的数据。
    • AOF文件是一个只进行追加的日志文件,即使由于某些原因(磁盘空间已满,写的过程中宕机等等)未执行完整的写入命令,你也也可使用redis-check-aof工具修复这些问题。
    • Redis 可以在 AOF 文件体积变得过大时,自动地在后台对 AOF 进行重写: 重写后的新 AOF 文件包含了恢复当前数据集所需的最小命令集合。 整个重写操作是绝对安全的,因为 Redis 在创建新 AOF 文件的过程中,会继续将命令追加到现有的 AOF 文件里面,即使重写过程中发生停机,现有的 AOF 文件也不会丢失。 而一旦新 AOF 文件创建完毕,Redis 就会从旧 AOF 文件切换到新 AOF 文件,并开始对新 AOF 文件进行追加操作。
    • AOF 文件有序地保存了对数据库执行的所有写入操作, 这些写入操作以 Redis 协议的格式保存, 因此 AOF 文件的内容非常容易被人读懂, 对文件进行分析(parse)也很轻松。 导出(export) AOF 文件也非常简单: 举个例子, 如果你不小心执行了 FLUSHALL 命令, 但只要 AOF 文件未被重写, 那么只要停止服务器, 移除 AOF 文件末尾的 FLUSHALL 命令, 并重启 Redis , 就可以将数据集恢复到 FLUSHALL 执行之前的状态。

      AOF的缺点:

    • 对于相同的数据集来说,AOF 文件的体积通常要大于 RDB 文件的体积。
    • 根据所使用的 fsync 策略,AOF 的速度可能会慢于 RDB 。 在一般情况下, 每秒 fsync 的性能依然非常高, 而关闭 fsync 可以让 AOF 的速度和 RDB 一样快, 即使在高负荷之下也是如此。 不过在处理巨大的写入载入时,RDB 可以提供更有保证的最大延迟时间(latency)

      3、RDB 和 AOF 对比

              

  • 相关阅读:
    【leetcode】9 longest common prefix
    4月份需要整理的问题总结
    JavaScript DOM 编程艺术(第2版)---P1~P9
    JavaScript DOM 编程艺术(第2版)---序中故
    18年3月周末问题汇总
    三目运算+传参+封装的运用实例
    git学习参考博客
    jq实现类名(class)的增删改查
    ztree树集使用(2)
    word2010在正常关闭的情况下,点了“不保存”,如何恢复
  • 原文地址:https://www.cnblogs.com/jing99/p/12635389.html
Copyright © 2020-2023  润新知