一、Redis介绍
1.1Redis优点
(1)Redis拥有非常丰富的数据结构:
(2)Redis提供事务的功能,可以保证一串命令的原子性,中间不会被任何打断。
(3)数据存储在内存中,读写非常的高速,可以达到10W/s的频率。
1.2Redis缺点
(1)Redis 3.0才出现官方的集群方案,但仍存在一些架构上的问题。
(2)持久化功能体验不佳:Redis 提供了RDB和AOF两种持久化机制:RDB将数据库的快照(snapshot)以二进制的方式保存到磁盘中,需要每个一段时间将数据写到磁盘上,代价非常高;AOF则以协议文本的方式,将所有对数据库进行过写入的命令(及其参数)记录到AOF文件中,以此达到记录数据库状态的目的。而aof方法只能追踪变化的数据,类似于mysql的binlog方法,但追加的log可能过大,同事所有操作需要重新执行一遍,恢复速度较慢。
(3)由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key的过期策略,但是还是很需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。
1.3Redis适用场景
(1)会话缓存:目前最常见的Redis使用场景是会话缓存,使用Redis来作为会话缓存,而不使用类似Memcached的其他会话缓存,是因为Redis提供持久化。当维护并不要求严格一致性记录的缓存时,用户们并不希望看到购物车信息不见了。
(2)全页缓存:除了基本的会话token,Redis 提供了一个非常容易操作的FPC平台。回到一致性的问题,即使重启了Redis实例,由于磁盘持久化的原因,用户并不会看到加载页面时速度明显的下降。
(3)队列:Redis内存存储引擎可以进行list和set操作,这使它可以作为一个很好的消息队列平台来使用,对Redis进行队列操作,就像本地使用Python对lists进行push和pop操作。
(4)排行榜/计数器:Redis在内存中对数字的递增和递减操作实现的非常好,(Set)集合和(Sorted Set)有序集合让我们在进行这种操作时更加容易,Redis只是正好提供了这两种数据结果。所以在进行类似在有序集合中查找前十个用户这种操作,我们只需要一行代码
ZRANGE user_scores 0 10
(5)订阅/发布功能:Redis的订阅发布功能。使用Redis订阅发布功能的案例非常普遍,甚至有人用它来搭建社交网络连接,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统。
二、MONGDB介绍
2.1MONGDB优点
(1). 强大的自动化 shading 功能;
(2). 全索引支持,查询非常高效;
(3). 面向文档(BSON)存储,数据模式简单而强大。
(4). 支持动态查询,查询指令也使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
(5). 支持 javascript 表达式查询,可在服务器端执行任意的 javascript函数。
2.2MONGDB缺点
(1). 单个文档大小限制为16M,32位系统上,不支持大于2.5G的数据;
(2). 对内存要求比较大,至少要保证热数据(索引,数据及系统其它开销)都能装进内存;
(3). 非事务机制,无法保证事件的原子性。
2.2MONGDB适用场景
(1). 适用于实时的插入、更新与查询的需求,并具备应用程序实时数据存储所需的复制及高度伸缩性;
(2). 非常适合文档化格式的存储及查询;
(3). 高伸缩性的场景:MongoDB 非常适合由数十或者数百台服务器组成的数据库。
(4). 对性能的关注超过对功能的要求。
三、Hbase介绍
HBase 是 Apache Hadoop 中的一个子项目,属于 bigtable 的开源版本,所实现的语言为Java。HBase 依托于 Hadoop 的 HDFS作为最基本存储基础单元。
3.1Hbase优点
(1). 存储容量大,一个表可以容纳上亿行,上百万列;
(2). 可通过版本进行检索,能搜到所需的历史版本数据;
(3). 负载高时,可通过简单的添加机器来实现水平切分扩展,跟Hadoop的无缝集成保障了其数据可靠性(HDFS)和海量数据分析的高性能(MapReduce);
(4). 在第3点的基础上可有效避免单点故障的发生。
3.2Hbase缺点
(1). 基于Java语言实现及Hadoop架构意味着其API更适用于Java项目;
(2). node开发环境下所需依赖项较多、配置麻烦(或不知如何配置,如持久化配置),缺乏文档;
(3). 占用内存很大,且鉴于建立在为批量分析而优化的HDFS上,导致读取性能不高;
(4). API相比其它 NoSql 的相对笨拙。
3.3Hbase适用场景
(1). bigtable类型的数据存储;
(2). 对数据有版本查询需求;
(3). 应对超大数据量要求扩展简单的需求。
四、Cassandra介绍
Cassandra 是一个来自 Apache 的分布式数据库,具有高度可扩展性,可用于管理大量的结构化数据。它提供了高可用性,没有单点故障。
4.1Cassandra优点
(1)弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。
(2)始终基于架构 - Cassandra没有单点故障,它可以连续用于不能承担故障的关键业务应用程序。
(3)快速线性性能 - Cassandra是线性可扩展性的,即它为你增加集群中的节点数量增加你的吞吐量。因此,保持一个快速的响应时间。
(4)灵活的数据存储 - Cassandra适应所有可能的数据格式,包括:结构化,半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。
(5)便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据,可以灵活地在需要时分发数据。
(6)事务支持 - Cassandra支持属性,如原子性,一致性,隔离和持久性(ACID)。
(7)快速写入 - Cassandra被设计为在廉价的商品硬件上运行。 它执行快速写入,并可以存储数百TB的数据,而不牺牲读取效率。
4.2Cassandra缺点
参考链接:
(1)https://www.objectrocket.com/blog/how-to/top-5-redis-use-cases
(2)https://redis.io/documentation
(3)http://redisbook.readthedocs.io/en/latest/internal/aof.html#id
(4)https://www.w3cschool.cn/cassandra/
(5)http://www.dataguru.cn/thread-189148-1-1.html