一. Titan优势
-
Titan
(1)支持很大的图,集群中机器越大,图越大
(2)支持很大的并发事务,并发图形处理。大图的复杂查询在毫秒级响应
(3)用hadoop进行图形分析和批量图形处理
(4)用TinkerPop完成图形数据模型
(5)Gremlin作为图形遍历sql
(6)解决super node问题(给顶点的关联边添加kv参数) -
Titan with Cassandra与Titan with Hbase
(1)hadoop + 强一致性
【系统中的某个数据被成功更新后,后续任何对该数据的读取操作都将得到更新后的值。分布式系统需要花时间在节点数据更新复制上,严格一致性不存在,要尽量减小节点间数据的复制时间】
(2)CAP原则:在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可得兼
( a ) 一致性:所有数据备份,在同一时间有相同的值
( b ) 可用性:集群中一部分节点出故障后,是否还响应客户端的读写请求
( c ) 分区容错性:如果分布式系统在一短时间内不能达到一致性,就说明节点间发生了分区现象,要从等待一致性和响应请求的可用性上作出权衡
(3)hbase会停止响应,cassandra在非一致的情况下返回数据
二. Titan架构
- OLTP :
(1)实时性,带有事务的数据量小的存取操作 (RDBMS)
(2)Cassandra,HBase,BerkeleyDB - OLAP :
(1)实时性低的,数据量大的分析操作 (数据仓库)
(2)Spark,Hadoop,Giraph