facebook的scribe。
apache的chukwa。
linkedin的kafka。
cloudera的flume.
scribe主页:https://github.com/facebook/scribe
chukwa主页:http://incubator.apache.org/chukwa/
kafka主页:http://sna-projects.com/kafka/
scribe chukwa kafka flume
公司 facebook apache/yahoo LinkedIn Cloudera
开源时间 2008年10月 2009年11月 2010年12月 2009年7月
实现语言 c/c++ JAVA SCALA JAVA
框架 push/push push/push push/pull push/push
容错性 collector和store之间 Agent定期记录 Agent可以通过 Agent和collector
有容错机制,而agent和 已送给collector的 collector自动识别 ,collector和store
collector之间的容错需用 数据偏移量,一旦 机制获取可用collector。 之间均有容错机制
户自己是实现。 出现故障,可根据 storm自己保存已经 ,且提供了三种级
偏移量继续发送数据。 获取数据的偏移量,一旦 别的可靠性保证。
collector出现故障,可以
根据偏移量继续获取数据。
负载均衡 无 无 使用zookeeper 使用zookeeper
可扩展性 好 好 好 好
agent Thrift client,需 自带一些agent,如获 用户需根据kafka提供 提供了各种非
自己实现。 取hadoop logs的agent。 的low-level和high-level 长丰富的
API自己实现。 agent。
collector 实际上是一个thrift -- 使用了sendfile, 系统提供了
server。 zero-copy等技术提高性能。 很多,可直接
使用。
store 直接支持HDFS 直接支持HDFS 直接支持HDFS 直接支持HDFS
总体评价 易于使用,容错和 属于hadoop系列 设计架构(push/pull) 非常优秀。
负载均衡方面不够好, 产品,直接支持 非常巧妙,适合异构集群
且资料较少。 Hadoop,目前 ,但产品较新,且稳定性
版本升级比较快, 有待验证。
但还有待完善。
flume缺点:一种分流方式失败导致日志重复发送。日志的分流配置以及归档配置使用外部管理的方式,从而使系统的运维更方便。
摘自:http://backend.blog.163.com/blog/static/2022941262012525104047160/