• 目前可选的开源日志收集项目


    facebook的scribe。

    apache的chukwa。

    linkedin的kafka。

    cloudera的flume.

    scribe主页:https://github.com/facebook/scribe

    chukwa主页:http://incubator.apache.org/chukwa/

    kafka主页:http://sna-projects.com/kafka/

                             scribe                              chukwa                              kafka                  flume

    公司                    facebook                         apache/yahoo                   LinkedIn               Cloudera

    开源时间              2008年10月                     2009年11月                    2010年12月            2009年7月

    实现语言              c/c++                             JAVA                                 SCALA                 JAVA

    框架                    push/push                       push/push                      push/pull                push/push

    容错性             collector和store之间               Agent定期记录                 Agent可以通过          Agent和collector

                          有容错机制,而agent和           已送给collector的              collector自动识别      ,collector和store

                          collector之间的容错需用          数据偏移量,一旦              机制获取可用collector。 之间均有容错机制

            户自己是实现。                     出现故障,可根据              storm自己保存已经       ,且提供了三种级

                                                                   偏移量继续发送数据。        获取数据的偏移量,一旦  别的可靠性保证。

                                                                                                       collector出现故障,可以

                                                                                                       根据偏移量继续获取数据。

    负载均衡              无                                        无                                使用zookeeper             使用zookeeper

    可扩展性              好                                        好                                   好                             好

    agent             Thrift client,需                      自带一些agent,如获         用户需根据kafka提供          提供了各种非

                         自己实现。                               取hadoop logs的agent。   的low-level和high-level     长丰富的

                                                                                                           API自己实现。                 agent。

    collector         实际上是一个thrift                     --                                   使用了sendfile,              系统提供了

                        server。                                                                        zero-copy等技术提高性能。 很多,可直接

                                                                                                                                                 使用。

    store              直接支持HDFS                         直接支持HDFS                    直接支持HDFS             直接支持HDFS

    总体评价         易于使用,容错和                       属于hadoop系列                 设计架构(push/pull)    非常优秀。

                        负载均衡方面不够好,                  产品,直接支持                   非常巧妙,适合异构集群

                        且资料较少。                             Hadoop,目前                    ,但产品较新,且稳定性

                                                                      版本升级比较快,                有待验证。

                                                                      但还有待完善。

    flume缺点:一种分流方式失败导致日志重复发送。日志的分流配置以及归档配置使用外部管理的方式,从而使系统的运维更方便。

    摘自:http://backend.blog.163.com/blog/static/2022941262012525104047160/

  • 相关阅读:
    FORM内置系统变量
    linux简单命常用令
    详解EBS接口开发之库存事务处理-物料批次导入
    TRIZ系列-创新原理-5-合并原理
    《Master Opencv...读书笔记》非刚性人脸跟踪 IV (终)
    Echarts折线图
    Redis命令学习-SortedSet(有序集合)
    tky项目第③个半月总结
    Torrent 文件图文解析
    ofbiz SSO 单点登录
  • 原文地址:https://www.cnblogs.com/man-li/p/4359974.html
Copyright © 2020-2023  润新知