• Storm学习笔记


    Storm学习笔记 - 消息容错机制

    文章来自「随笔」 http://jsynk.cn/blog/articles/153.html

    1. Storm消息容错机制概念

    • 一个提供了可靠的处理机制的spout需要记录自己emit(发射)的tuple(消息元祖),当下游bolt处理tuple或者子tuple失败时spout能够重新发射。
    • Storm通过调用Spout的nextTuple()发送一个tuple。为实现可靠的消息处理,首先要给每个发出的tuple带上唯一的ID,并且将ID作为参数传递给SoputOutputCollector的emit()方法:collector.emit(new Values("value1","value2"), msgId);
    • 无论处理成功还是失败,spout都要接收tuple树上所有节点返回的通知。如果处理成功,spout的ack()方法将会对编号是msgId的消息应答确认;如果处理失败或者超时,会调用fail()方法。

    2. 基本实现

    • Storm 系统中有一组叫做"acker"的特殊任务,它们负责跟踪DAG(有向无环图)中的每个消息。
    • acker任务保存了spout id到一对值的映射。第一个值就是spout的任务id,通过这个id,acker就知道消息处理完成时该通知哪个spout任务。第二个值是一个64bit的数字,我们称之为"ack val", 它是树中所有消息的随机id的异或计算结果。
    • ack val表示了整棵树的的状态,无论这棵树多大,只需要这个固定大小的数字就可以跟踪整棵树。当消息被创建和被应答的时候都会有相同的消息id发送过来做异或。 每当acker发现一棵树的ack val值为0的时候,它就知道这棵树已经被完全处理了

    3. 案例

    • 看一个简单的示例:spout或bolt处理完tuple后都会生成一个值(示例只使用8位),同一个ROOTID的值都会做异或,如果最终结果是0则处理过程没有出错。
      案例01

    案例02

    案例03

    案例04

  • 相关阅读:
    zabbix监控日志文件
    memached实现tomcat的session共享
    Ansible基础配置与常用模块使用
    ELK之topbeat部署
    ELK之nginx日志分析图表创建
    ELK安装配置及nginx日志分析
    awk将普通文本转换成json文件
    日常工作中使用的一些Mongodb语句
    zabbix监控zookeeper
    zabbix监控mysql
  • 原文地址:https://www.cnblogs.com/intflag/p/9870612.html
Copyright © 2020-2023  润新知