• Kafka简介


    布 & 订阅                        理                     

    数据流,如消息传递系统               高效并实时                   数据流安全地在分布式集群中复制存储


    kafka


    kafka是用于构建实时数据管道和流应用程序。具有横向扩展,容错,wicked fast(变态快)等优点,并已在成千上万家公司运行。

    简单说明什么是kafka

    Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息中间件,只是粗略的讲解,目前kafka已经可以做更多的事情。

    举个例子,生产者消费者,生产者生产鸡蛋,消费者消费鸡蛋,生产者生产一个鸡蛋,消费者就消费一个鸡蛋,假设消费者消费鸡蛋的时候噎住了(系统宕机了),生产者还在生产鸡蛋,那新生产的鸡蛋就丢失了。再比如生产者很强劲(大交易量的情况),生产者1秒钟生产100个鸡蛋,消费者1秒钟只能吃50个鸡蛋,那要不了一会,消费者就吃不消了(消息堵塞,最终导致系统超时),消费者拒绝再吃了,”鸡蛋“又丢失了,这个时候我们放个篮子在它们中间,生产出来的鸡蛋都放到篮子里,消费者去篮子里拿鸡蛋,这样鸡蛋就不会丢失了,都在篮子里,而这个篮子就是”kafka“。
    鸡蛋其实就是“数据流”,系统之间的交互都是通过“数据流”来传输的(就是tcp、https什么的),也称为报文,也叫“消息”。
    消息队列满了,其实就是篮子满了,”鸡蛋“ 放不下了,那赶紧多放几个篮子,其实就是kafka的扩容。
    各位现在知道kafka是干什么的了吧,它就是那个"篮子"。

    kafka名词解释

    后面大家会看到一些关于kafka的名词,比如topic、producer、consumer、broker,我这边来简单说明一下。

    • producer:生产者,就是它来生产“鸡蛋”的。
    • consumer:消费者,生出的“鸡蛋”它来消费。
    • topic:你把它理解为标签,生产者每生产出来一个鸡蛋就贴上一个标签(topic),消费者可不是谁生产的“鸡蛋”都吃的,这样不同的生产者生产出来的“鸡蛋”,消费者就可以选择性的“吃”了。
    • broker:就是篮子了。

    大家一定要学会抽象的去思考,上面只是属于业务的角度,如果从技术角度,topic标签实际就是队列,生产者把所有“鸡蛋(消息)”都放到对应的队列里了,消费者到指定的队列里取。

    怎么样才算真正的学会kafka

    最近面试发现,很多人用过kafka,但是没人了解原理,我们可是很注重原理的(PS:要不然怎么知道你真的会呢)。

    • kafka节点之间如何复制备份的?
    • kafka消息是否会丢失?为什么?
    • kafka最合理的配置是什么?
    • kafka的leader选举机制是什么?
    • kafka对硬件的配置有什么要求?
    • kafka的消息保证有几种方式?
    • kafka为什么会丢消息?

    ......你是否都答得上来?(欢迎大家补充!)

    这些问题在下面的文章中都可以找到答案,kafka之所以有这么火热,建议各位一定要看一下。

    如何学习kafka

    还是那句话,学习任何技术,跟学骑自行车一样,不要一开始只关注它的具体细节是什么。先学着怎么骑,骑着骑着就了解大致的原理,这个时候在去看它的原理,会很轻松。

    如果你在学习的过程中遇到什么问题,直接评论或者在问题专区中提问。

    章节与kafka官网对应一致

    第一章:开始
    第二章:API
    第三章:kafka的配置
    第四章:kafka如何设计的
    第五章:kafka的实现
    第六章:kafka的常用操作,如扩容,删除和增加topic。
    第七章:硬件和操作系统
    第八章:kafka监控
    第九章:安全
    第十章:kafka Connect
    第十一章:kafka 流
    第十二章:源码
    第十三章:笔记(kafka命令大全

    转自https://www.orchome.com/kafka/index

  • 相关阅读:
    卷积神经网络中的傅里叶变换:1024x1024 的傅里叶卷积
    在不平衡数据上使用AUPRC替代ROCAUC
    论文推荐:TResNet改进ResNet 实现高性能 GPU 专用架构并且效果优于 EfficientNet
    信息安全风险评估
    剑指 Offer
    Docker创建容器时默认的共享内存shm太小报错,程序无法正常运行
    VS Code 连接访问本地主机上的Docker容器
    关于protobuf报错:If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.
    训练神经网络时报错:can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.
    我学习使用五笔的经验
  • 原文地址:https://www.cnblogs.com/maji233/p/11146714.html
Copyright © 2020-2023  润新知