kafka auto.offset.reset参数解析

1.latest和earliest区别
2.创建topic
3.生产数据和接收生产数据
4.测试代码

auto.offset.reset关乎kafka数据的读取。常用的二个值是latest和earliest，默认是latest。

如果kafka只接收数据，从来没来消费过，程序一开始不要用latest，不然以前的数据就接收不到了。应当先earliest，然后二都都可以。

earliest
当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费
latest
当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据
none
topic各分区都存在已提交的offset时，从offset后开始消费；只要有一个分区不存在已提交的offset，则抛出异常

1.latest和earliest区别

earliest 当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费
latest 当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据

提交过offset，latest和earliest没有区别，但是在没有提交offset情况下，用latest直接会导致无法读取旧数据。

2.创建topic

# bin/kafka-topics.sh --create --zookeeper bigserver1:2181,bigserver2:2181,testing:2181 --replication-factor 2 --partitions 3 --topic tank  
Created topic "tank".  
  
# bin/kafka-topics.sh --describe --zookeeper bigserver1:2181,bigserver2:2181,testing:2181 --topic tank  
Topic:tank PartitionCount:3 ReplicationFactor:2 Configs:  
 Topic: tank Partition: 0 Leader: 0 Replicas: 0,2 Isr: 0,2  
 Topic: tank Partition: 1 Leader: 1 Replicas: 1,0 Isr: 1,0  
 Topic: tank Partition: 2 Leader: 2 Replicas: 2,1 Isr: 2,1

3.生产数据和接收生产数据

[root@bigserver1 kafka]# bin/kafka-console-producer.sh --broker-list bigserver1:9092,bigserver2:9092,testing:9092 --topic tank  
>1  
>2  
>3  
。。。。。。。。。省略。。。。。。。。。  
[root@bigserver1 kafka]# bin/kafka-console-consumer.sh --bootstrap-server bigserver1:9092,bigserver2:9092,testing:9092 --topic tank --from-beginning  
1  
2  
3

4.测试代码

object tank {  
    def main(args: Array[String]): Unit = {  
        val pros: Properties = new Properties  
        pros.put("bootstrap.servers", "bigserver1:9092,bigserver2:9092,testing:9092")  
        /*分组由消费者决定,完全自定义,没有要求*/  
        pros.put("group.id", "tank")  
        //设置为true 表示offset自动托管到kafka内部的一个特定名称为__consumer_offsets的topic  
        pros.put("enable.auto.commit", "false")  
        pros.put("auto.commit.interval.ms", "1000")  
        pros.put("max.poll.records", "5")  
        pros.put("session.timeout.ms", "30000")  
        //只有当offset不存在的时候，才用latest或者earliest  
        pros.put("auto.offset.reset", "latest")  
  
        pros.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")  
        pros.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer")  
  
        val consumer: KafkaConsumer[String, String] = new KafkaConsumer[String, String](pros)  
  
        /*这里填写主题名称*/  
        consumer.subscribe(util.Arrays.asList("tank"))  
  
        val system = akka.actor.ActorSystem("system")  
        system.scheduler.schedule(0 seconds, 30 seconds)(tankTest.saveData(args,consumer))  
  
    }  
  
    object tankTest {  
        def saveData(args: Array[String],consumer: KafkaConsumer[String,String]): Unit = {  
            val records: ConsumerRecords[String, String] = consumer.poll(Duration.ofSeconds(3))  
            if (!records.isEmpty) {  
                for (record <- records) {  
                    if (record.value != null && !record.value.equals("")) {  
                        myLog.syncLog(record.value + "	准备开启消费者出列数据", "kafka", "get")  
                    }  
                }  
                consumer.commitSync()  
  
            }  
  
        }  
    }  
}

相关阅读:
解决mybatis xml文件代码提示
SVN cleanup failed–previous operation has not finished; run cleanup if it was interrupted
有36辆自动赛车和6条跑道，没有计时器的前提下，最少用几次比赛可以筛选出最快的三辆赛车？
mybatis如何在控制台打印执行的sql语句
Ionic2如何下拉刷新和上拉加载
Ionic 如何把左上角的按钮去掉？
Ionic1与Ionic2
java的四种引用，强弱软虚
equals变量在前面或者在后面有什么区别吗？这是一个坑点
Java基础—复用类

原文地址：https://www.cnblogs.com/aixing/p/13327354.html