easy-batch writers 的作用是写入record 到sink
支持的数据sink
- 参考图
来自官方表格
注意事项和提示
- 在JdbcRecordWriter处理数据库事务。每批处理后将创建一个事务并提交/回滚。
- 在JpaRecordWriter预计一个Java对象作为输入,而不是一个Record。在将记录传递到之前,请确保将记录映射到您的域对象类型JpaRecordWriter。在JpaRecordWriter处理数据库事务。每批处理后将创建一个事务并提交/回滚。
- 在HibernateRecordWriter预计一个Java对象作为输入,而不是一个Record。在将记录传递到之前,请确保将记录映射到您的域对象类型HibernateRecordWriter。该作者处理数据库事务。每批处理后将创建一个事务并提交/回滚。
处理数据写入失败
有时,数据接收器可能暂时不可用。在这种情况下,记录写入器将无法写入数据,并且作业将被中止。该RetryableRecordWriter可用于使用委托重试写入数据RecordWriter了RetryPolicy。
Job job = new JobBuilder()
.writer(new RetryableRecordWriter(unreliableDataSinkWriter, new RetryPolicy(5, 1, SECONDS)))
.build();
这将使写程序最多重试5次,每次尝试之间等待一秒钟。如果经过5次尝试仍无法访问数据接收器,则作业将中止。
批量扫描
激活后,如果在批处理写入过程中发生异常,则将启动批处理扫描。尝试将记录作为单例一批一个地写入。这样就可以跳过错误的记录并继续执行作业,而不是在第一个失败的批次中使整个作业失败。
此功能与事务编写器配合使用,可以成功执行失败的写操作而没有副作用。但是,一个已知的限制是,与非事务处理写入器一起使用时,项目可能被写入两次(例如,在文件写入器的情况下,在发生异常之前刷新输出流)。为避免这种情况,应在BatchListener#onBatchWritingException方法中执行手动回滚操作。