前言:今天工作的需要需要读取aws云上S3桶里面的PDF数据,第一步能够正常的获取PDF文件的InputStream流,然后,我为了测试使用了IOUtils.toString(is)将流System.out.println()输出后,然后再次使用获取的流,这时操作失败,具体如下:
path = "s3://testpatsnapus/steven/KR/A/10/20/03/00/21/58/8/EM_0001805590063.pdf"; InputStream ins = AWSS3Utils.downloadAsStream(path); System.out.println(IOUtils.toString(ins)); PdfReader reader = new PdfReader(ins); System.out.println(ins.available()); System.out.println(reader.getNumberOfPages());
开始还不清楚是什么原因,我将System.out.println(IOUtils.toString(ins));注释后,一切正常。所以这也是我写这篇文章的初衷,原因就是InputStream流只能够被利用一次,无法重复读。
如何重复读取InputStream中的流呢?
其实网上也给了几种方法:
① 通过将流缓存起来,然后,再次被利用
② 如果需要重新读取流的化,虽然无法重复读取,但是可以从源头上解决:重新再获取一遍流
③ 可以通过ByteArrayOutputStream进行转换处理
具体可以参考如下文章:
http://blog.csdn.net/java_mr_zheng/article/details/52457225
http://blog.csdn.net/it_magician/article/details/9240727
http://blog.csdn.net/java_mr_zheng/article/details/52456225