IO流 也称流(Stream)、数据流,指程序中数据的流通。
数据流是一组有顺序的、有起点和终点的字节集合,是对输入和输出(数据传输)的总称和抽象。即数据在两设备间的传输称为流。
流的本质是数据传输,根据数据传输特性将流抽象为各种类,方便更直观的进行数据操作。
IO流根据处理数据类型(单位)不同分为字符流和字节流
IO流根据数据流向不同分为输入流和输出流
IO流根据功能不同分为节点流和处理流
字符流和字节流、及二者区别
字符流的由来:因为数据编码的不同,而有了对字符进行高效操作的流对象。本质其实就是基于字节流读取时,去查了指定的码表。
1.读写单位不同:字节流以字节(8bit)为基本处理单位;字符流以字符为基本处理单位,读纯文本,可认字符,根据码表映射字符,一次可能读多个字节。Java中1个字符占2个字节,字符流不能读二进制文件。
2.处理对象不同:字节流能处理所有类型的数据(如图片、AVI等),而字符流只能处理字符类型的数据。只要是处理纯文本数据,就优先考虑使用字符流。除此之外都使用字节流。
输入流和输出流
输入流:读入到内存(程序);对源节点(数据原来在哪)使用输入流。
输出流:写出到外存;对目标节点使用输出流。
data1(源节点、输入流) ---流(内存)---> data2(目标节点、输出流)
对输入流只能进行读操作,对输出流只能进行写操作,程序中需要根据待传输数据的不同特性而使用不同的流。
节点流和处理流
节点流:从一个特定的数据源节点读写数据,紧挨着源节点、目的节点的是节点流。如:FileInputStream、输入/输出字节/字符流。紧挨着源节点、目的节点:和源节点、目的节点直接作用的。
处理流:如:字节字符转换流。通常把节点流封装成对应的处理流以便更高效的读写数据。
图1
图2
图3
IO流对象举例
1.InputStream(字节输入流) 其继承图见图3
①InputStream是所有字节输入流的父类,是抽象类。
②ByteArrayInputStream、StringBufferInputStream、FileInputStream是三种基本的介质流(基础流),它们分别从Byte数组、StringBuffer、和本地文件中读取数据。PipedInputstream是从与其它线程共用的管道中读取数据,与Piped相关的知识后续单独介绍。
③ObjectInputStream和所有FilterInputStream的子类都是装饰流(装饰器模式的主角)。
2.OutputStream(字节输出流) 其继承图见图3
①OutputStream是所有字节输出流的父类,是抽象类。
②ByteArrayOutputStream、FileOutputStream是两种基本的介质流(基础流),它们分别向Byte数组、和本地文件中写入数据。PipedOutputStream是向与其它线程共用的管道中写入数据。
③ObjectOutputStream和所有FilterOutputStream的子类都是装饰流。
3.字节流的输入与输出的对应
图4
图4中,蓝色的部分为主要的对应部分,红色的部分就是不对应部分。虚线部分代表这些流一般要搭配使用。从图4中可以看出Java IO中的字节流是极其对称的。“存在即合理”,我们看看这些字节流中不太对称的几个类吧!
①LineNumberInputStream主要完成从流中读取数据时,会得到相应的行号,至于什么时候分行、在哪里分行是由该类主动确定的,并不是在原始中有这样一个行号。在输出部分没有对应的部分,我们完全可以自己建立一个LineNumberOutputStream,在最初写入时会有一个基准的行号,以后每次遇到换行时会在下一行添加一个行号,看起来也是可以的。好像更不入流了。
②PushbackInputStream的功能是查看最后一个字节,不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream几乎实现相近的功能。
③StringBufferInputStream类已过时,不应该出现在InputStream部分,主要因为String应该属于字符流的范围。已经被废弃了,当然输出部分也没有必要需要它了。还允许它存在只是为了保持版本的向下兼容而已。
④SequenceInputStream可以认为是一个工具类,将两个或者多个输入流当成一个输入流依次读取。完全可以从IO包中去除,还完全不影响IO包的结构,却让其更“纯洁”——纯洁的装饰者模式。
⑤PrintStream也可以认为是一个辅助工具。主要可以向其他输出流,或者FileInputStream写入数据,本身内部实现还是带缓冲的。本质上是对其它流的综合运用的一个工具而已。一样可以踢出IO包!System.out和System.in就是PrintStream的实例。
4.Reader(字符输入流)
①Reader是所有的字符输入流的父类,是抽象类。
②CharArrayReader、StringReader是两种基本的介质流(基础流),它们分别将Char数组、String中读取数据。PipedReader是从与其它线程共用的管道中读取数据。
③BufferedReader很明显就是一个装饰器,它和其子类负责装饰其它Reader类对象。
④FilterReader是所有自定义具体装饰流的父类,其子类PushbackReader对Reader类对象进行装饰,会增加一个行号。
⑤InputStreamReader是一个连接字节流和字符流的桥梁,它将字节流转变为字符流。FileReader可以说是一个达到此功能常用的工具类,在其源代码中明显使用了将FileInputStream转变为Reader的方法。我们可以从这个类中得到一定的技巧。Reader中各个类的用途和使用方法基本和InputStream中的类使用一致。后面会有Reader与InputStream的对应关系。
5.Writer(字符输出流)
①Writer是所有的字符输出流的父类,是抽象类。
②CharArrayWriter、StringWriter是两种基本的介质流(基础流),它们分别向Char数组、String中写入数据。PipedWriter是向与其它线程共用的管道中写入数据。
③BufferedWriter是一个装饰器,为Writer提供缓冲功能。
④PrintWriter和PrintStream极其类似,功能和使用也非常相似。
⑤OutputStreamWriter是OutputStream到Writer转换的桥梁,它的子类FileWriter其实就是一个实现此功能的具体类(具体可以研究一下SourceCode)。功能和使用和OutputStream极其类似,后面会有它们的对应图。
6.字符流的输入与输出的对应
图5
7.字符流与字节流转换
转换流(中介流)的特点:①其是字符流和字节流之间的桥梁。②可对读取到的字节数据经过指定编码转换成字符。③可对读取到的字符数据经过指定编码转换成字节。当字节和字符之间有转换动作时、流操作的数据需要编码或解码时使用转换流。
InputStreamReader:字节到字符的桥梁。
OutputStreamWriter:字符到字节的桥梁。
InputStreamReader、OutputStreamWriter这两个流对象是字符体系中的成员,它们有转换作用,本身又是字符流,所以在构造的时候需要传入字节流对象进来。
字节字符转换流 只能是字节向字符转换??
8.File类:
File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名、判断指定文件是否存在、获得当前目录中的文件列表、创建、删除文件和目录等方法。
9.RandomAccessFile类:
该对象并不是流体系中的一员,其封装了字节流,同时还封装了一个缓冲区(字符数组),通过内部的指针来操作字符数组中的数据。该对象特点:①该对象只能操作文件,所以构造函数接收两种类型的参数:字符串文件路径,File类对象。②该对象既可以对文件进行读操作,也能进行写操作,在进行对象实例化时可指定操作模式(r,rw)。注意:该对象在实例化时,如果要操作的文件不存在,会自动创建;如果文件存在,写数据未指定位置,会从头开始写,即覆盖原有的内容。可以用于多线程下载或多个线程同时写数据到文件。
关于序列化:
一个类对象如果可以被序列化,其子类对象都可以被序列化。如果父类对象不可被序列化,父类要有一个默认构造器,其子类对象可被序列化。transient修饰的属性不能被序列化,流都不能被序列化。