javaIO流(三)--IO深入操作

一.字符编码

　　在计算机的世界中,本质上只认识0,1的字节数据,如果要想描述一些文字的编码就需要对这些二进制的数据进行组合,就需要对二进制的数据进行组合,所以才有了现在可看见的中文显示,但是在进行编码的时候如果想要正确显示出内容则一定需要解码,所以编码和解码一定要使用统一的一套标准,如果标准不统一,那么就会出现乱码.
--在实际的开发之中,常用的编码有如下几种:
　　GBK/GB2312:国标编码,可以描述中文信息,其中GB2312只描述简体中文,而GBK包含有简体中文与繁体中文
　　ISO8859-1:国际通用码,可以用其描述所有的文字的信息,但是如果处理不当,也会造成乱码
　　Unicode编码:采用16进制的方式存储,可以描述所有的字母信息,如果是象形文字,则需要进行编码处理
　　UTF编码:象形文字部分使用十六进制的编码,而普通的字母采用的是ISO8859-1的编码,它的优势在于适合快速的传输,节约带宽,因此也就成为了开发之中首选的编码.其中UTF编码存在UTF-8,UTF-16,主要使用的则是utf-8.
--如果要想知道本地所支持的所有编码规则,则可以使用如下代码列出全部的本机属性:

 1 package IO常用类库.IO深入;
 2 
 3 /**
 4  * @author : S K Y
 5  * @version :0.0.1
 6  */
 7 public class MyCode {
 8     public static void main(String[] args) {
 9         System.getProperties().list(System.out);
10     }
11 }

--运行结果

-- listing properties --
java.runtime.name=Java(TM) SE Runtime Environment
sun.boot.library.path=C:Program FilesJavajdk1.8.0_201jr...
java.vm.version=25.201-b09
java.vm.vendor=Oracle Corporation
java.vendor.url=http://java.oracle.com/
path.separator=;
java.vm.name=Java HotSpot(TM) 64-Bit Server VM
file.encoding.pkg=sun.io
user.script=
user.country=CN
sun.java.launcher=SUN_STANDARD
sun.os.patch.level=
java.vm.specification.name=Java Virtual Machine Specification
user.dir=F:idea_workspaceRunnableProject
java.runtime.version=1.8.0_201-b09
java.awt.graphicsenv=sun.awt.Win32GraphicsEnvironment
java.endorsed.dirs=C:Program FilesJavajdk1.8.0_201jr...
os.arch=amd64
java.io.tmpdir=C:UsersUSERAppDataLocalTemp
line.separator=

java.vm.specification.vendor=Oracle Corporation
user.variant=
os.name=Windows 10
sun.jnu.encoding=GBK
java.library.path=C:Program FilesJavajdk1.8.0_201i...
java.specification.name=Java Platform API Specification
java.class.version=52.0
sun.management.compiler=HotSpot 64-Bit Tiered Compilers
os.version=10.0　　　　　　　　//当前的操作系统名称,即Windows10
user.home=C:UsersUSER
user.timezone=
java.awt.printerjob=sun.awt.windows.WPrinterJob
file.encoding=UTF-8　　　　　　//文件的默认编码
java.specification.version=1.8
user.name=USER
java.class.path=C:Program FilesJavajdk1.8.0_201jr...
java.vm.specification.version=1.8
sun.arch.data.model=64
java.home=C:Program FilesJavajdk1.8.0_201jre　　　　
sun.java.command=IO常用类库.IO深入.MyCode
java.specification.vendor=Oracle Corporation
user.language=zh
awt.toolkit=sun.awt.windows.WToolkit
java.vm.info=mixed mode
java.version=1.8.0_201
java.ext.dirs=C:Program FilesJavajdk1.8.0_201jr...
sun.boot.class.path=C:Program FilesJavajdk1.8.0_201jr...
java.vendor=Oracle Corporation
file.separator=　　　　　　//文件路径分隔符
java.vendor.url.bug=http://bugreport.sun.com/bugreport/
sun.cpu.endian=little
sun.io.unicode.encoding=UnicodeLittle
sun.desktop=windows
sun.cpu.isalist=amd64

Process finished with exit code 0

--我们可以发现不进行任何设置的话,所采用的编码就是UTF-8
--范例:编写程序

 1 public class MyCode {
 2     public static void main(String[] args) throws IOException {
 3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
 4         OutputStream output = new FileOutputStream(file);
 5         //此时为默认的处理操作,因此必然可以进行正常的显示输出操作
 6         /*output.write("今天天气不错".getBytes());
 7         output.close();*/
 8         //强制性设置编码,此时文件的输出将会造成乱码
 9         output.write("今天天气不错".getBytes(StandardCharsets.ISO_8859_1));
10         output.close();
11     }
12 }

--项目中出现的乱码问题就是编码和解码的标准不统一,因此最好的解决乱码的方式:所有的编码都使用UTF-8

二.内存操作流

　　在之前所使用的都是文件操作流,文件操作流的特点是程序使用InputStream读取文件内容,而后利用OutputStream向文件输出内容,所有的操作都是以文件为终端的.但是此时任然存在问题,比如现在需要实现IO操作,可是又不希望产生文件(临时文件),则可以以内存为终端实现操作处理.
--在java中提供有两类的内存操作流:
　　字节内存操作流:　ByteArrayOutputStream,ByteArrayInputStream
　　字符内存操作流程:　　CharArrayWriter,CharArrayReader

--此时完成的继承结构图:

--观察上方ByteArrayInputStream的构造方法,可以发现能够传入参数byte[],而ByteArrayOutputStream则提供有无参构造
--范例:利用内存流实现一个小写字母转化为大写字符的操作

 1 public class ByteCharStreamDemo {
 2     public static void main(String[] args) throws IOException {
 3         String str = "www.baidu.com";
 4         InputStream input = new ByteArrayInputStream(str.getBytes());   //将数据保存到内存流
 5         OutputStream output = new ByteArrayOutputStream();  //读取内存中的数据
 6         int data = 0;
 7         while ((data = input.read()) != -1) {    //每次只读取一个字节
 8             output.write(Character.toUpperCase((char) data));       //向输出流保存数据
 9         }
10         //在ByteArrayOutputStream类中有一个重要的方法获取全部保存在内存中的数据流信息:
11         //    public synchronized byte toByteArray()[]
12         //    public synchronized String toString()
13         System.out.println(output);
14         output.close();
15     }
16 }

--运行结果

WWW.BAIDU.COM

Process finished with exit code 0

--如果现在不希望只是以字符串的形式返回,因为可能存放的是其他二进制的数据,那么此时就可以利用ByteArrayOutputStream子类的扩展功能(此时不能在进行对象上转型)toByteArray()来获取数据

 1 public class ByteCharStreamDemo {
 2     public static void main(String[] args) throws IOException {
 3         String str = "www.baidu.com";
 4         InputStream input = new ByteArrayInputStream(str.getBytes());   //将数据保存到内存流
 5         ByteArrayOutputStream output = new ByteArrayOutputStream();  //读取内存中的数据
 6         int data = 0;
 7         while ((data = input.read()) != -1) {    //每次只读取一个字节
 8             output.write(Character.toUpperCase((char) data));       //向输出流保存数据
 9         }
10         //在ByteArrayOutputStream类中有一个重要的方法获取全部保存在内存中的数据流信息:
11         //    public synchronized byte toByteArray()[]
12         //    public synchronized String toString()
13         byte[] result = output.toByteArray();       //获取全部数据
14         System.out.println(new String(result));
15         output.close();
16     }
17 }

--在最初的时候可以利用ByteArrayOutputStream实现大规模文本文件的读取

三.管道流

　　管道流主要的功能是实现两个线程之间的IO处理,对于管道流也可以分为两类
--管道流的分类
　　字节管道流:PipedOutputStream PipedInputStream

　　　　void connect(PipedInputStream snk) 将此管道输出流连接到接收器。

　　字符管道流:　PipedWriter PipedReader　　
　　　　void connect(PipedReader snk) 将此管道写入器连接到接收器。
--实现管道操作:

 1 class SendThread implements Runnable {
 2     private PipedOutputStream output;       //管道的输出流
 3 
 4     public SendThread(PipedOutputStream output) {
 5         this.output = output;
 6     }
 7 
 8     @Override
 9     public void run() {
10         for (int i = 0; i < 10; i++) {
11             try {   //利用管道实现数据的发送处理
12                 this.output.write(("信息发送: " + "第" + (i + 1) + "条消息
").getBytes());
13             } catch (IOException e) {
14                 e.printStackTrace();
15             }
16         }
17         try {
18             this.output.close();
19         } catch (IOException e) {
20             e.printStackTrace();
21         }
22     }
23 
24     public PipedOutputStream getOutput() {
25         return output;
26     }
27 }
28 
29 class ReceiveThread implements Runnable {
30     private PipedInputStream input;     //管道的输入流
31 
32     public ReceiveThread(PipedInputStream input) {
33         this.input = input;
34     }
35 
36     @Override
37     public void run() {
38         byte[] data = new byte[1024];
39         int len = 0;
40         OutputStream output = new ByteArrayOutputStream();  //所有的数据保存到内存输出流
41 
42         try {
43             while ((len = this.input.read(data)) != -1) {
44                 output.write(data, 0, len);
45             }
46             System.out.println("接收数据: " + "{" + output.toString() + "}");
47         } catch (IOException e) {
48             e.printStackTrace();
49         }
50         try {
51             this.input.close();
52         } catch (IOException e) {
53             e.printStackTrace();
54         }
55 
56     }
57 
58     public PipedInputStream getInput() {
59         return input;
60     }
61 }
62 
63 public class MyPipDemo {
64     public static void main(String[] args) throws IOException {
65         SendThread sendThread = new SendThread(new PipedOutputStream());
66         ReceiveThread receiveThread = new ReceiveThread(new PipedInputStream());
67         sendThread.getOutput().connect(receiveThread.getInput());   //进行管道连接
68         new Thread(sendThread, "消息发送线程").start();
69         new Thread(receiveThread, "消息接收线程").start();
70 
71     }
72 }

--运行结果

接收数据: {信息发送: 第1条消息
信息发送: 第2条消息
信息发送: 第3条消息
信息发送: 第4条消息
信息发送: 第5条消息
信息发送: 第6条消息
信息发送: 第7条消息
信息发送: 第8条消息
信息发送: 第9条消息
信息发送: 第10条消息
}

Process finished with exit code 0

四.RandomAccessFile　　随机读取类
　　对于文件内容的处理操作主要是通过InputStream（Reader），OutputStream（Writer）来实现，但是利用这些类进行数据的读取，那么只能将数据部分部分读取进来，如果说现在给了一个非常庞大的文件，例如有20GB的大小，如果此时按照传统的IO操作进行读取和分析，根本就不可能完成。因此在这种情况下java.io包就提供了一个RandomAccessFile类,这个类可以实现文件的跳跃式读取,可以读取文件中间的部分内容(前提:需要有一个完善的保存形式).数据保存的位数要多确定好.
--构造方法　　public RandomAccessFile(String name, String mode)throws FileNotFoundException
--文件处理模式:　
　　r:　　　　
　　rw:
　　rws:
　　rwd:
--实现文件的保存:

 1 public class RandomAccessFileDemo {
 2     public static void main(String[] args) throws IOException {
 3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
 4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
 5         String[] names = new String[]{"zhangsan", "wangwu  ", "lisi    "};
 6         int[] ages = new int[]{30, 20, 16};
 7         for (int i = 0; i < names.length; i++) {
 8             accessFile.write(names[i].getBytes());      //写入字符串
 9             accessFile.writeInt(ages[i]);
10         }
11         accessFile.close();
12     }
13 }

--运行结果

zhangsan   wangwu     lisi

--RandomAccessFile最大的特点是在于数据的读取处理上,因为所有的数据是按照固定的长度进行保存,所以在读取的时候就可以进行跳字节读取
　　跳字节读取方法(向下跳跃):　public int skipBytes(int n) throws IOException
　　跳字节读取方法(向上跳跃): public void seek(long pos) throws IOException

--读取数据:

 1 class ReaderDemo {
 2     public static void main(String[] args) throws IOException {
 3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
 4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
 5         //读取"lisi    "的数据
 6         accessFile.skipBytes(24);       //跳过24个字节数据,每个人的信息所占的字节数(8 + 4);
 7         byte[] data = new byte[8];
 8         int len = accessFile.read(data);
 9         System.out.println("姓名: "+new String(data,0,len) + "年龄: " + accessFile.readInt());
10     }
11 }

--运行结果

姓名: lisi    年龄: 16

Process finished with exit code 0

--范例:回跳读取数据

 1 class ReaderDemo {
 2     public static void main(String[] args) throws IOException {
 3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
 4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
 5         //读取"wangwu  "的数据,而后回跳24位读取"zhangsan"的数据
 6         accessFile.skipBytes(12);       //跳过12个字节数据,每个人的信息所占的字节数(8 + 4);
 7         byte[] data = new byte[8];
 8         int len = accessFile.read(data);
 9         System.out.println("姓名: " + new String(data, 0, len) + "年龄: " + accessFile.readInt());
10         accessFile.seek(0);        //回跳都顶点
11         len = accessFile.read(data);
12         System.out.println("姓名: " + new String(data, 0, len) + "年龄: " + accessFile.readInt());
13     }
14 }

--运行结果

姓名: wangwu  年龄: 20
姓名: zhangsan年龄: 30

Process finished with exit code 0

--可以发现在整体的使用之中,由用户自定义读取的位置,而后按照指定的结构进行数据的读取(前提:数据的长度要保持一致)

相关阅读:
99%的Python用户都不知道的f-string隐秘技巧
 （数据科学学习手札115）Python+Dash快速web应用开发——交互表格篇（上）
（数据科学学习手札114）Python+Dash快速web应用开发——上传下载篇
 （数据科学学习手札113）Python+Dash快速web应用开发——表单控件篇（下）
（数据科学学习手札112）Python+Dash快速web应用开发——表单控件篇（上）
（数据科学学习手札111）geopandas 0.9.0重要新特性一览
 .NET Core 下使用 Apollo 配置中心
 .NET Core 下的爬虫利器
 .NET Core 集成JWT认证
 .NET Core 下收发邮件之 MailKit
原文地址：https://www.cnblogs.com/skykuqi/p/11409593.html