• javaIO流(三)--IO深入操作


    一.字符编码

      在计算机的世界中,本质上只认识0,1的字节数据,如果要想描述一些文字的编码就需要对这些二进制的数据进行组合,就需要对二进制的数据进行组合,所以才有了现在可看见的中文显示,但是在进行编码的时候如果想要正确显示出内容则一定需要解码,所以编码和解码一定要使用统一的一套标准,如果标准不统一,那么就会出现乱码.
    --在实际的开发之中,常用的编码有如下几种:
      GBK/GB2312:国标编码,可以描述中文信息,其中GB2312只描述简体中文,而GBK包含有简体中文与繁体中文
      ISO8859-1:国际通用码,可以用其描述所有的文字的信息,但是如果处理不当,也会造成乱码
      Unicode编码:采用16进制的方式存储,可以描述所有的字母信息,如果是象形文字,则需要进行编码处理
      UTF编码:象形文字部分使用十六进制的编码,而普通的字母采用的是ISO8859-1的编码,它的优势在于适合快速的传输,节约带宽,因此也就成为了开发之中首选的编码.其中UTF编码存在UTF-8,UTF-16,主要使用的则是utf-8.
    --如果要想知道本地所支持的所有编码规则,则可以使用如下代码列出全部的本机属性:

     1 package IO常用类库.IO深入;
     2 
     3 /**
     4  * @author : S K Y
     5  * @version :0.0.1
     6  */
     7 public class MyCode {
     8     public static void main(String[] args) {
     9         System.getProperties().list(System.out);
    10     }
    11 }

    --运行结果

    -- listing properties --
    java.runtime.name=Java(TM) SE Runtime Environment
    sun.boot.library.path=C:Program FilesJavajdk1.8.0_201jr...
    java.vm.version=25.201-b09
    java.vm.vendor=Oracle Corporation
    java.vendor.url=http://java.oracle.com/
    path.separator=;
    java.vm.name=Java HotSpot(TM) 64-Bit Server VM
    file.encoding.pkg=sun.io
    user.script=
    user.country=CN
    sun.java.launcher=SUN_STANDARD
    sun.os.patch.level=
    java.vm.specification.name=Java Virtual Machine Specification
    user.dir=F:idea_workspaceRunnableProject
    java.runtime.version=1.8.0_201-b09
    java.awt.graphicsenv=sun.awt.Win32GraphicsEnvironment
    java.endorsed.dirs=C:Program FilesJavajdk1.8.0_201jr...
    os.arch=amd64
    java.io.tmpdir=C:UsersUSERAppDataLocalTemp
    line.separator=
    
    java.vm.specification.vendor=Oracle Corporation
    user.variant=
    os.name=Windows 10
    sun.jnu.encoding=GBK
    java.library.path=C:Program FilesJavajdk1.8.0_201i...
    java.specification.name=Java Platform API Specification
    java.class.version=52.0
    sun.management.compiler=HotSpot 64-Bit Tiered Compilers
    os.version=10.0        //当前的操作系统名称,即Windows10
    user.home=C:UsersUSER
    user.timezone=
    java.awt.printerjob=sun.awt.windows.WPrinterJob
    file.encoding=UTF-8      //文件的默认编码
    java.specification.version=1.8
    user.name=USER
    java.class.path=C:Program FilesJavajdk1.8.0_201jr...
    java.vm.specification.version=1.8
    sun.arch.data.model=64
    java.home=C:Program FilesJavajdk1.8.0_201jre    
    sun.java.command=IO常用类库.IO深入.MyCode
    java.specification.vendor=Oracle Corporation
    user.language=zh
    awt.toolkit=sun.awt.windows.WToolkit
    java.vm.info=mixed mode
    java.version=1.8.0_201
    java.ext.dirs=C:Program FilesJavajdk1.8.0_201jr...
    sun.boot.class.path=C:Program FilesJavajdk1.8.0_201jr...
    java.vendor=Oracle Corporation
    file.separator=      //文件路径分隔符
    java.vendor.url.bug=http://bugreport.sun.com/bugreport/
    sun.cpu.endian=little
    sun.io.unicode.encoding=UnicodeLittle
    sun.desktop=windows
    sun.cpu.isalist=amd64
    
    Process finished with exit code 0

    --我们可以发现不进行任何设置的话,所采用的编码就是UTF-8
    --范例:编写程序

     1 public class MyCode {
     2     public static void main(String[] args) throws IOException {
     3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
     4         OutputStream output = new FileOutputStream(file);
     5         //此时为默认的处理操作,因此必然可以进行正常的显示输出操作
     6         /*output.write("今天天气不错".getBytes());
     7         output.close();*/
     8         //强制性设置编码,此时文件的输出将会造成乱码
     9         output.write("今天天气不错".getBytes(StandardCharsets.ISO_8859_1));
    10         output.close();
    11     }
    12 }

    --项目中出现的乱码问题就是编码和解码的标准不统一,因此最好的解决乱码的方式:所有的编码都使用UTF-8

    二.内存操作流

      在之前所使用的都是文件操作流,文件操作流的特点是程序使用InputStream读取文件内容,而后利用OutputStream向文件输出内容,所有的操作都是以文件为终端的.但是此时任然存在问题,比如现在需要实现IO操作,可是又不希望产生文件(临时文件),则可以以内存为终端实现操作处理.
    --在java中提供有两类的内存操作流:
      字节内存操作流: ByteArrayOutputStream,ByteArrayInputStream
      字符内存操作流程:  CharArrayWriter,CharArrayReader

    --此时完成的继承结构图:

    --观察上方ByteArrayInputStream的构造方法,可以发现能够传入参数byte[],而ByteArrayOutputStream则提供有无参构造
    --范例:利用内存流实现一个小写字母转化为大写字符的操作

     1 public class ByteCharStreamDemo {
     2     public static void main(String[] args) throws IOException {
     3         String str = "www.baidu.com";
     4         InputStream input = new ByteArrayInputStream(str.getBytes());   //将数据保存到内存流
     5         OutputStream output = new ByteArrayOutputStream();  //读取内存中的数据
     6         int data = 0;
     7         while ((data = input.read()) != -1) {    //每次只读取一个字节
     8             output.write(Character.toUpperCase((char) data));       //向输出流保存数据
     9         }
    10         //在ByteArrayOutputStream类中有一个重要的方法获取全部保存在内存中的数据流信息:
    11         //    public synchronized byte toByteArray()[]
    12         //    public synchronized String toString()
    13         System.out.println(output);
    14         output.close();
    15     }
    16 }

    --运行结果

    WWW.BAIDU.COM
    
    Process finished with exit code 0

    --如果现在不希望只是以字符串的形式返回,因为可能存放的是其他二进制的数据,那么此时就可以利用ByteArrayOutputStream子类的扩展功能(此时不能在进行对象上转型)toByteArray()来获取数据

     1 public class ByteCharStreamDemo {
     2     public static void main(String[] args) throws IOException {
     3         String str = "www.baidu.com";
     4         InputStream input = new ByteArrayInputStream(str.getBytes());   //将数据保存到内存流
     5         ByteArrayOutputStream output = new ByteArrayOutputStream();  //读取内存中的数据
     6         int data = 0;
     7         while ((data = input.read()) != -1) {    //每次只读取一个字节
     8             output.write(Character.toUpperCase((char) data));       //向输出流保存数据
     9         }
    10         //在ByteArrayOutputStream类中有一个重要的方法获取全部保存在内存中的数据流信息:
    11         //    public synchronized byte toByteArray()[]
    12         //    public synchronized String toString()
    13         byte[] result = output.toByteArray();       //获取全部数据
    14         System.out.println(new String(result));
    15         output.close();
    16     }
    17 }

    --在最初的时候可以利用ByteArrayOutputStream实现大规模文本文件的读取

    三.管道流

      管道流主要的功能是实现两个线程之间的IO处理,对于管道流也可以分为两类
    --管道流的分类
      字节管道流:PipedOutputStream PipedInputStream

        void connect(PipedInputStream snk) 将此管道输出流连接到接收器。

      字符管道流: PipedWriter PipedReader  
        void connect(PipedReader snk) 将此管道写入器连接到接收器。
    --实现管道操作:

     1 class SendThread implements Runnable {
     2     private PipedOutputStream output;       //管道的输出流
     3 
     4     public SendThread(PipedOutputStream output) {
     5         this.output = output;
     6     }
     7 
     8     @Override
     9     public void run() {
    10         for (int i = 0; i < 10; i++) {
    11             try {   //利用管道实现数据的发送处理
    12                 this.output.write(("信息发送: " + "第" + (i + 1) + "条消息
    ").getBytes());
    13             } catch (IOException e) {
    14                 e.printStackTrace();
    15             }
    16         }
    17         try {
    18             this.output.close();
    19         } catch (IOException e) {
    20             e.printStackTrace();
    21         }
    22     }
    23 
    24     public PipedOutputStream getOutput() {
    25         return output;
    26     }
    27 }
    28 
    29 class ReceiveThread implements Runnable {
    30     private PipedInputStream input;     //管道的输入流
    31 
    32     public ReceiveThread(PipedInputStream input) {
    33         this.input = input;
    34     }
    35 
    36     @Override
    37     public void run() {
    38         byte[] data = new byte[1024];
    39         int len = 0;
    40         OutputStream output = new ByteArrayOutputStream();  //所有的数据保存到内存输出流
    41 
    42         try {
    43             while ((len = this.input.read(data)) != -1) {
    44                 output.write(data, 0, len);
    45             }
    46             System.out.println("接收数据: " + "{" + output.toString() + "}");
    47         } catch (IOException e) {
    48             e.printStackTrace();
    49         }
    50         try {
    51             this.input.close();
    52         } catch (IOException e) {
    53             e.printStackTrace();
    54         }
    55 
    56     }
    57 
    58     public PipedInputStream getInput() {
    59         return input;
    60     }
    61 }
    62 
    63 public class MyPipDemo {
    64     public static void main(String[] args) throws IOException {
    65         SendThread sendThread = new SendThread(new PipedOutputStream());
    66         ReceiveThread receiveThread = new ReceiveThread(new PipedInputStream());
    67         sendThread.getOutput().connect(receiveThread.getInput());   //进行管道连接
    68         new Thread(sendThread, "消息发送线程").start();
    69         new Thread(receiveThread, "消息接收线程").start();
    70 
    71     }
    72 }

    --运行结果

    接收数据: {信息发送: 第1条消息
    信息发送: 第2条消息
    信息发送: 第3条消息
    信息发送: 第4条消息
    信息发送: 第5条消息
    信息发送: 第6条消息
    信息发送: 第7条消息
    信息发送: 第8条消息
    信息发送: 第9条消息
    信息发送: 第10条消息
    }
    
    Process finished with exit code 0

    四.RandomAccessFile  随机读取类
      
    对于文件内容的处理操作主要是通过InputStream(Reader),OutputStream(Writer)来实现,但是利用这些类进行数据的读取,那么只能将数据部分部分读取进来,如果说现在给了一个非常庞大的文件,例如有20GB的大小,如果此时按照传统的IO操作进行读取和分析,根本就不可能完成。因此在这种情况下java.io包就提供了一个RandomAccessFile类,这个类可以实现文件的跳跃式读取,可以读取文件中间的部分内容(前提:需要有一个完善的保存形式).数据保存的位数要多确定好.
    --构造方法  public RandomAccessFile(String name, String mode)throws FileNotFoundException
    --文件处理模式: 
      r:    
      rw:
      rws:
      rwd:
    --实现文件的保存:

     1 public class RandomAccessFileDemo {
     2     public static void main(String[] args) throws IOException {
     3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
     4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
     5         String[] names = new String[]{"zhangsan", "wangwu  ", "lisi    "};
     6         int[] ages = new int[]{30, 20, 16};
     7         for (int i = 0; i < names.length; i++) {
     8             accessFile.write(names[i].getBytes());      //写入字符串
     9             accessFile.writeInt(ages[i]);
    10         }
    11         accessFile.close();
    12     }
    13 }

    --运行结果

    zhangsan   wangwu     lisi       

    --RandomAccessFile最大的特点是在于数据的读取处理上,因为所有的数据是按照固定的长度进行保存,所以在读取的时候就可以进行跳字节读取
      跳字节读取方法(向下跳跃): public int skipBytes(int n) throws IOException 
      跳字节读取方法(向上跳跃):    public void seek(long pos) throws IOException

    --读取数据:

     1 class ReaderDemo {
     2     public static void main(String[] args) throws IOException {
     3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
     4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
     5         //读取"lisi    "的数据
     6         accessFile.skipBytes(24);       //跳过24个字节数据,每个人的信息所占的字节数(8 + 4);
     7         byte[] data = new byte[8];
     8         int len = accessFile.read(data);
     9         System.out.println("姓名: "+new String(data,0,len) + "年龄: " + accessFile.readInt());
    10     }
    11 }

    --运行结果

    姓名: lisi    年龄: 16
    
    Process finished with exit code 0

    --范例:回跳读取数据

     1 class ReaderDemo {
     2     public static void main(String[] args) throws IOException {
     3         File file = new File("d:" + File.separator + "java_test" + File.separator + "demo01.txt");
     4         RandomAccessFile accessFile = new RandomAccessFile(file, "rw");     //读写模式
     5         //读取"wangwu  "的数据,而后回跳24位读取"zhangsan"的数据
     6         accessFile.skipBytes(12);       //跳过12个字节数据,每个人的信息所占的字节数(8 + 4);
     7         byte[] data = new byte[8];
     8         int len = accessFile.read(data);
     9         System.out.println("姓名: " + new String(data, 0, len) + "年龄: " + accessFile.readInt());
    10         accessFile.seek(0);        //回跳都顶点
    11         len = accessFile.read(data);
    12         System.out.println("姓名: " + new String(data, 0, len) + "年龄: " + accessFile.readInt());
    13     }
    14 }

    --运行结果

    姓名: wangwu  年龄: 20
    姓名: zhangsan年龄: 30
    
    Process finished with exit code 0

    --可以发现在整体的使用之中,由用户自定义读取的位置,而后按照指定的结构进行数据的读取(前提:数据的长度要保持一致)

  • 相关阅读:
    99%的Python用户都不知道的f-string隐秘技巧
    (数据科学学习手札115)Python+Dash快速web应用开发——交互表格篇(上)
    (数据科学学习手札114)Python+Dash快速web应用开发——上传下载篇
    (数据科学学习手札113)Python+Dash快速web应用开发——表单控件篇(下)
    (数据科学学习手札112)Python+Dash快速web应用开发——表单控件篇(上)
    (数据科学学习手札111)geopandas 0.9.0重要新特性一览
    .NET Core 下使用 Apollo 配置中心
    .NET Core 下的爬虫利器
    .NET Core 集成JWT认证
    .NET Core 下收发邮件之 MailKit
  • 原文地址:https://www.cnblogs.com/skykuqi/p/11409593.html
Copyright © 2020-2023  润新知