• Java I/O输入输出流


    一、编码问题

    文本文件其实就是字节序列,可以是任意编码的字节序列,如果我们在中文机器上直接创建文本文件,那么该文本文件只能解析默认的ansi编码

    转换成字节序列用的是项目默认的编码GBK,GBK编码中文占用2个字节,英文占用1个字节

    UTF-8编码中中文占用3个字节,英文占用1个字节

    Java是双字节编码,UTF-16BE编码,中文占用2个字节,英文占用2个字节

    字符串转化为字节时可以指定编码方式:

            String s ="中国";
            byte[] byte1= s.getBytes("gbk");

    当你的字节序列是某种编码时,这时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码。如下说明编码方式

    String str1 = new String(bytes1,"utf-16be");

    如果没有指明编码方式,则用项目默认的编码GBK

    每个project可以设置自己默认的编码方式,且只认识自己的编码方式

    二、File类的使用

    java.io.File类用于表示文件(目录)

    File类只用于表示文件(目录)的信息(名称、大小等),不能用于文件内容的访问

    文件的创建

            File file = new File("d:\javaIo");//要使用双斜杠\
            if(!file.exists())//判断文件存不存在
                file.mkdirs();//创建多级文件目录,file.mkdir()只创建一级目录
            else
                file.delete();//删除文件、文件夹
    File file2 = new File("d:"+File.separator+"javaIo"+File.separator+"file2.txt");//File.separator设置分隔符,各个系统都能够识别
    File file3 = new File("d:\javaIo","日记.txt");//两种方式都可以
    if(!file2.exists())
                try {
                    file2.createNewFile();//创建文件
                } catch (IOException e) {
                    e.printStackTrace();
                }

    常用的File的API

    System.out.println(file);//file.toString()的内容

    System.out.println(file.getAbsolutePath());
    System.out.println(file.getName());
    System.out.println(file2.getName());
    System.out.println(file.getParent());//父目录的路径

    File类的常用操作

    /**
         * 列出指定目录下(包括其子目录)的所有文件
         */
        public static void listDirectory(File dir) throws IOException{
            if(!dir.exists())
                throw new IllegalArgumentException("目录:"+dir+"不存在");
            if(!dir.isDirectory())
                throw new IllegalArgumentException(dir+"不是目录");
          
            File[] files = dir.listFiles();
            if(files!=null&&files.length>0){
                for (File file : files) {
                    if(file.isDirectory())
                        FileUtils.listDirectory(file);//递归方式遍历目录下所有文件
                    else
                        System.out.println(file);
                }
            }
        }

    注意:file.listFiles()方法获取到的是File,所以打印输出是完整的目录

    而file.list()方法获取到的是String,打印输出的只是文件的名称,要打印完整目录需要加上父目录

    三、RandomAccessFile的使用

    RandomAccessFile是Java提供的对文件内容的访问类,既可以读文件,也可以写文件。支持随机访问文件,可以访问文件的任意位置

    (1)Java的文件模型

    在硬盘上的文件是byte  byte byte存储的,是数据的集合

    (2)打开文件

    有两种模式“rw”)(读写)“r”(只读)

    RandomAccessFile = new RandomAccessFile(file,"rw");

    文件指针,打开文件时指针在开头,pointer = 0;

    (3)写方法

    raf.write(int)---->只写一个字节(后8位),同时指针指向下一个位置,准备再次写入

    raf.write(byte数组) 可以写入整个数组

    (4)读方法

    int b = raf.read()--->读一个字节

    如果用raf.read(byte数组) 可以读取全部

    (5)文件读写完成一定要关闭

    四、字节流的使用

    (1)InputStreamOutputStream

     InputStream抽象了读取数据的方式

    OutputStream抽象了写数据的方式

    (2)EOF = End 读到-1就读到结尾

    (3)输入流基本方法

    int b = in.read();读取一个字节,无符号填充到int低八位,-1是EOF

    in.read(byte[] buf)读取数据填充到字节数组buf中

    in.read(byte[] buf,int start, int size)

    (4)输出流基本方法

    out.write(int b) 写出一个byte到流,b的低8位

    out.write(byte[] buf)将buf 字节数组都写入到流

    out.write(byte[] buf,int start, int size)

    (5)FileInputStream

    子类,具体实现了在文件上读取数据

    /**
         * 读取指定文件内容,按照16进制输出到控制台
         * 并且每输出10个byte换行
         * @param fileName
         */
        public static void printHex(String fileName) throws IOException{
            
            FileInputStream in = new FileInputStream(fileName);
            int b;
            int i=1;
            while((b=in.read())!=-1){
                System.out.print(Integer.toHexString(b&0xff)+"  ");
                if((i++)%10==0)
                    System.out.println();
            }
            in.close();//读取完毕记得一定要close
            
        }
            FileInputStream in = new FileInputStream(fileName);
            byte[] buf = new byte[20*1024];
            //从in 中批量读取字节,放入到buf这个字节数组中,从第0个位置开始放,最多放buf.length个
            //返回的是读到的字节的个数
            int bytes = in.read(buf, 0, buf.length);//一次性读完,说明字节数组足够大

    数组不够大时,有可能一次文件读不完,则需要在外面加上while((bytes = in.read(buf, 0, buf.length))!=-1),这样才能保证读到完整的文件

    byte类型8位,int类型32位,为避免数据转换错误,通过&0xff将高24位清零

    (6)FileOutputStream

    实现了向文件中写出byte数据的方法

    FileOutputStream(File file,boolean append)

    如果该文件不存在,则直接创建

    如果该文件存在,为ture,则向文件中追加内容,如果没写或为false,删除后再创建

    (7)DataOutputStream/DataInputStream

    对“流”功能的扩展,可以更加方便的读取int,long,字符等类型的数据

    DataOutputStream

    writeInt()/writeDouble()/writeUTF(),只是包装好了可以直接用 

    (8)BufferedInputStream&BufferedOutputStream

    这两个流类为IO提供了带缓冲区的操作,一般打开文件进行写入或读取时,都会加上缓冲,这种流模式提高了IO的性能

    从应用程序中把输入放入文件,相当于将一缸水倒入到另一个缸中:

    FileOutputStream--->write()相当于一滴一滴的把水转移到水缸里

    DataOutputStream--->writeXxx()方便一些,相当于一瓢一瓢的将水转移过去

    BufferedOutputStream--->write更方便,相当于一瓢水一瓢水先放入桶中,再从桶中倒入到水缸里

    批量读取(使用数组方式,先把文件内容存在数组中),效率最高!!!高了不止一点点

    public static void copyFile(File srcFile, File destFile) throws IOException {
            if (!srcFile.exists())
                throw new IllegalArgumentException("文件" + srcFile + "不存在");
            if (!srcFile.isFile())
                throw new IllegalArgumentException(srcFile + "不是文件");
            FileInputStream in = new FileInputStream(srcFile);
            FileOutputStream out = new FileOutputStream(destFile);
            byte[] buf = new byte[8 * 1024];
            int b = 0;
            while ((b = in.read(buf, 0, buf.length)) != -1) {
                out.write(buf, 0, b);
                out.flush();// 最好加上
            }
        }

    要记得刷新缓冲区 .flush

    五、字符流的使用

    (1)编码问题

    (2)认识文本和文本文件

    Java的文本(char)是16位无符号整数,是字符的unicode编码(双字节编码)

    文件是byte  byte byte的数据序列

    文本文件是文本(char)序列按照某种编码方案(utf-8,utf-16be,gbk)序列化为byte的存储结果

    (3)字符流(reader,writer)--->操作的是文本文件,其他文件类型用字符流没有意义

    字符的处理,一次处理一个字符

    字符的底层仍然是基本的字节序列

    字符流的基本实现,默认为gbk

    InputStreamReader  完成byte流解析为char流,按照编码解析

    OutputStreamWriter 提供char流到byte流,按照编码处理

     

    FileReader/FileWrite用于文件的读写

    (4)字符流的过滤器

    BufferedReader--->readLine一次读一行 String line,

    BufferedWriter/PrintWrite--->写一行

    不认识换行,需要单独写出换行.newLine() 

    六、对象的序列化和反序列化

    (1)对象序列化,就是将Object转换成byte序列,反之叫对象的反序列化

    (2)序列化流(ObjectOutputStream),是过滤流--->writeObject

    反序列化流(ObjectInputStream)--->readObject

    (3)序列化接口(Serializable)

    对象必须实现序列化接口 implements Serializable,才能进行序列化,否则将出现异常

    接口没有任何方法,只是一个标准

    (4)transient关键字

    用于不想序列化的元素

    用transient修饰的元素不会进行jvm默认的序列化,但可以自己完成元素的序列化

    (5)父类和子类

    一个类实现了序列化接口,那么其子类都可以进行序列化

    对子类对象进行反序列化操作时,如果其父类没有实现序列化接口,那么其父类的构造函数会被调用,如果其父类实现了序列化接口,则其父类的构造函数不会被调用

  • 相关阅读:
    Opencv学习笔记(六)SURF学习笔记
    各种加解密算法比較
    DWZ使用笔记
    Android反编译-逆天的反编译
    C++学习笔记14,private/protected/public继承,私有继承,保护继承,公有继承(五)(总结)
    Java 中队列的使用
    从svn下载项目后build path为灰色
    Java菜鸟学习笔记--面向对象篇(十六):Object类方法
    Java实现 蓝桥杯VIP 算法训练 矩阵乘方
    Java实现 蓝桥杯VIP 算法训练 矩阵乘方
  • 原文地址:https://www.cnblogs.com/atingjia/p/6548900.html
Copyright © 2020-2023  润新知