第12周-流与文件

第12周-流与文件
1. 本周学习总结

1.1 以你喜欢的方式（思维导图或其他）归纳总结多流与文件相关内容。
- 字符流-文本输入与输出
  一定要在finally块中关闭资源
  字符编码转化会自动进行
  底层依然可以使用字节流
- 缓冲区进行写操作
  缓冲区未满出现异常
  数据丢失-没有真正实现写出
2. 书面作业

将Student对象(属性：int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

1. 字符流与文本文件：使用 PrintWriter(写)，BufferedReader(读)

1.1 生成的三个学生对象，使用PrintWriter的println方法写入student.txt，每行一个学生，学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码，出现学号)

1.2 生成文件大小多少？分析该文件大小

答：生成文件大小为51字节。
- 分析：
  第一行：成员数占1字节+行末尾（' '）2字节=3字节
  第二行：id占1字节+name占4字节+age占2字节+grade占4字节+分隔符3字节+行末尾占2字节=16字节
  后两行同理，总共51字节。
1.3 如果调用PrintWriter的println方法，但在后面不close。文件大小是多少？为什么？

答：文件大小是0字节。
- 原因：
  close方法：关闭此流并释放与该流关联的所有系统资源。如果不释放，则有限的系统资源将被耗尽。
  所以不关闭(close)流，最后的字节不会被传送出去，造成了数据丢失；文件大小为0字节。
2. 缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行)，然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度（只读取，不输出），使用哪种方法快？请详细分析原因？提示：可以使用junit4对比运行时间

答： BufferedReader读取速度快。
- 原因：
  BufferedReader有缓冲区，不用按照实际IO次数读取，先放到缓冲区再一次性读取；
  而Scanner可能发生阻塞，等待信息进入，效率比较低。
2.2 将PrintWriter换成BufferedWriter，观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因

答：写入文件速度有提升。
- 原因：
  PrintWriter对整个文件进行缓冲；
  BufferedWriter将文本写入字符输出流，对各个字符进行缓冲；
  相对来说，BufferedWriter的缓冲效率比较好，因此速度提升。
3. 字符编码

3.1 现有EncodeTest.txt 文件，该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码？为什么会有乱码？如何解决？(截图关键代码，出现学号)

答：有乱码。使用UTF-8编码的文件只能用同一种编码读入并输出，而FileReader按系统默认的编码来读取文件内容。
- 运行结果：
- 解决乱码的代码
3.2 编写一个方法convertGBK2UTF8(String src, String dst)，可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。

答：
- 运行结果：
4. 字节流、二进制文件：DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码，尝试将三个学生对象的数据写入文件，然后从文件读出并显示。(截图关键代码，出现学号)
- 运行结果：
4.2 生成的文件有多大？分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了，为什么？

答：
（1）生成的文件72字节。
（2）分析：（id-int型占4字节） + name（两个汉字）占4字节 + （age-int型占4字节） + （grade-double型占8个字节） + 分隔符共占3个字节 + 换行符占1个字节=24个字节；三行共占72字节。
（3）对比结果：该文件更大。
（4）原因：题目1用字符串处理文件大小；而本题以具体类型处理文件大小。

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data，分析数据在文件中是如何存储的。

答：数据以数据类型的大小进行存储：
（1）00 00 00 01 ->id ->int型
（2）00 06 E5 BC A0 A4 B8 89 ->name
（3）00 00 00 13 ->age ->int型
（4）40 50 40 00 00 00 00 00 ->grade ->double型

结论： 之前的分析似乎是错的，name占了8个字节？！！

4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码，出现学号) //参考ObjectStreamTest目录
- 运行结果：
5. 基本概念

编写public static List<Student> readStudents(String fileName);从fileName指定的文本文件中读取所有学生，并将其放入到一个List中。应该使用那些IO相关的类？说说你的选择理由。

答：
（1）java.io.FileInputStream——字节流：读取文件
（2）java.io.InputStreamReader——字符流：按照指定编码在字节流与字符流间转换（转换为UTF-8编码格式）
（3）java.io.BufferedReader——缓冲流：提高读写效率

6. 选做：RandomAccessFile

6.1 使用RandomAccessFile实现题目1.1。(截图关键代码，出现学号)

6.2 分析文件大小

7. 文件操作

—编写一个程序，可以根据指定目录和文件名，搜索该目录及子目录下的所有文件，如果没有找到指定文件名，则显示无匹配，否则将所有找到的文件名与文件夹名显示出来。

7.1 编写public static void findFile(String path,String filename)函数，以path指定的路径为根目录，在其目录与子目录下查找所有和filename相同的文件名，一旦找到就马上输出到控制台。(截图关键代码，出现学号)

7.2 加分点：使用队列、使用图形界面、使用Java NIO.2完成（任选1）

7.3 选做：实现删掉指定目录及其子目录下的所有空文件夹。

-参考代码:FindDirectories.java
参考：本题具体要求见流与文件实验任务书-题目2

8. 正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式？尝试编程进行验证。(截图关键代码，出现学号)
- 运行结果：
8.2 选做：修改HrefMatch.java，尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

-参考：本题具体要求见流与文件实验任务书-题目3

8.3 选做(较难)：进一步改造上面的程序，获得图片的链接，如IMG src="images/mail1.gif"，然后经过处理，生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址，放入一个队列。编写方法，可以依照该队列的所有图片地址，一次将图片下载下来。

3. 码云及PTA

3.1. 码云代码提交记录

——在码云的项目中，依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图

3.2 PTA以前未完成的题目

——截图
相关阅读:
SpirngBoot整合Mybatis Plus多数据源
 SpringBoot整合EasyPoi 封装Excel导出通用工具类，行高自适应，导出图片
 阿里云服务器安装Docker Compose
设置Docker容器里的时间
 坏代码导致的性能问题大赏：CPU占用飙到了900%！
Java程序员涨薪必备的性能调优知识点，收好了！
SprinMvc快速入门
 python中文乱码问题
 python中自定义函数类的引用（最全）
datax
原文地址：https://www.cnblogs.com/whting/p/6833246.html

第12周-流与文件

1. 本周学习总结

1.1 以你喜欢的方式（思维导图或其他）归纳总结多流与文件相关内容。

2. 书面作业

将Student对象(属性：int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

1. 字符流与文本文件：使用 PrintWriter(写)，BufferedReader(读)

1.1 生成的三个学生对象，使用PrintWriter的println方法写入student.txt，每行一个学生，学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码，出现学号)

1.2 生成文件大小多少？分析该文件大小

1.3 如果调用PrintWriter的println方法，但在后面不close。文件大小是多少？为什么？

2. 缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行)，然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度（只读取，不输出），使用哪种方法快？请详细分析原因？提示：可以使用junit4对比运行时间

2.2 将PrintWriter换成BufferedWriter，观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因

3. 字符编码

3.1 现有EncodeTest.txt 文件，该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码？为什么会有乱码？如何解决？(截图关键代码，出现学号)

3.2 编写一个方法convertGBK2UTF8(String src, String dst)，可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。

4. 字节流、二进制文件：DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码，尝试将三个学生对象的数据写入文件，然后从文件读出并显示。(截图关键代码，出现学号)

4.2 生成的文件有多大？分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了，为什么？

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data，分析数据在文件中是如何存储的。

4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码，出现学号) //参考ObjectStreamTest目录

5. 基本概念

编写`public static List<Student> readStudents(String fileName);`从fileName指定的文本文件中读取所有学生，并将其放入到一个List中。应该使用那些IO相关的类？说说你的选择理由。

6. 选做：RandomAccessFile

6.1 使用RandomAccessFile实现题目1.1。(截图关键代码，出现学号)

6.2 分析文件大小

7. 文件操作

—编写一个程序，可以根据指定目录和文件名，搜索该目录及子目录下的所有文件，如果没有找到指定文件名，则显示无匹配，否则将所有找到的文件名与文件夹名显示出来。

7.1 编写`public static void findFile(String path,String filename)`函数，以path指定的路径为根目录，在其目录与子目录下查找所有和filename相同的文件名，一旦找到就马上输出到控制台。(截图关键代码，出现学号)

7.2 加分点：使用队列、使用图形界面、使用Java NIO.2完成（任选1）

7.3 选做：实现删掉指定目录及其子目录下的所有空文件夹。

8. 正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式？尝试编程进行验证。(截图关键代码，出现学号)

8.2 选做：修改HrefMatch.java，尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

3. 码云及PTA

3.1. 码云代码提交记录

3.2 PTA以前未完成的题目

第12周-流与文件

1. 本周学习总结

1.1 以你喜欢的方式（思维导图或其他）归纳总结多流与文件相关内容。

2. 书面作业

将Student对象(属性：int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

1. 字符流与文本文件：使用 PrintWriter(写)，BufferedReader(读)

1.1 生成的三个学生对象，使用PrintWriter的println方法写入student.txt，每行一个学生，学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码，出现学号)

1.2 生成文件大小多少？分析该文件大小

1.3 如果调用PrintWriter的println方法，但在后面不close。文件大小是多少？为什么？

2. 缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行)，然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度（只读取，不输出），使用哪种方法快？请详细分析原因？提示：可以使用junit4对比运行时间

2.2 将PrintWriter换成BufferedWriter，观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因

3. 字符编码

3.1 现有EncodeTest.txt 文件，该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码？为什么会有乱码？如何解决？(截图关键代码，出现学号)

3.2 编写一个方法convertGBK2UTF8(String src, String dst)，可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。

4. 字节流、二进制文件：DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码，尝试将三个学生对象的数据写入文件，然后从文件读出并显示。(截图关键代码，出现学号)

4.2 生成的文件有多大？分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了，为什么？

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data，分析数据在文件中是如何存储的。

4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码，出现学号) //参考ObjectStreamTest目录

5. 基本概念

编写public static List<Student> readStudents(String fileName);从fileName指定的文本文件中读取所有学生，并将其放入到一个List中。应该使用那些IO相关的类？说说你的选择理由。

6. 选做：RandomAccessFile

6.1 使用RandomAccessFile实现题目1.1。(截图关键代码，出现学号)

6.2 分析文件大小

7. 文件操作

—编写一个程序，可以根据指定目录和文件名，搜索该目录及子目录下的所有文件，如果没有找到指定文件名，则显示无匹配，否则将所有找到的文件名与文件夹名显示出来。

7.1 编写public static void findFile(String path,String filename)函数，以path指定的路径为根目录，在其目录与子目录下查找所有和filename相同的文件名，一旦找到就马上输出到控制台。(截图关键代码，出现学号)

7.2 加分点：使用队列、使用图形界面、使用Java NIO.2完成（任选1）

7.3 选做：实现删掉指定目录及其子目录下的所有空文件夹。

8. 正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式？尝试编程进行验证。(截图关键代码，出现学号)

8.2 选做：修改HrefMatch.java，尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

3. 码云及PTA

3.1. 码云代码提交记录

3.2 PTA以前未完成的题目

编写`public static List<Student> readStudents(String fileName);`从fileName指定的文本文件中读取所有学生，并将其放入到一个List中。应该使用那些IO相关的类？说说你的选择理由。

7.1 编写`public static void findFile(String path,String filename)`函数，以path指定的路径为根目录，在其目录与子目录下查找所有和filename相同的文件名，一旦找到就马上输出到控制台。(截图关键代码，出现学号)