04-Python之文件、异常和模块

04-Python之文件、异常和模块
1、掌握外部文件读取和存储各类方法。
2、掌握异常的处理办法。
3、掌握外部模块导入和调用的方法。

实际应用中，我们绝大数的数据都是通过文件的交互完成的。

1.文件的读写

1.1 文件的打开
- 文件的打开通用格式
with open("文件路径","打开模式",encoding = "操作文件的字符编码") as f: # 对文件进行相应的读写操作
- ①文件路径：程序与文件在同一文件夹，可简化成文件名
- ②打开模式：
  - "r" 只读模式，如文件不存在，报错
  - "w" 覆盖写模式，若文件不存在，则创建；若文件存在，则完全覆盖原文件
  - "x" 创建写模式，若文件存在，则报错，若不存在则创建
  - "a" 追加写模式，若文件不存在，则创建，若存在则在原文件后追加内容
  - "b" 二进制文件模式，不能淡入使用，需要配合使用如"rb" "wb" "ab",该模式不需指定encoding
  - "t" 文本文件模式，默认值，需配合使用如"rt" "wt" "at"
  - "+" 与"r" "w" "x" "a"配合使用，在原功能基础上，增加读写功能
  - 打开模式缺省，默认为只读模式
- ③字符编码：
  - utf-8:万国码，包含全世界所有国家需要用到的字符
  - gbk:中文编码，专门解决中文编码问题，Windows系统，如果缺省，则默认gbk(所在区域的编码)，建议除处理二进制文件，建议不要缺省encoding
  使用with块的好处：执行完毕后，自动对文件进行close操作
```
with open("E:ipthon测试文件.txt","r",encoding="gbk") as f:  # 打开文件
    text = f. read()    # 读取文件
    print(text)
```
1.2 文件的读取
- 读取整个内容——f.read()
- 解码模式不匹配，报错
- 逐行进行读取——f.readline()
- 读入所有行，以每行为元素形成一个列表——f.readlines()
- 图片是二进制文件
  注意：当文件比较大时，read()和readlines()占用内存过大，不建议使用，推荐使用如下方式
```
with open("三国演义片头曲_gbk.txt","r",enconding="gbk") as f:
        for text in f:                # f本身就是一个可迭代对象，每次迭代读取一行内容
            print(text)
```
1.3 文件的写入
- 向文件写入一个字符串或字符流(二进制)——f.write()
- 追加模式——"a"
- 将一个元素为字符串的列表整体写入文件——f.writelines()
```
ls = ["春天刮着风", "秋天下着雨", "春风秋雨多少海誓山盟随风远去"]
with open("恋雨1980.txt", "w", encoding="utf-8") as f:
    f.writelines(ls)
```
1.4 既读又写
- "r+":如果文件名不存在，则报错；文件指针在文件最开始，需要把指针移动到末尾才能开始写，否则会覆盖前面内容
```
with open("浪淘沙_北戴河.txt", "r+", encoding="utf-8") as f:
#    for line in f:
#        print(line)  #遍历文件f，指针达到结尾
    f.seek(0, 2) # 或者可以将指针移到末尾f.seek(偏移字节数,位置(0:开始;1:当前位置;2:结尾))
    text = ["萧瑟秋风今又是，
", "换了人间，
"]
    f.writelines(text)
```
- "w+"：若文件不存在，则创建；若文件存在，会立刻清空原内容
```
with open("浪淘沙_北戴河.txt", "w+", encoding="utf-8") as f:
    text = ["萧瑟秋风今又是，
", "换了人间，
"] # 清空原内容
    f.writelines(text)
    f.seek(0, 0)  # 指针移到开始
    print(f.read())
```
- "a+"：若文件不存在，则创建；指针在末尾，添加新内容，不会清空原内容
2 数据的存储与读取

通用的数据格式，可以在不同语言中加载和存储，主要了解数据存储结构csv和json

2.1 csv格式

csv格式由逗号将数据分开的字符序列，可以由excel打开
- 读取
```
with open("成绩.csv","r",encoding="gbk") as f:
    ls = []
    for line in f:
        ls.append(line.strip("
").split(",")) #去掉每行的换行符，并用","进行分割返回列表
for res in ls:
    print(res)
```
- 写入
```
ls = [["编号", "数学成绩", "语文成绩"], ['1', '100', '98'], ['3', '97', '95']]
with open("score.csv","w",encoding="gbk") as f:            # encoding="utf-8"中文出现乱码
    for row in ls:
        f.write(",".join(row)+"
")      # 逐行写入.用逗号组合成字符串形式
```
也可借助csv模块完成上述操作

2.2 json格式

常用来存储字典格式
- 写入——dump()
```
scores = {"Petter": {"math": 96, "pysics": 98},
          "Paul": {"math": 92, "pysics": 99},
          "Mary": {"math": 98, "pysics": 97}} 
with open("score.json", "w", encoding="utf-8") as f:
    # indent:表示字符串换行+缩进 ensure_ascii=False 显示中文
    json.dump(scores, f, indent=4, ensure_ascii=False)
```
- 读取——load()
```
with open("score.json", "r", encoding="utf-8") as f:
    scores = json.load(f)   # 加载整个对象
    for k, v in scores.item():
        print(k, v)
```
3 异常处理

3.1 常见异常的产生
- 除0异常——ZeroDivisionError
- 找不到可读文件——FileNotFoundError
- 值错误——ValueError:传入一个调用者不期望的值，即使这个值的类型是正确的
- 类型错误——TypeError:传入对象类型与要求不符
- 索引错误——IndexError:下标超出序列边界
- 其他常见的异常类型：NameError使用一个还未被赋予对象的变量KeyError试图访问字典里不存在的键
当异常发生的时候，如果不预先设定处理方法，程序就会中断

3.2 异常的处理

提高程序的稳定性和可靠行

try_except

如果try内代码块顺利执行，except不被触发；如果try内代码块发生错误，触发except执行except内代码块
- 单分支
```
x = 10
y = 0
try:
    z = x/y
except ZeroDivisionError:
    print("0不可以被除")
```
- 多分支
```
d = {"name": "大杰仔"}
try:
    d["age"]
except NameError:
    print("变量名不存在")
except IndexError:
    print("索引超出界限")
except KeyError:
    print("键不存在")
```
- 万能异常 Exception(所有错误的老祖宗)
- 捕获异常的值 as
```
ls = []
d = {"name": "大杰仔"}
try:
    y = x
    ls[3]
    d["age"]
except Exception as e:
    print(e)
```
- try_except_else:如果try模块执行，则else模块也会执行，也可将else看做try成功的额外奖赏
- try_except_finally:不论try模块是否执行，finally都会被执行
4 模块

已经被封装好，无需自己再"造轮子"，声明导入后拿来即用

4.1 广义模块分类
- ①Python内置：时间库time；随机库random；容器数据类型collection；迭代器函数itertools
- ②第三方库：数据分析numpy、pandas；数据可视化matplotlib；机器学习scikit-learn；深度学习Tensorflow
- ③自定义文件：文件夹内有多个py文件，再加一个__init__.py文件(内容可为空)
4.2 模块的导入
- 导入整个模块——import 模块名
  - 调用方式：模块名.函数名或类名
- 从模块中导入类或函数——from 模块 import 类名或函数名
  - 调用方式：函数名或类名
- 导入模块中所有的类和函数—— from 模块 import *
4.3 模块的查找路径

模块搜索查找顺序：
- ①内存中已经加载的模块
- ②内置模块：Python启动时，解释器会默认加载一些modules 存放在sys.modules(包含一个由当前载入(完整且成功导入)到解释器的模块组成的字典，模块名作为域，他们的位置作为值)中
```
import sys
print(len(sys.modules))
print("math" in sys.modules)
print("numpy" in sys.modules)
for k,v in list(sys.modules.items())[:5]:
    print(k, ":", v)
"""
875
True
True
sys : <module 'sys' (built-in)>
builtins : <module 'builtins' (built-in)>
_frozen_importlib : <module 'importlib._bootstrap' (frozen)>
_imp : <module '_imp' (built-in)>
_thread : <module '_thread' (built-in)>
"""
```
- ③sys.path路径中包含的模块：sys.path的第一个路径是当前执行文件所在的文件夹；若需将不在该文件夹内的模块导入，需要将模块的路径添加到sys.path
```
import sys
sys.path.append("C:\User\ibm\Desktop")    #注意是双斜杠
import fun3
fun3.f3()
```
相关阅读:
分治6--循环比赛日程表
 分治5--一元三次方程求解
 分治4--快速排序
 分治3--黑白棋子的移动
 分治2--取余运算
 分治1--二分查找
 贪心6--整数区间
 贪心5--活动选择
 贪心4--拦截导弹
 贪心3--删数问题
原文地址：https://www.cnblogs.com/lyszyl/p/12266917.html

04-Python之文件、异常和模块

1.文件的读写

1.1 文件的打开

1.2 文件的读取

1.3 文件的写入

1.4 既读又写

2 数据的存储与读取

2.1 csv格式

2.2 json格式

3 异常处理

3.1 常见异常的产生

3.2 异常的处理

try_except

4 模块

4.1 广义模块分类

4.2 模块的导入

4.3 模块的查找路径