字符编码和文件处理

字符编码和文件处理
文件处理

字符编码

一丶计算机基础

应用程序任何操作硬件的请求都需要向操作系统发起系统调用，然后由操作做系统去操作硬件

二丶文本编辑器存取文件的原理

1.打开了编辑器就打开了启动了一个进程，是在内存中的，所以，用编辑器编写的内容也都是存放与内存中的，断电后数据丢失。

2.要想永久保存，需要点击保存按钮：编辑器把内存的数据刷到了硬盘上。

3.在我们编写的一个py文件（没有执行），跟编写其他文件没有任何区别，都只是在编写一堆字符而已。

三丶Pyhthon解释器执行py文件的原理

~第一阶段：Python解释器启动，此时就相当于启动了一个文本编辑器。

~第二阶段：Python解释器相当于文本编辑器，去打test.py文件，从一ing盘上将test.py文件，从硬盘上将test.py文件内容读入到内中。

~第三阶段：Python解释器解释执行刚刚加载到内存中的test.py的代码。（ps：在该阶段，即真正执行代码时，才会识别python的语法，执行文件内代码，当执行到name= 'egon'时，会开辟内存空间存放字符串"egon"）

四丶 Python解释器与文件本编辑的异同

~相同点：Python解释器是解释执行文件内容的，因而Python解释器具备读py文件的功能，这一点与文本编辑器一样。

~不同点：文本编辑器将文件内容读入内存后，是为了显示或编辑，根本不会理会Python的语法，而Python解释器将文件内容读入内存后，可不是为了给你瞅一眼Python代码写的啥，而是为了执行Python 代码、会识别Python语法。

五丶编码

~Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，规定虽有字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，注：此处说的的是最少2个字节，可能更多.

~utf-8,是对Unicode编码的压缩和优化，他不再使用最少使用2个字节节，而是将所有的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存.

字符按照什么标准而编码的，就要按照什么标准解码。

用什么代码编写就用什么代码打开。

Python2和3字符编码的区别

python2默认的解释器编码ascii
python3默认的解释器编码utf-8

文件的三种打开方式

r:只读

f.read()

w:清空后写入(文件不存在自动创建)

f.weite()

a:追加(文件不存在自动创建)

f.write()

文本模式：t

二进制模式:b

t/b无法单独使用，只能和r/w/a一起使用

with管理文件上下文

with open() as f: # 自动关闭

pyinstaller的使用

pip instal pyinstaller

切换路径到文件夹（文件夹包含img.ico和test.py这两个文件）

pyinstaller -i img.ico -F test.py

文件的高级应用

打开的高级模式
1. r+:可读可写，指针文件末
2. w+：可读可写，清空文件（极力不推荐）
3. a+ :可读可写
文件的高级方法
1. seek: 单位字节
2. tell:单位字节
3. read(n)：单位字节
4. truancate : 单位字节
用 rb 模式
```
```python
# with open('test.py', 'rb') as fr:
    # fr.seek(1, 0)  # 0是从文件头开始,走1个字节
    # fr.seek(1, 1)  # 1是从当前位置开始,走1个字节
    # fr.seek(1, 2)  # 2是从文件末开始,走1个字节
    # fr.seek(0, 2)  # 2是从文件末开始,走1个字节  # 定位到文件末尾
    # print(f'fr.tell():{fr.tell()}')  # 告诉你当前指针的位置
    # print(fr.read())  # 中 --> xe4xb8xad


# with open('test.py', 'a+b') as fa:
#     fa.truncate(1)


with open('test.py', 'rt',encoding='utf8') as fr:
    print(fr.read(3))  # 3个字符
```
```
文件的还原方法

Local history

修改文件的两种方式

文件没有修改这一说，只有覆盖。
```
with open ('tset.py','r+',endcoding='utf8') as fr:
    fr.seek(3)
    fr.write('中')
    fr.flush()   #如果不加flush短暂的停留在内存中，然后再刷入硬盘。
			#如果加了会更快速刷入硬盘       
```
```
with open ('tset.py','r',encoding='utf8') as fr,
		open('tset_swap.py','w',encoding='utf8') as fw:
       data = fr.read()
  	   data = data.repalce('sb','dsb')
  	   fw.write(data)
  	   
  	   import os
  	   
  	   os.remove('tset.py')
  	   os.remove('tset_swap.py','test.py')
```
相关阅读:
神盾局第4季
 PAT 1053. Path of Equal Weight (30)
PAT 1052. Linked List Sorting (25)
PAT 1051. Pop Sequence (25)
PAT-1049. Counting Ones (30)
PAT-1047. Student List for Course (25)
PAT 1045. Favorite Color Stripe (30)
每日编程-20170308
技术博客的第一篇文章
 《C语言》while语句和dowhie语句（7）
原文地址：https://www.cnblogs.com/shiqizz/p/11355017.html

字符编码和文件处理

字符编码

一丶计算机基础

二丶文本编辑器存取文件的原理

三丶Pyhthon解释器执行py文件的原理

四丶 Python解释器与文件本编辑的异同

五丶编码

Python2和3字符编码的区别

文件的三种打开方式

with管理文件上下文

pyinstaller的使用

文件的高级应用

打开的高级模式

文件的高级方法

文件的还原方法

修改文件的两种方式