复习:
1.深浅拷贝
值拷贝:直接赋值 = 号, 列表中的任何值发生改变,第二个中的值都会随之改变
浅拷贝:通过copy()方法 ls2 = ls.copy(),第一个中存放的值的地址没有改变, 但内部的值发生改变,第二个会随之改变
深拷贝:通过deepcopy()方法 ls3 = deepcopy(ls),第一个中存放的值发生任何改变,第二个都不会随之改变
2.元祖类型
tuple()
元组:可以理解为不可变的列表
# 1.值可以为任意类型
# 2.可以存放多个值 - 可以进行成员运算
# 3.可以存放重复的值 - 可以计算成员出现的次数
# 4.有序存储 - 可以通过索引取值,可以切片
3.字典类型
# 容器(集合):存放多个值的变量
# 单列容器(系统中的单列容器很多):list | tuple
# 双列容器(map):只有dict,存放数据 成对出现,dict存放数据采用 key-value键值对方式
# 字典中的key可以为什么类型:key必须为不可变类型
# -- key是取value的唯一依据,key一旦被确定,就需要唯一确定(不能被改变)
# 字典中的value可以为什么类型:value可以为任意类型
# -- value是用来存放世间所有存在的数据
字典的增删改查:(详见day06的博客)
update(dict). 将新的字典添加到原字典中,如果原字典已经存在,则不做改变,原字典中不存在,则添加。
若已存在原字典的key,则更新value
# dic = {'a':1,'b':2}
# dic2={'d':4,'e':6}
# dic.update(dic2) # 更新字典,如果第一个列表中不存在第二个列表中的key,则添加到新列表中
# print(dic) # 输出结果为{'a': 1, 'b': 2, 'd': 4, 'e': 6}
# dic = {'a':1,'b':2}
# dic2={'d':4,'b':6}
# dic.update(dic2) # 如果第一个列表中存在第二个列表的key,则会更新value,如果key和value都相同,则不做任何改变
# print(dic)
setdefault(key,value):若key已经存在,不做改变,若不存在key,则添加到字典中
# dic = {'a':1,'b':2}
# dic.setdefault('c',3) # 添加,将key和value添加到列表,如果key已存在,则不做任何改变
# print(dic) # 输出结果{'a': 1, 'b': 2, 'c': 3}
get(key,default):按照key查询字典中是否存在,若存在,返回value,若不存在,返回None
# dic = {'a':1,'b':2}
# print(dic.get('a')) # 查询字典中 key,如果存在,则返回值 此处返还值 1
# print(dic.get('c')) # 如果不存在,则返回None 此处返还 None
pop(key):根据key值删除值,有返回值。若key存在,则返回value,若不存在,则报错
pop(keyitem):随机删除字典中的值
dic = {'a':3,'b':1,'c':2}
# dic.popitem() # 随机删除一个key,一般是删除末尾,如果删除的字典为空字典,则会报错
# print(dic) # 输出结果{'a': 3, 'b': 1}
循环: for k,v in dic.items(): # 使用两个对应关系来接受字典循环的key与value
dic = {'a':3,'b':1,'c':2}
print(dic.items()) # 因为字典不可被for循环,可以使用dic.item() 来使字典变成一个列表类型,而内部的key与value变成可遍历的(键, 值) 元组数组
# 输出结果为 dict_items([('a', 3), ('b', 1), ('c', 2)])
集合是不可变类型,可增可增,无序无索引无key,不能取值不能改值,可以通过for循环取值,取值的顺序不确定
特点:不能存放重复的数据,故可以用来去重
1 .数据类型的相互转换
1.1)那些类型可以转换为数字
1.2)数字转换字符串
1.3)字符串与列表的相互转换 ******
2 . 字符编码
2.1)应用程序打开的三个步骤:
2.1.1)打开应用程序
2.1.2)将数据加载到内存中
2.1.3)CPU将内存中的数据直接翻译成字符显示给用户
2.2)python解释器打开的三个步骤:
2.2.1)打开python解释器
2.2.2)将数据加载到内存中
2.2.3)CPU将内存中的数据执行结果显示给用户,如何解释执行不能通过,错误信息提供给用户
2.3)乱码:
存储的编码格式与取出的编码格式不一致,就会出现乱码,为了
2.4)字符编码:
2.4.1) 电脑只能识别高低电频对应的 0 ,1,所以就诞生了编码表
2.4.2)ASCII 表:英文字母,英文符号,数字与机器能识别的字符的对应关系,一个字母或符号代表一个字节,8个二进制位就能存放所有的对应关系
2.4.3)GBK:中文与机器能识别的字符所对应关系的表格,它完全兼容ASCII表,而他的中文是由2个字节来表示,16个二进制能存放所有的汉字,和ASCII码的对应关系
2.4.4)Unicode(万国码):世间常用国家的常用字符,与机器能识别的字符的对应关系表
2.4)转码:
2.4.1)Unicode存在汉字与二进制对应关系,GBK也存在汉字与二进制对应关系,它将GBK(或者其他国家定义的字符编码)存放的数据转存到Unicode数据中,只是存放数据采用字节数的长度不一致,UTF-8与UTF-16是Unicode编码表的两种体现方式
UTF-8:以1个字节存放英文字母,以3或者6个字节来存放汉字,在英文数据过多时,他会更省空间,用来传输效率更高,所以在计算机中,硬盘与内存需要数据传输,所以都采用UTF-8进行传输,而且由的汉字很复杂,所以UTF-8也可以存放更多的汉字。
而UTF-16,所有支持的符号或者字符都是采用2个字节来存放,读存数据采用定长,不用计算,读存效率高,而内存需要高速读写,所有采用UTF-16的编码
所以我们存储与读取,一定要同意编码!