Python基础数据类型
Python3 中有六个标准的数据类型:
- Number(数字)
- String(字符串)
- List(列表)
- Tuple(元组)
- Set(集合)
- Dictionary(字典)
- 不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);
- 可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。
String(字符串)
字符串简述
str.__doc__:
str(object='') -> str
str(bytes_or_buffer[, encoding[, errors]]) -> str
Create a new string object from the given object. If encoding or
errors is specified, then the object must expose a data buffer
that will be decoded using the given encoding and error handler.
Otherwise, returns the result of object.__str__() (if defined)
or repr(object).
encoding defaults to sys.getdefaultencoding().
errors defaults to 'strict'.
- Python中的字符串用单引号 ' 或双引号 " 括起来,同时使用反斜杠 转义特殊字符。
- 使用r可以让反斜杠不发生转义。即使用r表示该字符串中所有的字符都是字符本身,不发生任何转义。
- 字符串的索引方式有两种,从前到后正序和逆序。
- Python中的字符串不能改变。即不支持由索引向某个位置赋值。
- 在Python中没有C/C++的单字符类型,一个字符认为是长度为1的字符串
字符串索引和切片
索引对应元素的位置
示例:
>>> string = 'hello world!' >>> print(string[1]) # 正序从0开始 到最后 第一个字符的索引值为 0 第二个为 1 e >>> string = 'hello world!' >>> string[0] 'h' >>> string[-1] # 逆序索引 最后一个索引值为 -1 从后往前 依次为 -1、-2、-3 … '!’ >>> string[0:6] #切片 string[起始索引:终止索引] 得到的是新的字符串 'hello ' >>> string[0:] #不写终止索引,即为取到最后 'hello world!' >>> string[4:] 'o world!' >>> string[:] # 都不写 就是全切片 从[:-1] 'hello world!' >>> string[::-1] # 终止索引后的参数为 步长 string[起始索引:终止索引:步长] 全切片 然后逆序 步长为负 从从后往前 每次取1个 '!dlrow olleh' >>> string[::2] # 步长为2 从前往后 隔一个取一个 'hlowrd'
注意:切片之后的结果是对原字符串的部分绝对拷贝(深拷贝),即是两个完全独立的对象,而不是浅拷贝或者对原对象的部分引用。
字符串的格式化
在Python中格式化迄今为止一共有四种方法 最早期的“%”方法,后来的format()方法,和3.6版本出现的f-string方法,以及模块处理方法
格式化之“%”占位符
用法:'***%s**'%(var) #var的值会填充到%s的位置 组成新的字符串
示例:
>>>”name :%s age :%d birthday :%s"%('monkey',20,'2010-10-20') >>>name :monkey age :20 birthday :2019-10-20
其中 %s 称为占位符,在字符串的后面紧跟 %和变量 如果占位符大于一个,要在%后以元组的形式传入替换的变量常用的占位符:
%s 字符串
%c 字符
%d 十进制(整数)
%i 整数
%u 无符号整数
%o 八进制整数
%x 十六进制整数
%X 十六进制整数大写
%e 浮点数格式1
%E 浮点数格式2
%f 浮点数格式3
%g 浮点数格式4
%G 浮点数格式5
%% 文字%
format()格式化
用法:
- 位置传入:"*** {} *** {} *** {}***".format(var1,var2,var3)
- 关键字传入:"*** {name} *** {name} *** {age}***".format(name = var1,age=var2)
- 下标传入:"*** {0[0]} *** {0[1]} *** {0[2]}***".format([var1,var2,var3])
示例:
>>>args = ["hello","world","!","I'm","Python”] >>>name = 'monkey' >>>age = 18 >>>gender = '男' >>>”name :{} age :{} ".format(name,age) # 位置传参 >>>name :monkey age :20 >>>'{0[0]} {0[1]} {0[2]} {0[3]} {0[4]}'.format(args) # 下标传参 >>>hello world ! I'm Python >>>"姓名:{name} 年龄 {age} 性别 {gender}".format(name = name,age = age,gender = gender) # 关键字传参 >>>姓名:monkey 年龄 18 性别 男
format格式说明:
{}中的格式限定符
字符串的常用方法
string = 'illoveTianTAnMen{}' >>>string.capitalize()) # 首字母大写 Illovetiantanmen{} >>>string.count('ia') # 统计string中 “ia”的个数 1 >>>string.center(30,'*') # 定长的输出30字符 string 居中 不够的两边补 ‘*’ '******illoveTianTAnMen{}******' >>>string.encode(encoding='utf-8',errors='strict') # 对string按’utf-8’编码成bytes类型 b'illoveTianTAnMen{}' >>>string.isalnum() # 判断string是否是纯数字和大小写字母的组合 False >>>string.isalpha() # 判断string是否是纯英文 False >>>string.isdidigit() # 判断string是否是纯数字 False >>>string.isupper() # 判断是否全部是大写 False >>>'Monkey '.strip() # 去掉全部的空格或回车 'Monkey' >>>'Monkeyli'.replace('l','L',1)) # 将第一个字符换成第二个字符第三参数为替换几个默认为全部替换 'MonkeyLi' >>>'1+2+3+4'.split('+') # 将字符串按照’元素‘分割成一个列表 ['1','2','3','4'] >>>'MonkeyLi'.swapcase() # 交换空间,将大写转化成小写小写转大写 'mONKEYlI' >>>'JIAJIA’.zfill(50) # 不够的位数填零 000000000000000000000000000000000000000000000JIAJIA
List(列表)
列表简述
list.__doc__():
Built-in mutable sequence.
If no argument is given, the constructor creates a new empty list.
The argument must be an iterable if specified.
列表是一个容器类型的可变类型,其中存放的是对象的引用而不是对象本身。当通过索引给列表赋值时只是讲对象的引用放入列表中对应的位置。
>>> name = 'monkey' >>> l = [name] >>> l[0] = 'Mike' >>> l ['Mike'] >>> l[0] 'Mike'
列表的索引和切片
列表的索引和切片同String类型一模一样,在Python中 所有的索引和切片操作只要是被支持的,那么都和字符串一模一样。
列表的常用方法
#!/usr/bin/env python3 #_*_ coding: utf-8 _*_ __author__ = "monkey" test_list1 = list(range(0,10,2)) test_list2 = list(range(1,10,2)) # 列表的增加 test_list2.append(7) # From documents" Append object to the end of the list." test_list2.insert(111,'inser_value') # 如果 输入的 index 值超过了列表本身 index的最大值 就把value 添加到最后 # 如果 输入的 index 值超过了列表本身 index的最小值 就把value 添加到最前面 test_list1.extend(test_list2) # From documents " Extend list by appending elements from the iterable. " # 列表的删除 test_list1.remove(1) # From documents "Remove first occurrence of value." # 删除 给定的元素 # 如果删除的元素不存在列表中 将会报 ValueError # 如果删除的元素在列表里由多个值,将会删除第一个匹配到的值 # ValueError: list.remove(x): x not in list tmp = test_list1.pop(2) # pop()方法将会返回被删除元素的 值 (接受一个index 删除这个元素,并返回这个元素!) # pop()方法 接受一个 index值 如果这个index不存在,将会抛出IndexError # 删除index指向的值 缺省为 -1 即默认的删除最后一个元素 # From documents:Raises IndexError if list is empty or index is out of range. test_list1.clear() # From documents " Remove all items from list. " # clear 方法将会彻底的清空列表,不会删除这个列表 区别于del方法 清除掉的是对象的数据 而不是对象的引用 # del test_list1 # 将会彻底的删除list 变量名的引用 不同于C的free 和 C++的delete 不会释放掉内存, # 而是解除了变量名"test_list1"对 list(range(0,10,2))对象的引用 并不是删除了对象 # list(range(0,10,2)) 对象仍然存在!例如 a = 1 c = a del a print(c) 仍然能 # 输出1 但是print(a)会报错:NameError: name 'a' is not defined # 这是引用被删除,而不是引用的对象本身被删除 # del test_list1[1] # del 不是list的专有的方法,但是能实现list的删除操作! # 此时del删除的是 # 列表的修改 test_list2[2] = 'new_value' #其他操作 test = test_list2.count(7)test = test_list2.index(7)# From documents " Return number of occurrences of value. " # -*-排序 test = [1,234,45,2,66,92] test.sort()# sort 方法按照ASCII码顺序进行排序:特殊字符>数字>大写>小写> # sort 方法 要求列表中的元素类型必须一致 # sort 方法的排序是列表本身 无返回值 # -*-反转 test.reverse() # reverse 方法是在原内存上修改的,而不是创建一个新的对象,即无返回值
三元运算和列表生成式
三元运算
a = 2 b = 4 >>>max = a if a>b else b # 经典三元表达式a b 比大小 >>>max 4 c = 6 >>>max = (a if a>b else b) if (a if a>b else b)>c else c # a b c 三个数比大小 >>>max 6 # 三元表达式用来 过滤数据 保护程序的稳定性 # 返回参数中所有数字或看起来像数字的和 def func(*args): return sum(int(tmp) if type(tmp) is int or tmp.isdigit() and int(tmp) else 0 for tmp in args) >>>func(1,'w3e','1',2,3,'24sdfsd','sfdsfsd')) 7
列表生成式
>>>num_list = [random.randint(1,20) for i in range(10)] # 生成一个包含10个随机数的列表 >>>num_list [10, 8, 1, 7, 17, 16, 19, 7, 2, 13] >>>["Element:{}".format(i) for i in num_list] # 生成20个“Elemen?”的列表 ['Element:10', 'Element:8', 'Element:1', 'Element:7', 'Element:17', 'Element:16', 'Element:19', 'Element:7', 'Element:2', 'Element:13'] >>>["AU{}".format(i) for i in num_list if i%2==0] # 带过滤器的生成式 ['AU10', 'AU8', 'AU16', 'AU2'] def deal(x): if x>10 and x%2==0: return True >>>["func{}".format(i) for i in num_list if deal(i)] # 带逻辑函数的生成式 ['func16']
Tuple(元组 )
元组简述
tuple.__doc__:
tuple() -> empty tuple
tuple(iterable) -> tuple initialized from iterable's items
If the argument is a tuple, the return value is the same object.
- 元组虽然说是只读列表,但是元组的操作还是很多的,例如 元组支持 + 运算(调用__add__方法)
- 元组也是一个容器对象
- 元组中每个元素都是具体的对象,或引用时对象和引用本身不可更改,但是 可以对元组元素 引用的对象 进行更改,进而 达成修改元组的目的
- 元组本身支持索引、切片、赋值
元组的常用方法
# 单纯的一个括号 就是一个 空的元组对象 >>>type(()) test_tuple = ('name',1,'age',2,1) # 元组 除魔术方法外 只有两个方法 index 和 counts # index # 对象不存在就会报错 >>>test_tuple.index(2,3) 3 # index方法最多可以接受三个参数 第一个为对象 第二个为 开始的索引值 第三个为 结束的索引值 >>>test_tuple.count(1) # 对象不存在 返回0 2 #tuple.__add__() >>>new_tuple = 1,1,1,1 >>>new_tuple_add = new_tuple.__add__(test_tuple) >>>new_tuple_add (1, 1, 1, 1, 'name', 1, 'age', 2, 1) >>>lst= [1,2,3] >>>mytuple=(1,2,lst) >>>mytuple[2][0] = 'new_element’ >>>mytuple (1, 2, ['new_element', 2, 3]) # 元组也是一个容器对象,当元组中的元素是一个可变对象的引用时,可以通过元组来更改这个可变对象。 # 元组的概念很简单,多是用来承接多个对象时候使用 # Python的返回值支持多返回,多赋值,就是借助于 元组 实现的 test = a,b,c = 1,2,3 print(test) print('(a,b,c):',id((a,b,c))) print('test:',id(test)) print('a:',id(a)) print('b:',id(b)) print('c:',id(c)) print('1:',id(1)) print('2:',id(2)) print('3:',id(3)) # 观察 内存地址 # test = a,b,c = 1,2,3 # 将 a,b,c 组成元组 并被 test引用,而后,a,b,c 分别成为对象1 ,2 ,3 的引用
Set(集合)
集合的概述
set.__doc__:
set() -> new empty set object
set(iterable) -> new set object
Build an unordered collection of unique elements.
集合(set)是一个无序的不重复元素序列,因此它不支持索引和切片操作。
可以使用大括号 { } 或者 set() 函数创建集合。
集合多用来做去重操作
注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
集合的常用方法
>>> lst = ['new_element', 2, 3] >>> myset = set() >>> myset.add('Python') # 如果元素已存在,则不进行任何操作。添加一个元素 >>> myset {'Python'} >>> myset.update(lst) # 参数可以是列表,元组,字典等 可以用一次添加多个元素(先被打散,然后添加)当字典被传入时,默认的只添加字典的键!而不会添加值 >>> myset {3, 'new_element', 'Python', 2} >>> myset.update({'name':18}) # 同时 可以接受多个参数 用 逗号 分割 >>> myset {3, 'new_element','name’, 'Python', 2} >>> myset.remove('name') # 元素存在就删除 不存在就 报错 错误类型 “KeyError” >>> myset {'new_element', 2, 3, 'Python'} >>> myset.discard('test') # 删除元素,不存在 不报错 >>> myset {'new_element', 2, 3, 'Python'} >>> myset.pop() # 随机的删除一个元素 并且将这个元素返回 (交互模式下 总是删除第一个元素) 'new_element' >>> myset {2, 3, 'Python'} >>> myset.clear() # 清空集合 >>>myset set()
集合中的几个注意:
当创建集合时 :
myset = set(('Python')) ---> 创建的是 {'Python'}
myset = set('Python') ---> 创建的是 {'o','n','t','y','P','h'} 而不是 期望的 {'Python'}
添加元素时:
set() s.update( {"C++"} ) 将字符串添加到集合中,有重复的会忽略
set() s.update("C++") 会将"C++"打散加入集合 得到的将不是期望的 将 "C++" 添加进集合
关于pop操作 当集合为list转化而来 每次pop都是首元素 (这样的观点是不正确的)
下面是一个验证代码
#!/usr/bin/env python3 # _*_ coding: utf-8 _*_ __author__ = "monkey" import random def test_func(): lst = [random.randint(1, 20) for i in range(20)] myset = set(lst) if lst[0] == myset.pop(): return True return False flag = True while test_func(): pass print("循环结束,pop()方法是随机的!")