1. 字符串基本特点
很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能更好编程。但实际上,大多数程序员打交道最多的是 “ 字符串 ” 而不是 “ 数字 ”。因为,编程时用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
字符串的本质是:字符序列。 Python 的字符串时不可变的,我们无法对原字符串做任何修改。但是可以将字符串的一部分复制到新创建的字符串,从而达到 “ 看起来修改 ” 的效果。
Python 不支持单字符类型,单字符也是作为一个字符串使用的。
2. 字符串的编码
Python 3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python 3 的字符默认就是 16 位 Unicode 编码,ASCII 码是Unicode 编码的子集。
使用内置函数 ord() 可以把字符转换成对应的 Unicode 码;
使用内置函数 chr() 可以把十进制数字转换成对应的字符。
3. 引号创建字符串
字符串有 2类共 4 种表示方法
一类是使用一对单引号或上引号创建字符串。例如 :a = 'abc' ; b = "six"
使用两种引号的好处是可以创建本身就包含的字符串,而不用使用转移字符。
一类是使用一对连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:、
4. 空字符串和 len() 函数
Python 允许空字符串的存在,不包含任何字符且长度为 0 。例如:
len() 用于计算字符串含有多少字符。例如:
5. 转义字符
我们可以使用 “ + 特殊字符”,实现某些难以用字符表示的效果。转义字符有如下图所示:
【操作】测试转义字符的使用
6. 字符串拼接
1. 可以使用 + 将多个字符串拼接起来。例如 : 'aa' + 'bb' ==> 'aabb'
(1) 如果 + 两边都是字符串,则拼接。
(2) 如果 + 两边都是数字,则加法运算。
(3) 如果 + 两边类型不同,则抛出异常。
2. 可以将多个字面字符串直接放到一起实现拼接。例如 : 'aa' 'bb' ==> 'aabb'
【操作】字符串拼接操作
7. 字符串复制
使用 * 可以实现字符串复制
【操作】字符串复制
8. 不换行打印
我们使用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数 end = '任意字符串' 。实现末尾添加任何内容:
【操作】
1 print('six',end='') 2 print('six',end='##') 3 print('six') 4 #输出结果 sixsix##six
9. 从控制台读取字符串
我们可以使用 input() 从控制台读取键盘输入的内容。
10. str() 实现数字转型字符串
str()可以帮助我们将其他数据类型转换成字符串。例如:
str(5.20) ==> '5.20' str(3.14e2) ==> '314.0' str(True) ==> 'True'
当我们调用 print() 函数时,解释器自动调用了 str() 将非字符串的对象转成了字符串。
11. 使用 [] 提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加 [] , 在 [] 里面指定偏移量,可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是 0 ,第二个偏移量是 1,以此类推。直到 len(str)-1为止。
反向搜索:
最右侧第一个字符,偏移量是 -1 ,倒数第二个偏移量是 -2,以此类推。直到 -len(str) 为止。
12. replace() 实现字符串替换
字符串时 "不可改变" 的,我们通过 [] 可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中某个字符,会出现如下错误:
字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串。内存图如下:
12. 字符串切片 slice 操作
切片 slice 操作可以让我么快速的提取子字符串。标准格式为:
[起始偏移量 start : 终止偏移量 end : 步长 step]
<字符串>[M:N] , M 缺失表示至开头,N 缺失表示至结尾
典型操作(三个量为正数的情况)如下:
其他操作(三个量为负数)的情况:
13. split() 分割和 join() 合并
split() 可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。
join() 的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。
示例代码如下:
拼接字符串要点:
使用字符串拼接符 + ,会生成新的字符串对象,因此不推荐使用 + 来拼接字符串。推荐使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
【操作】测试 + 拼接和 join() ,不同的效率
1 import time 2 time1_start = time.time() #起始时刻 3 a = "" 4 for i in range(5000000): 5 a = a + 'sit' 6 time1_end = time.time() #终止时刻 7 print("运算时间:"+ str(time1_end-time1_start)) 8 9 time2_start = time.time() #起始时刻 10 li = [] 11 for i in range(5000000): 12 li.append('six') 13 a ="".join(li) 14 time2_end = time.time() #终止时刻 15 print("运算时间:"+ str(time2_end-time2_start)) 16 #运算时间:20.442362070083618 17 #运算时间:0.9095373153686523
14. 字符串驻留机制和字符串比较
字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制。
15. 字符串比较和同一性
我们可以直接使用 == ,!= 对字符串进行比较,是否含有相同的字符。
我们使用 is / not is , 判断两个对象是否是同一个对象。比较的是对象的地址,即 id(obj1) 是否和 id(obj2) 相等。
16. 字符串操作符
in / not in 关键字,判断某个字符(子字符串)是否存在于字符串中。
17. 字符串常用方法汇总
17.1 常用查找方法
【操作】
a='''我是oito,今年20岁,我在阿里上班。我是一个高级Python工程师'''
17.2 去除收尾信息
我们可以通过 strip() 去除字符串首尾指定信息。通过 lstrip() 去除字符串左边指定信息,rstrip() 去除字符串右边指定信息。
Python strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
17.3 大小写转换
【操作】
a = "hello world,PYTHON"