简介:介绍什么是字符串,以及常见的字符串编码
字符串的定义:字符串是由数字、字母、符号组成的一串字符。它是编程语言中表示文本的数据类型。
在Python中,使用双引号、单引号、三引号括起来的一系列字符就是字符串,无论是使用单引号还是
双
引号,都必须成对出现
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制
数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编
码";反之,将存储在计算机中的二进制数解析显示出来,称为"解码
字符常见的字符集有哪些?
- ASCII
计算机一开始是外国人发明的,他们日常使用就是一些日常符号加上大小写的字母、数字。所以在
字符
集的设计上,也只兼容这样的一些字符。
- GBXXXX
ACSII码那玩意只能存英文,那国人咋办?弄一套自己中文编码呗。所以GB2312编码规则出现,
它所收
录的汉字已经覆盖中国大陆99.75%的使用频率。对于人名、古汉语等方面出现的罕用字,
GB2312不能
处理,所以有了GBK编码
- Unicode
主要的编码方式有:UTF-32、UTF-16、UTF-8(最常用)
Python 3版本中,所有的字符串都是使用Unicode编码的字符串序列
字符串的特性:不可变,如果改变字符串的值,相当于重新分配了空间