第三章 Python变量和数据类型
3-7.Unicode字符串
- 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。
- 最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母 A 的编码是65,小写字母 z 的编码是122。
- 如果要表示中文,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。
- 类似的,日文和韩文等其他语言也有这个问题。为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
- Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。
- 因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。
- Python在后来添加了对Unicode的支持,以Unicode表示的字符串用u'...'表示。
- Unicode字符串除了多了一个 u 之外,与普通字符串没啥区别,转义字符和多行表示法仍然有效。
- 如果中文字符串在Python环境下遇到 UnicodeDecodeError,这是因为.py文件保存的格式有问题。可以在第一行添加注释
# -*- coding: utf-8 -*-
目的是告诉Python解释器,用UTF-8编码读取源代码。然后用编辑器写.py文件时选择UTF-8格式保存。
3-8.整数和浮点数
- Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。
- Python的整数运算结果仍然是整数,浮点数运算结果仍然是浮点,整数和浮点数混合运算的结果是浮点数。
- 整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如0.1 换成二进制表示就是无限循环小数。
3-9.布尔类型
- 布尔类型还可以与其他数据类型做 and、or和not运算。
- Python把0、空字符串''和None看成 False,其他数值和非空字符串都看成 True。
短路计算
* 1.在计算 a and b 时,如果 a 是 False,则根据与运算法则,整个结果必定为 False,因此返回 a;如果 a 是 True,则整个计算结果必定取决与 b,因此返回 b。
* 2.在计算 a or b 时,如果 a 是 True,则根据或运算法则,整个计算结果必定为 True,因此返回 a;如果 a 是 False,则整个计算结果必定取决于 b,因此返回 b。
##### 代码
a = True
print a and 'a=T' or 'a=F'
##### 结果
写在后面
来自慕课网之Python入门。