内存中使用unicode编码
>>> 'u4e2du6587' '中文' >>> x=b'ABC'
用指定编码方式编码字符串
>>> 'ABC'.encode('ascii') b'ABC'
>>> '中文'.encode('utf-8')
b'xe4xb8xadxe6x96x87'
>>> '中文A'.encode('utf-8') b'xe4xb8xadxe6x96x87A'
注:
①b'...'里一个字符代表一个字节
②b'...A...'里面的A表示一个字节,代表assci码中A的编码
将字节转成字符串
>>> b'ABC'.decode('ascii') 'ABC' >>> b'xe4xb8xadxe6x96x87'.decode('utf-8') '中文'
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行告诉Linux系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
申明了UTF-8编码并不意味着你的.py
文件就是UTF-8编码的,必须并且要确保文本编辑器正在使用UTF-8编码: