字符编码(Character encoding),是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。
常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套计算机编码系统。它主要用于显示现代英语。ASCII的局限在于只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号,因此只能用于显示现代美国英语。
为使计算机支持更多语言,通常使用 0x80~0xFF 范围的多个字节来表示 1 个字符。不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、Big5、Shift_JIS 等各自的编码标准。这些使用 1 至 4 个字节来代表一个字符的各种延伸ASCII编码方式,称为 ANSI 编码。
为了解决满足跨语言、跨平台进行文本转换、处理,要求现在的软件系统大多采用Unicode。Unicode是字符集,UTF-32/ UTF-16/ UTF-8是三种字符编码方案。
问题:
1 Linux 中如何查看ASCII?
答:man ascii
2 在遇到乱码的时候该怎么办?
答:用文本编辑器更改编码。
扩展阅读:
ASCII艺术
写作提纲:
什么是字符编码?
字符编码的目的?
常用的字符编码?
参考文献:
[1] wiki. ASCII. https://zh.wikipedia.org/wiki/ASCII. 2015,08,29.
[2] 吴秦(Tyler). 字符集和字符编码(Charset & Encoding).
[3] 阮一峰. 字符编码笔记:ASCII,Unicode和UTF-8. http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html.
[4] wiki. 字符编码. https://zh.wikipedia.org/wiki/%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81.
[5] 十分钟搞清字符集和字符编码. http://cenalulu.github.io/linux/character-encoding/.
[6] 百度百科. 字符编码.