摘自https://zhuanlan.zhihu.com/p/27012967
5.
在Unicode Technical Report (UTR统一码技术报告) #17《UNICODE CHARACTER ENCODING MODEL》中,现代字符编码模型分为了5个层次,并引入了更多的概念术语来描述(下面所涉及到的一些全新的概念术语,这里只做简介,暂时不作解释,详见后文):
- 第1层 抽象字符表ACR(Abstract Character Repertoire):明确字符的范围(即确定支持哪些字符)
- 第2层 编号字符集CCS(Coded Character Set):用数字编号表示字符(即用数字给抽象字符表ACR中的字符进行编号)
- 第3层 字符编码方式CEF(Character Encoding Form):将字符编号编码为逻辑上的码元序列(即逻辑字符编码)
- 第4层 字符编码模式CES(Character Encoding Scheme):将逻辑上的码元序列映射为物理上的字节序列(即物理字符编码)
- 第5层 传输编码语法TES(Transfer Encoding Syntax):将字节序列作进一步的适应性编码处理