ASCII,unicode与utf-8的区别:
ASCII码只有127个字母被编到计算机中,无法处理中文,ASCII 编码是 1 个字节
unicode是为了解决因各国标准不同而产生乱码的问题。unicode把所有的语言都统一到一套编码里,解决乱码问题,大多数编程语言都支持unicode,Unicode 编码通常是 2 个字节
utf-8是‘可变长编码’,节省空间。而且ASCII编码实际上可以被看成是utf-8的一部分,所以大量支持ASCII编码的历史遗留软件可以在utf-8下继续工作
字符编码工作方式:
在计算机内存中,统一使用 Unicode 编码,当需要保存到硬盘或者需要传输的时候,就转换为 UTF-8 编码。