代码如下:
#include <stdio.h> #include <string.h> int main() { char *in_utf8 = "你在干吗呢"; char *in_gb2312 = "安装超人"; char *in_eng = "English man"; printf("len1=%d, len2=%d, len3=%d\n", strlen(in_utf8), strlen(in_gb2312), strlen(in_eng)); return 0; }
在windows下,运行结果为:len1=10, len2=8, len3=11
在linux下,结果为:len1=15, len2=12, len3=11
为何会有这样的差别呢??
可以看得出,对于英文,长度都是一样的。但对于中文,在windows下,每个汉字占2字节,在linux却是占3字节。
我猜测:因为在linux下默认的字符编码为UTF-8的,所以每个汉字占3个字节。但是在windows,系统的编码方式是简体中文,所以只占2个字节。