ANSI中的字符采用8bit,而UNICODE中的字符采用16bit。8bit的ANSI编码只能表示256种字符。UNICODE可表示成千上万个字符。
typedef unsigned short wchar_t;
例如,如果想要创建一个缓存,用于存放最多为99 个字符的Unicode 字符串和一个结尾为零的字符,可以使用下面这个语句:har_t szBuffer[100];
标准的ANSI C 字符串函数和它们的等价Unicode函数
char * strcat(char *,const char *);
wchar_t * wcscat(wchar_t *,const wchar_t *);
char * strchr(const char *,int);
wchar_t * wcschr(const wchar_t *,wchar_t);
int strcmp(const char *,const char *);
int wcscmp(const wchar_t *,const wchar_t *);
char * strcpy(char *,const char *);
wchar_t * wcscpy(wchar_t *,const wchar_t *);
size_t strlen(const char *);
size_t wcslen(const wchar_t *);
所有的Unicode函数均以wcs开头,wcs是宽字符串的英文缩写。若要调用Unicode函数,只需用前缀wcs来取代ANSI字符串函数的前缀str 即可
创建同时为ANSI和Unicode进行编译的单个源代码文件。若要建立双重功能,必须包含TChar.h文件
TChar.h 文件的唯一作用是帮助创建ANSI/Unicode 通用源代码文件。它包含你应该用在源代码中的一组宏,而不应该直接调用str 函数或者wcs函数。如果在编译源代码文件时定义了UNICODE,这些宏就会引用wcs这组函数。如果没有定义_UNICODE,那么这些宏将引用str这组宏。
_TEXT宏作为,在写ANSI/Unicode 通用源代码文件时对字符串选进是否加以Unicode字符串来编译
Windows定义的Unicode数据类型
数据类型 说明
WCHAR Unicode字符
PWSTR 指向Unicode字符串的指针
PCWSTR 指向一个恒定的Unicode字符串的指针
在经典的操作系统函数样式中,操作系统字符串函数名既包含大写字母,也包含小写字母,它的形式类似这个样子:StrCat 、StrChr、StrCmp 和StrCpy 等。若要使用这些函数,必须加上ShlWApi.h 头文件。这些字符串函数既有ANSI版本,也有Unicode版本.由于这些函数属于操作系统函数,因此,当创建应用程序时,如果定义了UNICODE(不带前置下划线),那么它们的符号将扩展为宽字符版本。
成为符合ANSI和Unicode的应用程序
即使你不打算立即使用Unicode ,最好也应该着手将你的应用程序转换成符合Unicode的应用程序。下面是应该遵循的一些基本原则:
将文本串视为字符数组,而不是chars数组或字节数组。
将通用数据类型(如TCHAR和PTSTR)用于文本字符和字符串。
将显式数据类型(如BYTE 和PBYTE)用于字节、字节指针和数据缓存。
将TEXT 宏用于原义字符和字符串。
执行全局性替换(例如用PTSTR 替换PSTR )。
修改字符串运算问题。例如函数通常希望你在字符中传递一个缓存的大小,而不是字节。
这意味着你不应该传递sizeof (szBuffer ) ,而应该传递sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要为字符串分配一个内存块,并且拥有该字符串中的字符数目,那么请记住要按字节来分配内存。这就是说,应该调用malloc(nCharacters *sizeof(TCHAR)),而不是调用malloc(nCharacters)。在上面所说的所有原则中,这是最难记住的一条原则,如果操作错误,编译器将不发出任何警告。
ANSI 和 UNICODE 的函数对应表
ANSI UNICODE 通用
(char.h) (wchar.h) (tchar.h)
char wchar_t TCHAR
char * wchar_t * PTCHAR (PTSTR,LPWSTR,PWSTR,WCHAR)
printf wprintf _tprintf
scanf wscanf _tscanf
atoi _wtoi _ttoi
atol _wtol _ttol
itoa _itow _itot
ltoa _ltow _ltot
atof _wtof _tstof
strlen wcslen _tcslen
strcat wcscat _tcscat
strcpy wcscpy _tcscpy
strcmp wcscmp _tcscmp
在Windows程序设计.chm,WINDOWS核心编程.chm都有介绍