VC中使用Unicode的一些列问题
VC6.0中默认的是多字节编码,而自从VS2005以后都是默认的Unicode字符编码格式了。至于ANSI, MBCS(多字节编码)和UNICODE之间的区别可以百度一下。下面的一篇博文写的也比较详细:
http://www.tongji.net/index.php/uid-160994-action-viewspace-itemid-12415
大致说来:我们用C语言写的控制台程序里面大多都是多自己编码,其中英文字母是一个字节,中文是两个字节。而Unicode编码中英文和中文全是占两个字节。VC中用Unicode编码的一个好处就是MFC做的界面可以是操作系统的界面了(VC2008中还可以用更多的界面)。改用多字节编码的时候界面就是VC6.0里面那种98风格的界面了。这只是一个原因,更重要的原因是统一标准的问题,所以使用Unicode还是必要的。
之前用 VC2008写程序的时候,在字符串前加_T就行了,例如:_T("呵呵呵!")就表示编译时看情况将字符串"呵呵呵!"转化为Unicode或者多字符编码格式。而L"呵呵呵!"表示将字符串"呵呵呵!"转换成Unicode。如今出现一个比较麻烦的问题,就是将Unicode的CString转换成 char[],主要是socket编程中sendto函数中遇到的。
参考一篇博文:http://cj0000.itpub.net/post/4086/483973
最后的代码如下:
1 //------------------------- 全局函数--------------------------- 2 3 //将Unicode的 CString转换为多字节字符数组 4 string WideCharToMultiChar(wstring str) 5 { 6 string return_value; 7 //获取缓冲区的大小,并申请空间,缓冲区大小是按字节计算的 8 int len = WideCharToMultiByte(CP_ACP, 0, str.c_str(), str.size(), NULL, 0, NULL, NULL); 9 char *buffer = new char[len+1]; 10 WideCharToMultiByte(CP_ACP, 0, str.c_str(), str.size(), buffer, len, NULL, NULL); 11 buffer[len] = '