• VC++中多字节字符集和Unicode之间的互换


    在Visual C++.NET中,默认的字符集是Unicode,这和Windows默认的字符集是一致的,不过在老的VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2005环境下运行时会报各种各样的错误,这里总结了在Visual C++.NET2005环境中Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。

    1.Unicode下CString转换为char *
    方法一: 使用API:WideCharToMultiByte进行转换

    CString str = _T("你好,世界!Hello,World");
    //注意:以下n和len的值大小不同,n是按字符计算的,len是按字节计算的
    int n = str.GetLength();  
    //获取宽字节字符的大小,大小是按字节计算的
    int len = WideCharToMultiByte(CP_ACP,0,str,str.GetLength(),NULL,0,NULL,NULL);
    //为多字节字符数组申请空间,数组大小为按字节计算的宽字节字节大小
    char * pFileName = new char[len+1];   //以字节为单位
    //宽字节编码转换成多字节编码
    WideCharToMultiByte(CP_ACP,0,str,str.GetLength(),pFileName,len,NULL,NULL);
    pFileName[len+1] = ;   //多字节字符以’′结束

    方法二:使用函数:T2A、W2A

    CString str = _T("你好,世界!Hello,World");
    //声明标识符
    USES_CONVERSION;
    //调用函数,T2A和W2A均支持ATL和MFC中的字符转换
    char * pFileName = T2A(str);  
    //char * pFileName = W2A(str); //也可实现转换

    注意:有时候可能还需要添加引用#include
    2、Unicode下char *转换为CString

    方法一:使用API:MultiByteToWideChar进行转换

    char * pFileName = "你好,世界!Hello,World";
    //计算char *数组大小,以字节为单位,一个汉字占两个字节
    int charLen = strlen(pFileName);
    //计算多字节字符的大小,按字符计算。
     int len = MultiByteToWideChar(CP_ACP,0,pFileName,charLen,NULL,0);
    //为宽字节字符数组申请空间,数组大小为按字节计算的多字节字符大小
    TCHAR *buf = new TCHAR[len + 1];
    //多字节编码转换成宽字节编码
    MultiByteToWideChar(CP_ACP,0,pFileName,charLen,buf,len);
    buf[len] = ; //添加字符串结尾,注意不是len+1
    //将TCHAR数组转换为CString
     CString pWideChar;
    pWideChar.Append(buf);
    //删除缓冲区
     delete []buf;

    方法二:使用函数:A2T、A2W

    char * pFileName = "你好,世界!Hello,World";

     USES_CONVERSION;
    CString s = A2T(pFileName);

    //CString s = A2W(pFileName);

    方法三:使用_T宏,将字符串转换为宽字符

    //多字节字符集,在vc6和vc7种可以编译通过的语句,但VS2005不能通过,默认为Unicode字符集
    //AfxMessageBox("加载数据失败",0);
    //书写代码使用TEXT("")或_T(""),文本在UNICODE和非UNICODE程序里都通用
     AfxMessageBox(_T("加载数据失败"),0);

    注意:直接转换在基于MBCS的工程可以,但在基于Unicode字符集的工程中直接转换是不可行的,CString会以Unicode的形式来保存数据,强制类型转换只会返回第一个字符。

  • 相关阅读:
    【NLP_Stanford课堂】最小编辑距离
    【NLP_Stanford课堂】句子切分
    【NLP_Stanford课堂】词形规范化
    【NLP_Stanford课堂】分词
    【NLP_Stanford课堂】正则表达式
    【Python自然语言处理】第一章学习笔记——搜索文本、计数统计和字符串链表
    【C++ Primer】详解C++和C中的float中的有效数字
    【C++ Primer】读书笔记_第一章
    【SQL Server 2012】按倒序存储“分组统计”结果的临时表到新建表
    Git学习
  • 原文地址:https://www.cnblogs.com/meetrice/p/3158436.html
Copyright © 2020-2023  润新知