• 字符和字符串处理-ANSI字符和Unicode字符


    我们知道,C语言用char数据类型表示一个8位的ANSI字符,默认在代码中声明一个字符串时,C编译器会把字符串中的字符转换成由8位char数据类型构成的一个数组:

    // An 8-bit character
    char c = 'A';
    
    // An array of 99 8-bit character and 8-bit terminating zero
    char szBuffer[100] = "A String";

    Microsoft的C/C++编译器定义了一个内建的数据类型wchar_t,它表示一个16位的Unicode(UTF-16)字符。编译器只有指定了/Zc:wchar_t编译器开关时,才会定义这个参数类型。

    声明Unicode字符和字符串的方法如下:

    // A 16-bit character
    wchar_t c= L'A';
    
    // An array up to 99 16-bit characters and a 16-bit terminating zero
    wchar_t szBuffer[100] = L"A String";

    字符串之前的大写字母L通知编译器该字符串应该编译一个Unicode字符串。

    另外,在编写代码的时候,可以使用ANSI或Unicode字符/字符串使其能通过编译。WinNT.h定义了以下类型和宏:

    #ifdef UNICODE
    
    typedef WCHAR TCHAR, *PTCHAR, PTSTR;
    typedef CONST WCHAR *PCTSTR;
    
    #define __TEXT(quote) L##quote
    
    #else
    
    typedef CHAR TCHAR, *PTCHAR, PTSTR;
    typedef CONST CHAR *PCTSTR;
    
    #define __TEXT(quote) quote
    
    #endif
    
    #define TEXT(quote) __TEXT(quote)

    利用这些类型和宏来写代码,无论使用ANSI还是Unicode字符,都能通过编译,如下所示:

    // If UNICODE define, a 16-bit character; else an 8-bit character
    TCHAR c = TEXT('A');
    
    // If UNICODE define, an array of 16-bit character; else 8-bit character
    TCHAR szBuffer[100] = TEXT("A String");
  • 相关阅读:
    Set,List,Map的区别
    阅读笔记15
    阅读笔记14
    阅读笔记13
    阅读笔记12
    阅读笔记11
    阅读笔记10
    架构漫谈读后感
    阅读笔记1
    暑期周记8
  • 原文地址:https://www.cnblogs.com/srma/p/4345808.html
Copyright © 2020-2023  润新知