• API – MultiByteToWideChar的用法


    技术交流,DH讲解.

    在D2010中多了一个类TEncoding,这个类用来转换不同编码的字符串.
    在看这个类的代码的时候我看见这个API函数,具体来说这个函数将一个字节数组转换PWideChar.
    因为不同编码下一个字符串占的字节数是不一样的,这样转换后每个字符都只占2个字节了,这样可以统一一下.
    看下这个函数在MSDN中的声明:

    int MultiByteToWideChar(
      UINT CodePage, 
      DWORD dwFlags,         
      LPCSTR lpMultiByteStr, 
      int cbMultiByte,       
      LPWSTR lpWideCharStr,  
      int cchWideChar        
    );

    Delphi中声明:

    function MultiByteToWideChar(CodePage: UINT; dwFlags: DWORD;
      const lpMultiByteStr: LPCSTR; cchMultiByte: Integer;
      lpWideCharStr: LPWSTR; cchWideChar: Integer): Integer; stdcall;

    我们看看参数的作用:
    CodePage:指定执行转换的代码页,这个参数可以为系统已安装或有效的任何代码页所给定的值。具体编码的CodePage可以查MSDN.
    dwFlags:一组位标记用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:
      MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与
      MB_COMPOSITE值一起使用。
      MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。这是缺省的转换选择。不能与MB_PRECOMPOSED值一起使用。
      MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。
      MB_USEGLYPHCHARS:使用象形文字替代控制字符。
      组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。
      函数的缺省动作是转换成预作的形式。如果预作的形式不存在,函数将尝试转换成组合形式。
      标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。
    lpMultiByteStr:指向将被转换字符串的字符。
    cchMultiByte:指定由参数lpMultiByteStr指向的字符串中字节的个数。如果这个值为C1,字符串将被设定为以NULL为结束符的字符串,并且自动计算长度。
    lpWideCharStr:指向接收被转换字符串的缓冲区。
    cchWideChar:指定由参数lpWideCharStr指向的缓冲区的字节个数。若此值为零,函数返回缓冲区所必需的宽字符数,在这种情况下,lpWideCharStr中的缓冲区不被使用。
    返回值:如果函数运行成功,并且cchWideChar不为零,返回值是由 lpWideCharStr指向的缓冲区中写入的宽字符数;如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所需求的宽字符数大小。

    有了上面的介绍,我们来看一下怎么确定一个多字节数组中有多少个字符呢?

    function TUTF7Encoding.GetCharCount(Bytes: PByte; ByteCount: Integer): Integer;
    begin
    {$IF DEFINED(UNICODE)}
      Result := inherited GetCharCount(Bytes, ByteCount);
    {$ELSE}
      Result := MultiByteToWideChar(FCodePage, FWCharToMBFlags,
        PAnsiChar(Bytes), ByteCount, nil, 0);
    {$IFEND}
    end;

    如上面所说,只需要把第五个参数设置成nil,第六个参数为0,那么返回值就是字符的个数.
    现在有了字符个数了,我们看怎么把字节数组转成相应的字符数组:

    function TMBCSEncoding.GetChars(Bytes: PByte; ByteCount: Integer; Chars: PChar;
      CharCount: Integer): Integer;
    begin
    {$IF DEFINED(UNICODE)}
      Result := MultiByteToWideChar(FCodePage, FMBToWCharFlags,
        PAnsiChar(Bytes), ByteCount, PChar(Chars), CharCount);
    {$ELSE}
      Result := CharCount;
      Move(Bytes^, Chars^, CharCount * SizeOf(AnsiChar));
    {$IFEND}
    end;

    与之相反的函数就是WideCharToMultiByte.

    上面的例子都是来自VCL中的代码.

    好了,就说这个API.我是DH.

  • 相关阅读:
    NHibernate从入门到精通系列(3)——第一个NHibernate应用程序
    你真的了解Ioc与AOP吗?(1)
    C#网络编程TCP通信的粘包问题讨论
    开源框架完美组合之Spring.NET + NHibernate + ASP.NET MVC + jQuery + easyUI 中英文双语言小型企业网站Demo
    NHibernate从入门到精通系列(1)——NHibernate概括
    Spring.NET框架简介及模块说明
    C#|.NET从控制反转(依赖注入)想到事件注入 (非AOP)
    MVC3使用Unity实现接口自动注册
    编写更好的C#代码
    解构控制反转(IoC)和依赖注入(DI)
  • 原文地址:https://www.cnblogs.com/huangjacky/p/1647564.html
Copyright © 2020-2023  润新知