public int GetBytesOfString(string str)
{//获取字符串的字节数
byte[] bytes = Encoding.Unicode.GetBytes(str);
int n = 0;
for (int i = 0; i < bytes.GetLength(0); i++)
{
// 偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节
if (i % 2 == 0)
{
n++; // 在UCS2第一个字节时n加1
}
else
{
// 当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节
if (bytes[i] > 0)
{
n++;
}
}
}
return n;
}
private string GetSubstringByLength(string str, ref int len)
{//截取字符串指定字节数的内容,并返回实际截取的字节数
byte[] bytes = Encoding.Unicode.GetBytes(str);
int n = 0; // 表示当前的字节数
int i = 0; // 要截取的字节数
for (; i < bytes.GetLength(0) && n < len; i++)
{
if (i % 2 == 0)// 偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节
{
n++; // 在UCS2第一个字节时n加1
}
else
{
if (bytes[i] > 0)// 当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节
{
n++;
}
}
}
// 如果i为奇数时,处理成偶数
if (i % 2 == 1)
{
if (bytes[i] > 0) // 该UCS2字符是汉字时,去掉这个截一半的汉字
i = i - 1;
else
i = i + 1;// 该UCS2字符是字母或数字,则保留该字符
}
len = i;
return Encoding.Unicode.GetString(bytes, 0, i);
}