• php 判断中英文字符


    中文判断问题,其实有很多学问,底层的内部编码,涉及utf-8,gbk,gb13800的各种不同。曾经研究过如何区分一个字符是什么字符的问题。关联细节太多。


    今天搞了个php判断中文的代码。希望能对研究中文判断的朋友提供帮助。
    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
    <HTML>
    <HEAD>
    <TITLE> New Document </TITLE>
    <META http-equiv="Content-Type" content="text/html; charset=utf-8">
    </HEAD>

    <BODY>
    <?
    $str = "中国";
    echo $str;
    echo "<hr>";

    //if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在GB2312情况下使用 
    if (preg_match("/^[\x7f-\xff]+$/", $str)) { //兼容gb2312,utf-8
        echo "正确输入";
    } else {
        echo "错误输入";
    }
    ?>
    </BODY>
    </HTML>

    编码表

    双字节字符编码范围

    1. GBK (GB2312/GB18030)
    \x00-\xff GBK双字节编码范围
    \x20-\x7f ASCII
    \xa1-\xff 中文 gb2312
    \x80-\xff 中文 gbk

    2. UTF-8 (Unicode)

    \u4e00-\u9fa5 (中文)
    \x3130-\x318F (韩文
    \xAC00-\xD7A3 (韩文)
    \u0800-\u4e00 (日文)

  • 相关阅读:
    win7与centos虚拟机的共享文件夹创建
    MySQL视图
    MySQL分区表与合并表
    PHP读写XML文件的四种方法
    备份与恢复
    MySQL日志
    MySQL锁问题
    优化数据库对象
    ActiveReport资料
    对ArrayList 进行深拷贝
  • 原文地址:https://www.cnblogs.com/zcy_soft/p/1904791.html
Copyright © 2020-2023  润新知