• php开发中emoji表情的问题3种方法轻松处理【转】


    移动设备经常会发生用户发送的内容中包含emoji表情,未经处理,在显示时就是乱码。所以本文介绍在PHP微信开发中涉及到emoji表情的几种处理方法。

    背景

    做微信开发的时候就会发现,存储微信昵称必不可少。

    可这万恶的微信支持emoji表情做昵称,这就有点蛋疼了

    一般Mysql表设计时,都是用UTF8字符集的。把带有emoji的昵称字段往里面insert一下就没了,整个字段变成了空字符串。这是怎么回事呢?

    原来是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了。这要怎么办呢?我来介绍几种方法

    解决方案

    1、使用utf8mb4字符集

    如果你的mysql版本>=5.5.3,你大可直接将utf8直接升级为utf8mb4字符集
    这种4字节的utf8编码可完美兼容旧的3字节utf8字符集,并且可以直接存储emoji表情,是最好的解决方案
    至于字节增大带来的性能损耗,我看过一些评测,几乎是可以忽略不计的

    2、使用base64编码

    如果你因为某些原因无法使用utf8mb4的话,你还可以使用base64来曲线救国
    使用例如base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中,取出时decode一下即可

    3、干掉emoji表情

    emoji表情是个麻烦的东西,即使你能存储,也不一定能完美显示。在iOS以外的平台上,例如PC或者android。如果你需要显示emoji,就得准备一大堆emoji图片并使用第三方前端类库才行。即便如此,还是可能因为emoji图片不够全而出现无法显示的情况在大多数业务场景下,emoji也不是非要不可的。我们可以适当地考虑干掉它,节约各种成本

    经过一番苦苦的google,终于找到靠谱能用的代码:

    // 过滤掉emoji表情
    function filterEmoji($str)
    {
     $str = preg_replace_callback(
       '/./u',
       function (array $match) {
        return strlen($match[0]) >= 4 ? '' : $match[0];
       },
       $str);
    
      return $str;
     }
    

    以上就是为大家总结的PHP微信开发中涉及到emoji表情的几种处理方法,基本思想就是遍历字符串中的每个字符,如果该字符的长度为4个字节,就将其删除。希望大家喜欢!
    文章转自:https://www.jb51.net/article/88805.htm
     
    其他参考:https://www.cnblogs.com/my3306/p/9849923.html

  • 相关阅读:
    Java的Regex --正则表达式
    Java的包装类
    类的始祖Object
    abstract和interface关键字介绍
    内部类
    Accumulation Degree [换根dp,二次扫描]
    牛客练习赛61 [口胡]
    CF1334G Substring Search [bitset,乱搞]
    CF1175F The Number of Subpermutations [哈希,乱搞]
    CF793G Oleg and chess [线段树优化建边,扫描线,最大流]
  • 原文地址:https://www.cnblogs.com/KillBugMe/p/12698814.html
Copyright © 2020-2023  润新知