• 浅谈chr(239) . chr(187) . chr(191)的作用


    chr(239) . chr(187) . chr(191)

      

      作为一名初学者,偶尔在代码中发现这么一段代码:

    json_decode(trim($param, chr(239) . chr(187) . chr(191)), true);

      那么到底有什么用了,因此我在网上查阅了大量资料。

      

      相信新手都遇到这么一个bug,就是接口传回了json字符串数据,但是用json_decode()转码的时候发现,数据为NULL。

      原因就是UTF-8的BOM头的影响.

      

    BOM是什么

      Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。在UCS 编码中有一个叫做 "Zero Width No-Break Space",中文译名作“零宽无间断间隔”的字符,它的编码是 FEFF。而 FFFE 在 UCS 中是不存在的字符,所以不应该出现在实际传输中。UCS 规范建议我们在传输字节流前,先传输字符 "Zero Width No-Break Space"。这样如果接收者收到 FEFF,就表明这个字节流是 Big-Endian 的;如果收到FFFE,就表明这个字节流是 Little- Endian 的。因此字符 "Zero Width No-Break Space" (“零宽无间断间隔”)又被称作 BOM(即Byte Order Mark)。

    UTF-8 BOM头又是什么

      UTF-8以字节为编码单元因此不需要 BOM 来表明字节顺序,但可以用 BOM 来表明编码方式。字符 "Zero Width No-Break Space" 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流,就知道这是 UTF-8编码了。

    chr(239) . chr(187) . chr(191)拼接成utf-8 bom头,再使用trim函数即可
    trim($param, chr(239) . chr(187) . chr(191))

    去除utf-8 的bom头还有其他方法,以下是另一种方法:

    if(preg_match('/^xEFxBBxBF/',$json_data)){
        $json_data = substr($info,3);
    }
    $json_data= json_decode(trim($json_data),true);

    匹配是否存在bom头,存在则截掉前三位字符,即bom头

     

    如大神发现叙述有错,请评论反馈,小的立即更改哈~~

  • 相关阅读:
    [OpenJudge90][序列DP+乱搞]滑雪
    [OpenJudge8786][暴力DP]方格取数
    [OpenJudge8782][划分DP]乘积最大
    [OpenJudge8471][划分DP]切割回文
    [OpenJudge8462][序列DP]大盗阿福
    【棋盘DP】【OpenJudge7614】最低通行费
    【OpenJudge8464】【序列DP】股票买卖
    bzoj1674: [Usaco2005]Part Acquisition 裸dijkstra
    bzoj3040 最短路+配对堆优化
    poj1330|bzoj3732|noip2013 货车运输 kruskal+倍增lca
  • 原文地址:https://www.cnblogs.com/wwjchina/p/9603286.html
Copyright © 2020-2023  润新知