【序列化的概念】
序列化是将对象状态转换为可保持或可传输的格式的过程。与序列化相对的是反序列化,它将流转换为对象。这两个过程结合起来,可以轻松地存储和传输数据。
将对象的状态信息转换为可以存储或传输的窗体的过程。 在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。
通常,对象实例的所有字段都会被序列化,这意味着数据会被表示为实例的序列化数据。这样,能够解释该格式的代码有可能能够确定这些数据的值,而不依赖于该成员的可访问性。类似地,反序列化从序列化的表示形式中提取数据,并直接设置对象状态,这也与可访问性规则无关。 对于任何可能包含重要的安全性数据的对象,如果可能,应该使该对象不可序列化。如果它必须为可序列化的,请尝试生成特定字段来保存不可序列化的重要数据。如果无法实现这一点,则应注意该数据会被公开给任何拥有序列化权限的代码,并确保不让任何恶意代码获得该权限。
【JSON的概念】
JSON,JavaScript Object Notation,一种更轻、更友好的用于接口(AJAX、REST等)数据交换的格式。 JSON是结构化数据串行化的文本格式,作为XML的一种替代品,用于表示客户端与服务器间数据交换有效负载的格式。它是从ECMAScript语言标准衍生而来的。JSON的设计目标是使它成为小的、轻便的、文本的,而且是JavaScript的一个子集。
【长度的比较】
如下一段代码,显示了对数组和对象编码后生成的字符串及其长度
class Foo { public $int = 1; public $bool = TRUE; public $array = array(array(1), 2 => 'test', 'string'); public function test($flag) { echo $flag, 'test function for Foo <br />'; } public static function output($str) { echo $str, '<br />'; } public static function compare_serialize_and_json($data) { $serialize_str = serialize($data); self::output('序列化后的值:' . $serialize_str . "; length=" . strlen($serialize_str)); $json_str = json_encode($data); self::output('JSON后的值:' . $json_str . "; length=" . strlen($json_str)); } } $test_data = array('wwww' => 0, 'phppan' => 1, 'com' => 2); //序列化数组 echo '数组:<br />'; Foo::compare_serialize_and_json($test_data); $foo = new Foo(); echo '对象:<br />'; Foo::compare_serialize_and_json($foo);
输出:
数组:
序列化后的值:a:3:{s:4:”wwww”;i:0;s:6:”phppan”;i:1;s:3:”com”;i:2;}; length=52
JSON后的值:{“wwww”:0,”phppan”:1,”com”:2}; length=29 对象:
序列化后的值:O:3:”Foo”:3:{s:3:”int”;i:1;s:4:”bool”;b:1;s:5:”array”;a:3:{i:0;
a:1:{i:0;i:1;}i:2;s:4:”test”;i:3;s:6:”string”;}}; length=111 JSON后的值:{“int”:1,”bool”:true,”array”:{“0”:[1],”2”:”test”,”3”:”string”}};
length=63
很明显的长度区别,serialize在编码后大概是json的两倍。
原因:
- serialize后字符串包含了子串的长度,这可能是速度方面的优化,典型的空间换时间,但是它本身还是太重了。
- serialize有更加详细的类型区分,而json只有四种类型,并且是以简单的符号表示。
【速度的比较】
以代码说明问题,如下比较速度的代码:
$max_index = 10; ini_set("memory_limit","512M"); $array = array_fill(0, 1000000, rand(1, 9999)); echo 'serialize:<br />'; $start = xdebug_time_index(); for ($i = 0; $i < $max_index; $i++) { $str = serialize($array); } $end = xdebug_time_index(); echo $end - $start, '<br />'; echo 'json:<br />'; $start = xdebug_time_index(); for ($i = 0; $i < $max_index; $i++) { $str = json_encode($array); } $end = xdebug_time_index(); echo $end - $start, '<br />'; unset($array, $str);
输出:
serialize:
9.5371007919312 json:
1.4313209056854
serialize的速度在大数据量的情况下比json差了快一个数量级。
从上面两点看,json不管是在速度还是在生成的字符串的大小上都比serialize要好,那为什么serialize还要存在呢? 原因在下面这个点:实现的功能。
【处理对象】
如下代码:
header("Content-type:text/html;charset=utf8"); class Foo { public function test($flag) { echo $flag, 'test function for Foo <br />'; } } $foo = new Foo(); echo '反序列化测试:<br />'; $foo->test(1); $serialize_str = serialize($foo); $obj = unserialize($serialize_str); $obj->test(2); $foo->test(1); $json_str = json_encode($foo); $obj = json_decode($json_str); $obj->test(2); die();
输出:
反序列化测试: 1test function for Foo 2test function for Foo 1test function
for Foo( ! ) Fatal error: Call to undefined method stdClass::test()
json无法处理对象方法等数据。
【使用范围】
序列化使用serialize,特别是对象的存储。这是其存在的意义。
与对象无关的数据存储可以使用json,如包含大量数字的数组等。只是当遇到这种情况,我们需要做的可能是重构数据库了。
数据交换时使用JSON,这也是其定义所在。
目前JSON是能用于UTF-8编码的数据。
有时候需要把一个对象在网络上传输,为了方便传输,可以把整个对象转化为二进制串,等到达另一端时,再还原为原来的对象,这个过程称之为串行化(也叫序列化), 就像我们现在想把一辆汽车通过轮船运到美国去,因为汽车的体积比较大,我们可以把汽车拆开成小的部件,然后我们把这些部件通过轮般运到美国去,到了美国再把这些部件组装回汽车。
有两种情况我们必须把对象串行化,第一种情况就是把一个对象在网络中传输的时候要将对象串行化,第二种情况就是把对象写入文件或是数据库的时候用到串行化。
串行化有两个过程,一个是串行化,就是把对象转化为二进制的字符串,我们使用serialize()函数来串行化一个对象,另一个是反串行化,就是把对象转化的二进制字符串再转化为对象, 我们使用unserialize()函数来反串行化一个对象。
PHP中serialize()函数的参数为对象名,返回值为一个字符串,Serialize()返回的字符串含义模糊,一般我们不会解析这个串来得到对象的信息,我们只要把返回来的这个字符串传到网络另一端或是保存到文件中即可。
PHP中unserialize()函数来反串行化对象,这个函数的参数即为serialize()函数的返回值,输出当然是重新组织好的对象。
<? class Person { //下面是人的成员属性 var $name; //人的名子 var $sex; //人的性别 var $age; //人的年龄 //定义一个构造方法参数为属性姓名$name、性别$sex和年龄$age进行赋值 function __construct($name = "", $sex = "", $age = "") { $this->name = $name; $this->sex = $sex; $this->age = $age; } //这个人可以说话的方法, 说出自己的属性 function say() { echo "我的名子叫:" . $this->name . " 性别:" . $this->sex . " 我的年龄是:" . $this->age . "<br>"; } } $p1 = new Person("张三", "男", 20); $p1_string = serialize($p1); //把一个对象串行化,返一个字符串 echo $p1_string . "<br>"; //串行化的字符串我们通常不去解析 $p2 = unserialize($p1_string); //把一个串行化的字符串反串行化形成对象$p2 $p2->say(); ?>
上例输出结果:
O:6:”Person”:3:{s:4:”name”;s:4:”张三”;s:3:”sex”;s:2:”男”;s:3:”age”;i:20;}
我的名子叫:张三 性别:男 我的年龄是:20
在PHP5中有两个魔术方法__sleep()方法和__wakeup()方法,在对象串行化的时候,会调用一个__sleep()方法来完成一 些睡前的事情;而在重新醒来,即由二进制串重新组成一个对象的时候,则会自动调用PHP的另一个函数__wakeup(),做一些对象醒来就要做的动作。
__sleep()函数不接受任何参数, 但返回一个数组,其中包含需要串行化的属性。末被包含的属性将在串行化时被忽略,如果没有__sleep()方法,PHP将保存所有属性。
<? class Person { //下面是人的成员属性 var $name; //人的名子 var $sex; //人的性别 var $age; //人的年龄 //定义一个构造方法参数为属性姓名$name、性别$sex和年龄$age进行赋值 function __construct($name = "", $sex = "", $age = "") { $this->name = $name; $this->sex = $sex; $this->age = $age; } //这个人可以说话的方法, 说出自己的属性 function say() { echo "我的名子叫:" . $this->name . " 性别:" . $this->sex . " 我的年龄是:" . $this->age . "<br>"; } //指定串行化时把返回的数组中$name和$age值串行化,忽略没在数组中的属性$sex function __sleep() { $arr = array("name", "age"); // 此时,属性$sex将被删除!!! return($arr); } //重新生成对象时,并重新赋值$age为40 function __wakeup() { $this->age = 40; } } $p1 = new Person("张三", "男", 20); //把一个对象串行化,返一个字符串,调用了__sleep()方法,忽略没在数组中的属性$sex $p1_string = serialize($p1); echo $p1_string . "<br>"; //串行化的字符串我们通常不去解析 $p2 = unserialize($p1_string); //反串行化形成对象$p2重新赋值$age为40 $p2->say(); ?>
上例输出值为:
O:6:”Person”:2:{s:4:”name”;s:4:”张三”;s:3:”age”;i:20;}
我的名子叫:张三 性别: 我的年龄是:40