序列化是将变量转换为可保存或传输的字符串的过程;反序列化就是在适当的时候把这个字符串再转化成原来的变量使用。这两个过程结合起来,可以轻松地存储和传输数据,使程序更具维护性。
1. serialize和unserialize函数
这两个是序列化和反序列化PHP中数据的常用函数。
01 |
<?php |
02 |
03 |
$a = array ( 'a' => 'Apple' , 'b' => 'banana' , 'c' => 'Coconut' ); |
04 |
|
05 |
//序列化数组 |
06 |
$s = serialize( $a ); |
07 |
echo $s ; |
08 |
//输出结果:a:3:{s:1:"a";s:5:"Apple";s:1:"b";s:6:"banana";s:1:"c";s:7:"Coconut";} |
09 |
10 |
echo '<br /><br />' ; |
11 |
12 |
//反序列化 |
13 |
$o = unserialize( $s ); |
14 |
15 |
print_r( $o ); |
16 |
//输出结果 Array ( [a] => Apple [b] => banana [c] => Coconut ) |
17 |
|
18 |
?> |
当数组值包含如双引号、单引号或冒号等字符时,它们被反序列化后,可能会出现问题。为了克服这个问题,一个巧妙的技巧是使用base64_encode和base64_decode。
1 |
$obj = array (); |
2 |
//序列化 |
3 |
$s = base64_encode (serialize( $obj )); |
4 |
//反序列化 |
5 |
$original = unserialize( base64_decode ( $s )); |
但是base64编码将增加字符串的长度。为了克服这个问题,可以和gzcompress一起使用。
01 |
//定义一个用来序列化对象的函数 |
02 |
03 |
function my_serialize( $obj ) |
04 |
{ |
05 |
return base64_encode (gzcompress(serialize( $obj ))); |
06 |
} |
07 |
08 |
//反序列化 |
09 |
function my_unserialize( $txt ) |
10 |
{ |
11 |
return unserialize(gzuncompress( base64_decode ( $txt ))); |
12 |
} |
2. json_encode 和 json_decode
使用JSON格式序列化和反序列化是一个不错的选择:
- 使用json_encode和json_decode格式输出要serialize和unserialize格式快得多。
- JSON格式是可读的。
- JSON格式比serialize返回数据结果小。
- JSON格式是开放的、可移植的。其他语言也可以使用它。
01 |
$a = array ( 'a' => 'Apple' , 'b' => 'banana' , 'c' => 'Coconut' ); |
02 |
|
03 |
//序列化数组 |
04 |
$s = json_encode( $a ); |
05 |
echo $s ; |
06 |
//输出结果:{"a":"Apple","b":"banana","c":"Coconut"} |
07 |
08 |
echo '<br /><br />' ; |
09 |
10 |
//反序列化 |
11 |
$o = json_decode( $s ); |
在上面的例子中,json_encode输出长度比上个例子中serialize输出长度显然要短。
3. var_export 和 eval
var_export 函数把变量作为一个字符串输出;eval把字符串当成PHP代码来执行,反序列化得到最初变量的内容。
01 |
$a = array ( 'a' => 'Apple' , 'b' => 'banana' , 'c' => 'Coconut' ); |
02 |
|
03 |
//序列化数组 |
04 |
$s = var_export( $a , true); |
05 |
echo $s ; |
06 |
//输出结果: array ( 'a' => 'Apple', 'b' => 'banana', 'c' => 'Coconut', ) |
07 |
08 |
echo '<br /><br />' ; |
09 |
10 |
//反序列化 |
11 |
eval ( '$my_var=' . $s . ';' ); |
12 |
13 |
print_r( $my_var ); |
4. wddx_serialize_value 和 wddx deserialize
wddx_serialize_value函数可以序列化数组变量,并以XML字符串形式输出。
01 |
$a = array ( 'a' => 'Apple' , 'b' => 'banana' , 'c' => 'Coconut' ); |
02 |
03 |
//序列化数组 |
04 |
$s = wddx_serialize_value( $a ); |
05 |
echo $s ; |
06 |
07 |
//输出结果(查看输出字符串的源码):<wddxPacket version='1.0'><header/><data><struct><var name='a'><string>Apple</string></var><var name='b'><string>banana</string></var><var name='c'><string>Coconut</string></var></struct></data></wddxPacket> |
08 |
09 |
echo '<br /><br />' ; |
10 |
11 |
//反序列化 |
12 |
$o = wddx_deserialize( $s ); |
13 |
14 |
print_r( $o ); |
15 |
//输出结果:Array ( [a] => Apple [b] => banana 1 => Coconut ) |
可以看出,XML标签字符较多,导致这种格式的序列化还是占了很多空间。
小结
上述所有的函数在序列化数组变量时都能正常执行,但运用到对象就不同了。例如json_encode序列化对象就会失败。反序列化对象时,unserialize和eval将有不同的效果。