这篇博客主要对Xml,Json,Hessian,Protocol Buffers的序列化和反序列化性能进行对比,Xml和Json的基本概念就不说了。
Hessian:Hessian是一个轻量级的remoting onhttp工具,提供了RMI的功能,采用的是二进制RPC协议,内置了序列化功能。
Protocol Buffers:google的一种数据交换的格式,它独立于语言,由于它是一种二进制的格式,比使用 xml 进行数据交换快许多,可以把它用于分布式应用之间的数据通信或者异构环境下的数据交换。作为一种效率和兼容性都很优秀的二进制数据传输格式,可以用于诸如网络传输、配置文件、数据存储等诸多领域。Google提供了Java、C++、Python的实现,现在网上也已经有了c#等语言的实现。
XML:使用.Net自带的XmlSerializer。
Json:使用的是ServiceStack.Text,性能高于Newtonsoft.Json,但是速度最快的应该是fastJSON.net。
Hessian:使用的是HessianCSharp库, 从nuget上下载。
Protocol Buffers:使用的是protobuf-net,从nuget上下载。
下列是测试使用的实体。
[ProtoContract] public class Student { [ProtoMember(1, IsRequired = true)] public int Id { get; set; } [ProtoMember(2, IsRequired = true)] public string Name { get; set; } [ProtoMember(3, IsRequired = true)] public DateTime Time { get; set; } [ProtoMember(4, IsRequired = true)] public List<string> Books { get; set; } } Student student = new Student() { Id = 1, Name = "Alan", Time = DateTime.Now, Books = new List<string>() { "语文", "数学" } };
测试机器使用的i7HQ 2.6HZ处理器。
下面是测试的结果
序列化
反序列化
序列化后字节长度
先说序列化,这里分别用100次,1000次,10000次和100000次进行了测试,纵坐标是完成时间,单位是毫秒,可以看到在进行10000次以内的测试时,4种序列化的耗时都是很小的,都在200毫秒内,10000次以后,到100000次,都开始增长,最差的是Xml,最好的是Protocol Buffers,但是在10000次内的时候,Hessian要优于Protocol Buffers。
对于反序列化10000次内的差别都不大,但是在10000次的时候我们已经可以看出Hessian比较耗时,到了100000次,Hessian直接超过了 Xml,让我一直以为是我的代码出现了问题,表现最好的依然是Protocol Buffers。
序列化后的字节长度,Xml最长这个可以理解,因为文件中包含很多的结尾标签(</Name>),Protocol Buffers依然是最好。
根据上面的图,我们几乎可以很快得出结论:Protocol Buffers是最好的,但是我觉得我们还要从以下几个方面综合评估:
1. 可读性:Xml和Json序列化后都是文本,可读性都非常好,比如两个系统要交换数据,如果中间出了差错,我们可以很方便的查看交换的数据,甚至模拟数据去测试;Hessian和Protocol Buffers都是二进制的,序列化后内容都是不可读的,这会对系统的排错造成一定的影响。
2. 通用性:Xml和Json已经是老牌的数据交换格式了,一般系统之间数据交换也就这两种格式;Hessian和Protocol Buffers都比较冷门,用的比较少。
3. 便捷性:Hessian其实是一个完整的RPC框架,在服务端定义接口并实现接口,将接口复制到客户端经过少量的编码,我们就可以在像调用本地方法那样去调用服务端,这种实现方式是其他三个工具不具有的,并且性能也不差。
1. 以上的测试结果会因为机器配置的差别而结果略有差别。
2. 使用了单线程的测试, 在多线程下还没有测试。