导读:最近在做项目的过程中,发现一个问题,就是我们最开始的时候,传递参数包括返回类型,都有map类型。但是由于map每次都要匹配key值,很麻烦。所以在之后就将参数传递和返回类型全都改成了实体bean,并且让每个bean都实现了Serializable接口。然后,在这里的时候,就有点疑惑。首先:为什么要进行序列化;其次:每个实体bean都必须实现serializabel接口吗?最后:我做一些项目的时候,没有实现序列化,同样没什么影响,然后现在做项目需要序列化,到底什么时候应该进行序列化操作呢?
本篇文章,是我对于序列化这个话题的一点小小的思考,可能还不太成熟,请每一个路过的人不吝赐教,在此,先谢过了!
一、什么是序列化
In computer science, in the context of data storage, serialization is the process of translating data structures or object state into a format that can be stored (for example, in a file or memory buffer,
or transmitted across a network connection link) and reconstructed later in the same or another computer environment.[1] When the resulting series of bits is reread according to the serialization format, it can be used to create a semantically identical clone
of the original object.
那我也有看过很多的博客包括书,但是我之前其实一直不太理解这个序列化,虽然一直都在用。今天在看资料 的时候,发现导致这种现象的原因,可能是我之前看的一些介绍里面,忽略了一个很关键的因素:object state info对象的状态信息 。也就是说,其实序列化,它是完整的保存了某一状态下的对象信息,是一个整体,而不是零散的!我在一个IBM工程师的博客里面看到一个说法,我感觉对于我理解序列化很有帮助,他说序列化的过程,就是一个“freeze”的过程,它将一个对象freeze住,然后进行存储,等到再次需要的时候,再将这个对象de-freeze就可以立即使用。
二、为什么需要序列化
1,存储对象在存储介质中,以便在下次使用的时候,可以很快捷的重建一个副本。也就是When the resulting series of bits is reread according to the serialization format, it can be used to create a semantically identical clone of the original object.
问题:我没有实现序列化的时候,我一样可以存入到我的sqlserver或者MySQL、Oracle数据库中啊,为什么一定要序列化才能存储呢????
2,便于数据传输,尤其是在远程调用的时候!
三、到底什么时候一定要序列化
结合到第二点的问题,就是说在我存储的时候,不通过序列化也一样完美存储,为什么要多此一举?额,经过我阅读文档和书籍,以及做项目的经验总结(反正就是之前混迹在编码中的一系列经验总结),在存储时需要序列化,这是肯定的。大家知道的是序列化是将对象进行流化存储,我们有时候感觉自己在项目中并没有进行序列化操作,也一样是存进去了,那么对象需要经过序列化才能存储的说法,似乎从这儿就给阉割了。事实究竟是怎样的呢?
首先看我们常用的数据类型类声明:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence
public class Date implements java.io.Serializable, Cloneable, Comparable
而像其他int、long、boolean类型等,都是基本数据类型,数据库里面有与之对应的数据结构。从上面的类声明来看,我们以为的没有进行序列化,其实是在声明的各个不同变量的时候,由具体的数据类型帮助我们实现了序列化操作。
拿到这儿的时候,就又有一个问题,既然实体类的变量都已经帮助我们实现了序列化,为什么我们仍然要显示的让类实现serializable接口呢?
请注意我以上的说法:首先,序列化的目的有两个,第一个是便于存储,第二个是便于传输。我们一般的实体类不需要程序员再次实现序列化的时候,请想两个问题:第一:存储媒体里面,是否是有其相对应的数据结构?第二:这个实体类,是否需要远程传输(或者两个不同系统甚至是分布式模块之间的调用)?
如果有注意观察的话,发现序列化操作用于存储时,一般是对于NoSql数据库,而在使用Nosql数据库进行存储时,用“freeze”这个说法来理解是再恰当不过了,请在NoSql数据库中,给我找出个varchar,int之类的数据结构出来? 如果没有,但我们又确实需要进行存储,那么,此时程序员再不将对象进行序列化,更待何时?
备注:如果有人打开过Serializable接口的源码,就会发现,这个接口其实是个空接口,那么这个序列化操作,到底是由谁去实现了呢?其实,看一下接口的注释说明就知道,当我们让实体类实现Serializable接口时,其实是在告诉JVM此类可被序列化,可被默认的序列化机制序列化。
然后,需要说明的是,当我们在实体类声明实现Serializable接口时,再次进行观察,会发现这些类是需要被远程调用的。也就是说需要或者可能需要被远程调用,这就是序列化便于传输的用途。
慎重声明:以上所有言论,都是本宝宝经过项目中的具体观察,以及阅读一些文章之后的所谓经验之谈,且看且见谅吧!
三、是否一定要实现Serializable接口序列化
上回说到了关于序列化的一些基本情况,那么,接下来的一个问题是:如果我们要实现序列化操作,是否一定要通过实现Serializable接口的方式?PS:其实,我只是不明白,为什么大家一提到序列化就说特别简单,实现Serializable接口就OK了?我就一直在想,这是否是目前我们所能拥有的最佳选择?
请大家先看一篇文章分析:https://github.com/eishay/jvm-serializers/wiki
文章说得很清楚,图文并茂的,那么多选择,自己看着办吧。不过我最近做的一个项目使用的是protostuff!
四、使用其他序列化实现的优缺点
诚如大家在第三节分享的链接文章所见,通过实现Serializable接口的方式去进行序列化操作,在性能上来讲并不是最佳选择。那么,在性能考虑的情况下,很多人都会选择其他更为高效率的产品替代serializable接口,现在问题来了:
1,如果我通过Serializable接口实现,那么我只需要在类声明时实现它即可
2,如果我通过其他方式实现,那么我将不得不自己重写工具类,不能再通过实现serializable接口的方式去进行序列化了。在使用上,大大的不怎么方便!
PS:项目中总会用到个什么redis,mongoDB啥的,其实每次存取都有那么一个数据封装处理的过程,额,也差不了这一点了。那么有没有现成的人家封装好的呢?自己找吧,肯定是有的。其实,我就是不明白,如果是用了第三方的工具去实现序列化,那么在序列化进行远程调用的时候,到底应该在哪儿进行显示的序列化或者反序列操作?我刚开始想在Dao层,但这样子的话,自己模块操作不也得来那么一波序列化反序列化操作嘛。因为我目前确实只是在从NoSql数据库中存取数据时用到了第三方的序列化工具,而在远程调用的时候,没有啊!以前都是直接实现Serializable接口的,唉。。。。学艺不精啊!
跪求指点!!!!!
五、总结
其实,很长的一段时间里,我一直以为java底层包自带的方法一定会是最好的,包括各个框架,我都更愿意去用它本身就有的工具。但是,可能那些自带的方法,尤其是向Serializable接口,从jdk1.1开始就有了,经过了长时间的考验,性能上可能不是最好的,但它的稳定性绝对是值得肯定的。那么,其实在使用的时候,还是根据自身的情况考虑吧。在技术乃至于架构或者说各种系统设计,最实用最适合的,才是最好了!
其实我还有一个问题,不见得自己模块会和数据库部署到同一个机器上啊,所以还是得考虑都传输时的序列化问题,那如果使用第三方的工具,不都得来那么一波嘛,这代码量就又活生生的多了那么点儿。唉,不说了,我这是越说越晕,回家吃饭!