在写《云环境下基于预算和截止期约束的科学工作流弹性资源提供和调度》这篇文章时用到了cloudsim仿真软件进行实验仿真,在实验过程中遇到了当仿真执行时间过长时程序总是不能正常结束,由于仿真作业是通过LSF系统提交到集群执行的,通过读取作业执行的日志发现作业不能正常结束是由于程序占用内存过大导致的。
初步估计是由于采用java编写的程序,而java的垃圾回收机制不像C++那样是自己申请自己释放,java是通过一个垃圾回收机制对内存进行回收,因此只要一个对象还在被引用,他所占用的内存将不会被释放。因此估计是程序中的某些地方有一些列表这样的数据结构中包含了一些对象,虽然在对象使用完之后已经将对象从列表中删除了,但是可能其他某些地方仍然有某些数据结构在调用这个对象,因此这个对象所占用的内存一直不会被回收。也就是说程序中存在多个数据结构引用一个对象,但是使用完后这些对对象的引用并没有被全部解除。
解决方法:利用jprofiler这个软件在程序运行时对程序的内存占用情况进行实时监控分析(这可程序有个功能可以监控程序运行过程中各个对象占用了多少内存,同时可以显示各个对象的引用关系),发现果然是上述估计的原因导致内存被占用不能释放。通过查找到一直占用内存的对象在程序中的引用情况,将使用完的引用及时清除掉,问题解决。