使用String.intern减少内存使用

使用String.intern减少内存使用
最近写一个程序，从文件中读取一些字/词，然后存储起来供别的类引用。

对每个读入的词创建一个String，结果许多同样内容的也会存储多份，会占用大量内存。

开始的一个想法是使用map/set来存储所有遇到的词，这样就没有重复的了。然后别的类只需要引用这些词就可以了。

这样还需要一些工作量，经别人介绍，发现了String.intern方法。

例如下面代码
```
String a = new String("abc");
String b = new String("abc");
assertNotSame(a, b);
```
a和b是两个独立的对象，它们有各自的存储。所以not same。

但如果
```
String a = new String("abc").intern();
String b = new String("abc").intern();
assertSame(a, b);
```
此时assertSame就会pass。现在a和b其实是一个对象，a == b。它们只是同一个对象的两个名字。在debug时，可以看到他们的id是一样的。这样跟
```
String a = new String("abc");
String b = a;
assertSame(a, b);
```
效果是完全一样的。

intern是一个native的方法，但按照其文档解释，应该是JVM维护了一个当前进程曾经出现过的字符串的hash表，在调用intern时，会查询该表。如果已经存在，则直接返回对该String的引用；如果没有，则创建一个，并加入到hash中。

在我的代码中，因为是从文件中读取的词，所以只需要在读取词后，对每个词调用下intern再存储，就可以保证同样内容的字符串只有一份存储。更确切的说，只有一个对象。即不仅字符串内容只有一份，其overhead（String类的非内容部分，例如其他成员变量）也只有一份。

另外，如果使用字面量(literal)来定义字符串，则自动会调用intern，从而减少内存占用。例如：
```
String a = new String("abc");
String b = "abc";
String c = "abc";

assertSame(b, c);
assertNotSame(a, b);
```
对于字面量定义的b和c都会自动调用intern，（等用于String b = "abc".intern())。所以此时b和c是指向同一个对象。但a不是字面量定义的，所以是独立对象。

原文地址：http://www.cnblogs.com/zdwillie/archive/2013/10/23/3384766.html
相关阅读:
用Iterator实现遍历集合
 SimpleDateFormat使用详解 <转>
Java学习之Iterator(迭代器)的一般用法（转）
Java：String和Date、Timestamp之间的转换
 关于PreparedStatement.addBatch()方法 (转)
JavaBean入门及简单的例子
 Tomcat7.0无法启动解决方法[failed to start]
executeQuery、executeUpdate 和 execute
jquery中attr和prop的区别
 Jquery的parent和parents(找到某一特定的祖先元素)
原文地址：https://www.cnblogs.com/kuyuyingzi/p/4266231.html