SparseArray代替HashMap

相信大家都明白，手机软件的开发不同于PC软件的开发，因为手机性能相对有限，内存也有限，所谓“寸土寸金”，可能稍有不慎，就会导致性能的明显降低。Android为了方便开发者，特意在android.util这个包中提供了几个提高效率的工具类，比如之前用过的LruCache类，这次我们来谈谈其他工具类，SparseArray，SparseBooleanArray和 SparseIntArray。

总体说，它们都是类似map这样key-value的存储方式，但是由于查找的算法不一样。因此效率也各不同。但要明白，没有说哪个一定是最好的。只有根据不同需求在不同场景去应用，才能获取较优的结果。下面我们来看看它们的“庐山真面目”吧。

SparseArray

本来想在这里好好介绍何为SparseArray。但看完源码和官方的文档，发现里面已经介绍的很仔细了。于是决定将源码中开始关于介绍SparseArray的那一段翻译在这里，最后总计几个要点。英文水平有限，翻译不恰当的地方请先见谅。

package android.util;  
  
import com.android.internal.util.ArrayUtils;  
  
/** 
 * SparseArrays 利用integer去管理object对象。不像一个正常的object对象数组，它能在索引数中快速的查找到所需的结果。（这 
 * 句话是音译，原意是能在众多索引数中“撕开一个缺口”，为什么原文这么表达？下面会慢慢说清楚。）它比HashMap去通过Integer索引 
 * 查找object对象时在内存上更具效率,不仅因为它避免了用来查找的自动“装箱”的keys，并且它的数据结构不依赖额外的对象去 
 * 各个映射中查找匹配。 
 *  
 * SparseArrays map integers to Objects.  Unlike a normal array of Objects, 
 * there can be gaps in the indices.  It is intended to be more memory efficient 
 * than using a HashMap to map Integers to Objects, both because it avoids 
 * auto-boxing keys and its data structure doesn't rely on an extra entry object 
 * for each mapping. 
 * 
 * 请注意，这个容器会保持它的映射关系在一个数组的数据结构中，通过二分检索法驱查找key。（这里我们终于知道，为何这个工具类中， 
 * 提供的添加映射关系的操作中，key的类型必须是integer。因为二分检索法，将从中间“切开”，integer的数据类型是实现这种检索过程的保证。） 
 *  
 * 如果保存大量的数据，这种数据结构是不适合的，换言之，SparseArray这个工具类并不应该用于存储大量的数据。这种情况下，它的效率 
 * 通常比传统的HashMap更低，因为它的查找方法并且增加和移除操作（任意一个操作）都需要在数组中插入和删除（两个步骤才能实现）。 
 *  
 * 如果存储的数据在几百个以内，它们的性能差异并不明显，低于50%。 
 *  
 * （OK，那么光看Android官方的介绍我们就有初步结论了，大量的数据我们相对SparseArray会优先选择HashMap，如果数据在几百个这个数目， 
 *  那么选择它们任意一个去实现区别不大，如果数量较少，就选择SparseArray去实现。 其实如果我们理解了二分法，就很容易了SparseArray的 
 *  实现原理，以及SparseArray和HashMap它们之间的区别了。） 
 *  
 * <p>Note that this container keeps its mappings in an array data structure, 
 * using a binary search to find keys.  The implementation is not intended to be appropriate for 
 * data structures 
 * that may contain large numbers of items.  It is generally slower than a traditional 
 * HashMap, since lookups require a binary search and adds and removes require inserting 
 * and deleting entries in the array.  For containers holding up to hundreds of items, 
 * the performance difference is not significant, less than 50%.</p> 
 * 
 *   
 * 为了提高性能，这个容器包含了一个实现最优的方法：当移除keys后为了立刻使它的数组紧密，它会“遗留”已经被移除（标记了要删除）的条目（entry） 。 
 * 所被标记的条目（entry）（还未被当作垃圾回收掉前）可以被相同的key复用，也会在垃圾回收机制当作所有要回收的条目的一员被回收，从而使存储的数组更紧密。 
 *  
 * （我们下面看源码就会发现remove()方法其实是调用delete()方法的。印证了上面这句话所说的这种优化方法。 
 * 因为这样，能在每次移除元素后一直保持数组的数据结构是紧密不松散的。） 
 *  
 * 垃圾回收的机制会在这些情况执行：数组需要扩充，或者映射表的大小被恢复，或者条目值被重新检索后恢复的时候。 
 *   
 * <p>To help with performance, the container includes an optimization when removing 
 * keys: instead of compacting its array immediately, it leaves the removed entry marked 
 * as deleted.  The entry can then be re-used for the same key, or compacted later in 
 * a single garbage collection step of all removed entries.  This garbage collection will 
 * need to be performed at any time the array needs to be grown or the the map size or 
 * entry values are retrieved.</p> 
 * 
 * 当调用keyAt(int)去获取某个位置的key的键的值，或者调用valueAt(int)去获取某个位置的值时，可能是通过迭代容器中的元素 
 * 去实现的。 
 * 
 * <p>It is possible to iterate over the items in this container using 
 * {@link #keyAt(int)} and {@link #valueAt(int)}. Iterating over the keys using 
 * <code>keyAt(int)</code> with ascending values of the index will return the 
 * keys in ascending order, or the values corresponding to the keys in ascending 
 * order in the case of <code>valueAt(int)<code>.</p> 
 */  
public class SparseArray<E> implements Cloneable {  
    //...  
}

至于完整的源码就不贴出来了，因为不多，大家可以自行看看。

这里总结下几个重要的点：

1，SparseArray的原理是二分检索法，也因此key的类型都是整型。

2，（HashMap和SparseArray比较）当存储大量数据（起码上千个）的时候，优先选择HashMap。如果只有几百个，用哪个区别不大。如果数量不多，优先选择SparseArray。

3，SparseArray有自己的垃圾回收机制。（当数量不是很多的时候，这个不必关心。）

接着将里面的主要方法列出来：

private int index = 1;  
    private String value = "value";  
      
    public void testSparseArray()  
    {  
        //创建一个SparseArray对象  
        SparseArray<String> sparseArray = new SparseArray<String>();  
          
        //向sparseArray存入元素value，key为index  
        sparseArray.put(index, value);  
          
        //这个方法本质也是利用put(key, value)去存入数据  
        sparseArray.append(index, value);  
          
          
        sparseArray.indexOfKey(index);  
        //查找value所在的位置，如果不存在，则返回-1  
        sparseArray.indexOfValue(value);  
          
          
          
        //更新某个key的值  
        sparseArray.setValueAt(index, value);  
          
          
          
        //获取index所对应的值，没有则返回null  
        sparseArray.get(index);  
        //获取index所对应的值，没有则返回自定义的默认值"default-value"  
        sparseArray.get(index,"default-value");  
          
          
          
        //删除index对应的元素  
        sparseArray.delete(index);  
        //移除，本质也是调用delete(int)方法  
        sparseArray.remove(index);  
          
          
          
        //清空所有数据  
        sparseArray.clear();  
          
    }

SparseBooleanArray和SparseIntArray

SparseBooleanArray和SparseIntArray，其实看名字也知道，它们跟SparseArray极其类似，只是存储类型加以限制了。SparseBooleanArray只能存储boolean值，而SparseIntArray只能存储integer类型的值。它们也同样实现了Cloneable接口，可以直接调用clone方法，也同样是以二分法为依据。而其他的主要方法也是一样的。下面以SparseBooleanArray为简单例子写出主要的方法，从方法看出，两者和SparseArray的确是灰常类似的。SparseIntArray的代码就不再贴出来了，因为都一样的。我们在使用的过程中举一反三，会用一个，其他2个也就会用了呢。

public void testSparseBooleanArray()  
    {  
          
//      SparseBooleanArray sparseBooleanArray = new SparseBooleanArray();  
        //这种创建方式可以设置容器的大小  
        SparseBooleanArray sparseBooleanArray = new SparseBooleanArray(5);  
          
          
        //存入数据，同样有两种方法  
        sparseBooleanArray.put(int, boolean);  
          
        sparseBooleanArray.append(int, boolean);  
          
        //根据key获取对应的boolean值，没有则返回false  
        sparseBooleanArray.get(key);  
        //跟上面类似,valueIfKeyNotFound是自定义的假设不存在则返回的默认值  
        sparseBooleanArray.get(key, valueIfKeyNotFound);  
          
        //获取第5个位置的键值  
        sparseBooleanArray.keyAt(5);  
        //获取第5个元素的值  
        sparseBooleanArray.valueAt(5);  
          
        //删除某个key的元素  
        sparseBooleanArray.delete(key);  
        //清除所有  
        sparseBooleanArray.clear();  
          
    }

那么SparseBooleanArray和SparseIntArray也和SparseArray一样，存储不是太多的数据，它们都是作为比HashMap更好的选择。但数据是死的，功能也是死的，实现方式是灵活的。条条大路通罗马。我们不能一概而论说谁好谁差，放在具体的场景，才能选择更高效也更合乎成本的实现方式。

相关阅读:
一个Netfilter nf_conntrack流表查找的优化-为conntrack添加一个per cpu cache
【翻译自mos文章】检查$ORACLE_HOME是否是RAC的HOME的方法以及relink RAC的Oracle binary的方法
 DVBS/S2在数字电视系统中的应用三（LNB介绍）
cache数据库之表的存储结构
 jsp网页在浏览器中不显示图片_eclipse环境下配置tomcat中jsp项目的虚拟路径
 彻底搞懂oracle的标量子查询
 OpenCV学习教程入门篇<一、介绍>
NYOJ 38 布线问题_(解法1 Kruskal算法)
HTML5之WebSocket && https://zhuanlan.zhihu.com/p/23467317
HTML5离线缓存
原文地址：https://www.cnblogs.com/ganchuanpu/p/7696251.html