`
nanjingjiangbiao_T
  • 浏览: 2596509 次
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

HashMap与ArrayList的PK

 
阅读更多

本周要闻,这一周自己先干了两天的代码优化工作,优化自己的导入代码,在虎哥的指引下自己一步步理解优化这个过程很艰辛啊,其中在这个过程中理解到了,一个好的设计并非那么容易,同样一段程序如何让这段代码学的非常有精髓,有思想,这一点是非常不容易的。

对于以前自己很多地方都是用的list这样在循环太可怕了,五千次不怕,怕的是五千乘以五千这样你的代码现的非常没有代码深度,这样你的代码循环起来太慢了,这个自己这次做工程自己有切身感受,对于这一点在运行导入的时候显得淋漓尽致。

举个例子:我要导入五千条数据,并且这五千条数据中名称是都不能重复的,还得都得校验,和excel表中的名称是唯一的(就将这一个点),数据库中也是唯一的(先不讲这一点)。

你应该怎么写,一般的我们是将名称放入一个list中进行一一校验,来一个名称校验一次,看看有没有重复的,但是这样效率会怎那?五千条的数据校验是:30秒,就单单校验这一次,就那么长的时间。所以list这个东西很有挑战性,不能用,那我们用什么比较好哪?答案是map

首先集合分为:

第一类:ArrayArrays

第二类:CollectionListSet

第三类:MapHashMapHashTable

第一类中Array是最有效率的一种,存储及随机访问对象。

第二类和第三类比较:

1.继承子类:

Collection

--List 将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。

--ArrayList / LinkedList / Vector

--Set 不能含有重复的元素

--HashSet / TreeSet

Map

--HashMap

--HashTable

--TreeMap

2CollectionMap

Collection:类型者,每个位置只有一个元素

Map类型者,持有key-value键值对(不重复)

在我们的工程中最常用的是ArrayListHashMap两个集合,下面就充分介绍一下这两个元素。

ListArray

每个ArrayList实例都有一个容量(Capacity),即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加,但是增长算法并没有定义。当需要插入大量元素时,在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

List : 次序是List最重要的特点:它保证维护元素特定的顺序ListCollection添加了许多方法,使得能够向List中间插入与移除元素(这只推荐LinkedList使用。)一个List可以生成ListIterator,使用它可以从两个方向遍历List,也可以从List中间插入和移除元素。

ArrayList : 由数组实现的List。允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历ArrayList,而不是用来插入和移除元素。因为那比LinkedList开销要大很多。

LinkedList : 对顺序访问进行了优化,向List中间插入与删除的开销并不大。随机访问则相对较慢。(使用ArrayList代替。)还具有下列方法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() removeLast(), 这些方法 (没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。

Set的功能方法

Set具有与Collection完全一样的接口,因此没有任何额外的功能,不像前面有两个不同的List。实际上Set就是Collection,只是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)Set不保存重复的元素(至于如何判断元素相同则较为负责)

Set : 存入Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。SetCollection有完全一样的接口。Set接口不保证维护元素的次序。

HashSet : 为快速查找设计的Set。存入HashSet的对象必须定义hashCode()

TreeSet : 保存次序的Set, 底层为树结构。使用它可以从Set中提取有序的序列。

LinkedHashSet : 具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。

Map的功能方法

方法put(Object key, Object value)添加一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。方法get(Object key)返回与给定“键”相关联的“值”。可以用containsKey()containsValue()测试Map中是否包含某个“键”或“值”。标准的Java类库中包含了几种不同的MapHashMap,TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它们都有同样的基本接口Map,但是行为、效率、排序策略、保存对象的生命周期和判定“键”等价的策略等各不相同。

执行效率是Map的一个大问题。看看get()要做哪些事,就会明白为什么在ArrayList中搜索“键”是相当慢的。而这正是HashMap提高速度的地方。HashMap使用了特殊的值,称为“散列码”(hash code),来取代对键的缓慢搜索。“散列码”是“相对唯一”用以代表对象的int值,它是通过将该对象的某些信息进行转换而生成的。所有Java对象都能产生散列码,因为hashCode()是定义在基类Object中的方法。

HashMap就是使用对象的hashCode()进行快速查询的。此方法能够显着提高性能。

Map : 维护“键值对”的关联性,使你可以通过“键”查找“值”

HashMap : Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子loadfactor,以调整容器的性能。

LinkedHashMap : 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。

TreeMap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由ComparabelComparator决定)TreeMap的特点在于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。

WeakHashMao : 弱键(weak key)MapMap中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。

IdentifyHashMap : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。


分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics