Java 容器面试三
Java 容器面试三
集合判空
《阿里巴巴 Java 开发手册》的描述如下:
判断所有集合内部的元素是否为空,使用
isEmpty()
方法,而不是size()==0
的方式。
这是因为 isEmpty()
方法的可读性更好,并且时间复杂度为 O(1)。
绝大部分我们使用的集合的 size()
方法的时间复杂度也是 O(1),不过,也有很多复杂度不是 O(1) 的,比如 java.util.concurrent
包下的某些集合(ConcurrentLinkedQueue
、ConcurrentHashMap
…)。
下面是 ConcurrentHashMap
的 size()
方法和 isEmpty()
方法的源码。
1 | public int size() { |
集合转 Map
《阿里巴巴 Java 开发手册》的描述如下:
在使用
java.util.stream.Collectors
类的toMap()
方法转为Map
集合时,一定要注意当 value 为 null 时会抛 NPE 异常。
1 | class Person { |
下面我们来解释一下原因。
首先,我们来看 java.util.stream.Collectors
类的 toMap()
方法 ,可以看到其内部调用了 Map
接口的 merge()
方法。
1 | public static <T, K, U, M extends Map<K, U>> |
Map
接口的 merge()
方法如下,这个方法是接口中的默认实现。
如果你还不了解 Java 8 新特性的话,请看这篇文章:《Java8 新特性总结》 。
1 | default V merge(K key, V value, |
merge()
方法会先调用 Objects.requireNonNull()
方法判断 value 是否为空。
1 | public static <T> T requireNonNull(T obj) { |
集合遍历
《阿里巴巴 Java 开发手册》的描述如下:
不要在 foreach 循环里进行元素的
remove/add
操作。remove 元素请使用Iterator
方式,如果并发操作,需要对Iterator
对象加锁。
通过反编译你会发现 foreach 语法底层其实还是依赖 Iterator
。不过, remove/add
操作直接调用的是集合自己的方法,而不是 Iterator
的 remove/add
方法
这就导致 Iterator
莫名其妙地发现自己有元素被 remove/add
,然后,它就会抛出一个 ConcurrentModificationException
来提示用户发生了并发修改异常。这就是单线程状态下产生的 fail-fast 机制。
fail-fast 机制:多个线程对 fail-fast 集合进行修改的时候,可能会抛出
ConcurrentModificationException
。 即使是单线程下也有可能会出现这种情况,上面已经提到过。相关阅读:什么是 fail-fast 。
Java8 开始,可以使用 Collection#removeIf()
方法删除满足特定条件的元素,如
1 | List<Integer> list = new ArrayList<>(); |
除了上面介绍的直接使用 Iterator
进行遍历操作之外,你还可以:
- 使用普通的 for 循环
- 使用 fail-safe 的集合类。
java.util
包下面的所有的集合类都是 fail-fast 的,而java.util.concurrent
包下面的所有的类都是 fail-safe 的。 - ……
集合去重
《阿里巴巴 Java 开发手册》的描述如下:
可以利用
Set
元素唯一的特性,可以快速对一个集合进行去重操作,避免使用List
的contains()
进行遍历去重或者判断包含操作。
这里我们以 HashSet
和 ArrayList
为例说明。
1 | // Set 去重代码示例 |
两者的核心差别在于 contains()
方法的实现。
HashSet
的 contains()
方法底部依赖的 HashMap
的 containsKey()
方法,时间复杂度接近于 O(1)(没有出现哈希冲突的时候为 O(1))。
1 | private transient HashMap<E,Object> map; |
我们有 N 个元素插入进 Set 中,那时间复杂度就接近是 O (n)。
ArrayList
的 contains()
方法是通过遍历所有元素的方法来做的,时间复杂度接近是 O(n)。
1 | public boolean contains(Object o) { |
集合转数组
《阿里巴巴 Java 开发手册》的描述如下:
使用集合转数组的方法,必须使用集合的
toArray(T[] array)
,传入的是类型完全一致、长度为 0 的空数组。
toArray(T[] array)
方法的参数是一个泛型数组,如果 toArray
方法中没有传递任何参数的话返回的是 Object
类 型数组。
1 | String [] s= new String[]{ |
由于 JVM 优化,new String[0]
作为Collection.toArray()
方法的参数现在使用更好,new String[0]
就是起一个模板的作用,指定了返回数组的类型,0 是为了节省空间,因为它只是为了说明返回的类型。详见:https://shipilev.net/blog/2016/arrays-wisdom-ancients/
数组转集合
《阿里巴巴 Java 开发手册》的描述如下:
使用工具类
Arrays.asList()
把数组转换成集合时,不能使用其修改集合相关的方法, 它的add/remove/clear
方法会抛出UnsupportedOperationException
异常。
我在之前的一个项目中就遇到一个类似的坑。
Arrays.asList()
在平时开发中还是比较常见的,我们可以使用它将一个数组转换为一个 List
集合。
1 | String[] myArray = {"Apple", "Banana", "Orange"}; |
JDK 源码对于这个方法的说明:
1 | /** |
下面我们来总结一下使用注意事项。
问题一、不能直接使用 Arrays.asList 来转换基本类型数组
1 | int[] arr = { 1, 2, 3 }; |
在上面的示例中,通过 Arrays.asList
将 int[]
数组初始化为 List
后。这个List
包含的其实是一个 int
数组,整个 List
的元素个数是 1,元素类型是整数数组。
其原因是,只能是把 int 装箱为 Integer,不可能把 int 数组装箱为 Integer 数组。我们知 道,Arrays.asList 方法传入的是一个泛型 T 类型可变参数,最终 int 数组整体作为了一个 对象成为了泛型类型 T
1 | public static <T> List<T> asList(T... a) { |
直接遍历这样的 List 必然会出现 Bug。
问题二、使用集合的修改方法:add()
、remove()
、clear()
会抛出异常。
Arrays.asList 返回的 List 并不是我们期望的 java.util.ArrayList,而是 Arrays 的内部类。这个内部类继承自 AbstractList 类,但没有覆写父类的 add、remove、clear 方法,而父类中的这几个方法默认会抛出 UnsupportedOperationException。
1 | String[] arr = { "1", "2", "3" }; |
下图是 java.util.Arrays$ArrayList
的简易源码,我们可以看到这个类重写的方法有哪些。
1 | private static class ArrayList<E> extends AbstractList<E> |
我们再看一下java.util.AbstractList
的 add/remove/clear
方法就知道为什么会抛出 UnsupportedOperationException
了。
1 | public E remove(int index) { |
那我们如何正确的将数组转换为 ArrayList
?
1、手动实现工具类
1 | //JDK1.5+ |
2、最简便的方法
1 | List list = new ArrayList<>(Arrays.asList("a", "b", "c")) |
3、使用 Java8 的 Stream
(推荐)
1 | Integer [] myArray = { 1, 2, 3 }; |
4、使用 Guava
对于不可变集合,你可以使用 ImmutableList
类及其 of()
与 copyOf()
工厂方法:(参数不能为空)
1 | List<String> il = ImmutableList.of("string", "elements"); // from varargs |
对于可变集合,你可以使用 Lists
类及其 newArrayList()
工厂方法:
1 | List<String> l1 = Lists.newArrayList(anotherListOrCollection); // from collection |
5、使用 Apache Commons Collections
1 | List<String> list = new ArrayList<String>(); |
6、 使用 Java9 的 List.of()
方法
1 | Integer[] array = {1, 2, 3}; |
使用 List.subList 进行切片操作居然会导致 OOM
List.subList 返回的子 List 不是一个普通的 ArrayList。这个子 List 可以认为是原始 List 的视图,会和原始 List 相互影响。如果不注意,很可能会因此产生 OOM 问题。
如下代码所示,定义一个名为 data 的静态 List 来存放 Integer 的 List,[也就是说 data 的成员本身是包含了多个数字的 List。循环 1000 次,每次都从一个具有 10 万个 Integer 的 List 中,使用 subList 方法获得一个只包含一个数字的子 List,并把这个子 List 加入 data 变量:
1 | private static List<List<Integer>> data = new ArrayList<>(); |
出现 OOM 的原因是,循环中的 1000 个具有 10 万个元素的 List 始终得不到回收,因为它始终被 subList 方法返回的 List 强引用。