第一个Stream Demo
IDEA里面写Stream有个坑
虽然java文件中没错,但是但编译的时候还是报错了,
Information:java: javacTask: 源发行版 1.8 需要目标发行版 1.8
解决方法是:perferences -> Build,Execution, Deployment -> Compiler -> Java Compiler
设置相应Module的 bytecode version即可
public class StreamDemo { public static void main(String[] args) { List<String> list1 = new ArrayList<String>(); list1.add("apple"); list1.add("banana"); list1.add("orange"); list1.add("watermelon"); final Iterator<String> iterator = list1.iterator(); while(iterator.hasNext()) { System.out.println(iterator.next()); } final long count = list1.stream().filter(str -> str.length() > 5).count(); System.out.println("长度大于5的字符串个数为:" + count); } }
终于成功了......
Stream初步
Stream是元素的集合,这点让Stream看起来用些类似Iterator;
可以支持顺序和并行的对原Stream进行汇聚的操作;
大家可以把Stream当成一个高级版本的Iterator。原始版本的Iterator,用户只能一个一个的遍历元素并对其执行某些操作;高级版本的Stream,用户只要给出需要对其包含的元素执行什么操作,比如"过滤掉长度大于10的字符串"、"获取每个字符串的首字母"等,具体这些操作如何应用到每个元素上。
图片就是对于Stream例子的一个解析,可以很清楚的看见:原本一条语句被三种颜色的框分割成了三个部分。红色框中的语句是一个Stream的生命开始的地方,负责创建一个Stream实例;绿色框中的语句是赋予Stream灵魂的地方,把一个Stream转换成另外一个Stream,红框的语句生成的是一个包含所有nums变量的Stream,进过绿框的filter方法以后,重新生成了一个过滤掉原nums列表所有null以后的Stream;蓝色框中的语句是丰收的地方,把Stream的里面包含的内容按照某种算法来汇聚成一个值,例子中是获取Stream中包含的元素个数。
在此我们总结一下使用Stream的基本步骤:
创建Stream;
转换Stream,每次转换原有Stream对象不改变,返回一个新的Stream对象(**可以有多次转换**);
对Stream进行聚合(Reduce)操作,获取想要的结果;
创建Stream
最常用的创建Stream有两种途径:
通过Stream接口的静态工厂方法(注意:Java8里接口可以带静态方法);
通过Collection接口的默认方法(默认方法:Default method,也是Java8中的一个新特性,就是接口中的一个带有实现的方法,后续文章会有介绍)stream(),把一个Collection对象转换成Stream。
使用Stream静态方法来创建Stream
1. of方法:有两个overload方法,一个接受变长参数,一个接口单一值
Stream<Integer> integerStream = Stream.of(1, 2, 3, 5); // 变长参数 Stream<String> stringStream = Stream.of("hehe"); // 单个参数
Stream.generate(new Supplier<Double>() { @Override public Double get() { return Math.random(); } }); Stream.generate(() -> Math.random()); Stream.generate(Math::random);
3. iterate方法:也是生成无限长度的Stream,和generator不同的是,其元素的生成是重复对给定的种子值(seed)调用用户指定函数来生成的。其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环。
Stream.iterate(1, item -> item + 1).limit(10).forEach(System.out::println);
通过Collection子类获取Stream
这个在本文的第一个例子中就展示了从List对象获取其对应的Stream对象,如果查看Java doc就可以发现Collection接口有一个stream方法,所以其所有子类都都可以获取对应的Stream对象。
public interface Collection<E> extends Iterable<E> { //其他方法省略 default Stream<E> stream() { return StreamSupport.stream(spliterator(), false); } }
转换Stream
转换Stream其实就是把一个Stream通过某些行为转换成一个新的Stream。Stream接口中定义了几个常用的转换方法,下面我们挑选几个常用的转换方法来解释。
1. distinct
对于Stream中包含的元素进行去重操作(去重逻辑依赖元素的equals方法),新生成的Stream中没有重复的元素;
2. filter
对于Stream中包含的元素使用给定的过滤函数进行过滤操作,新生成的Stream只包含符合条件的元素;
3. map
对于Stream中包含的元素使用给定的转换函数进行转换操作,新生成的Stream只包含转换生成的元素。这个方法有三个对于原始类型的变种方法,分别是:mapToInt,mapToLong和mapToDouble。这三个方法也比较好理解,比如mapToInt就是把原始Stream转换成一个新的Stream,这个新生成的Stream中的元素都是int类型。之所以会有这样三个变种方法,可以免除自动装箱/拆箱的额外消耗;
4. flatMap
和map类似,不同的是其每个元素转换得到的是Stream对象,会把子Stream中的元素压缩到父集合中;
5. peek
生成一个包含原Stream的所有元素的新Stream,同时会提供一个消费函数(Consumer实例),新Stream每个元素被消费的时候都会执行给定的消费函数;
6. limit
对一个Stream进行截断操作,获取其前N个元素,如果原Stream中包含的元素个数小于N,那就获取其所有的元素;
7. skip
返回一个丢弃原Stream的前N个元素后剩下元素组成的新Stream,如果原Stream中包含的元素个数小于N,那么返回空Stream;
综合示例代码:
List<Integer> nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); System.out.println(“sum is:”+nums.stream().filter(num -> num != null).distinct().mapToInt(num -> num * 2).peek(System.out::println).skip(2).limit(4).sum());
public class StreamDemo { public static void main(String[] args) { List<Integer> nums = Arrays.asList(new Integer[]{1,1,null,2,3,4,null,5,6,7,8,9,10}); System.out.println("sum is:" +nums .stream() /*构建stream*/ .filter(num -> num != null) /*找到不为null的对象*/ .distinct() /*去重*/ .mapToInt(num -> num * 2) /*转型并计算*/ .peek(System.out::println) /*生成一个包含stream元素的新的stream, 并且通过一个函数来消费元素*/ .skip(2) /*跳过前n个元素, 如果元素不足n个则返回null*/ .limit(4) /*保留前n元素*/ .sum() /*求和*/ ); } }
这段代码演示了上面介绍的所有转换方法(除了flatMap),简单解释一下这段代码的含义:给定一个Integer类型的List,获取其对应的Stream对象,然后进行过滤掉null,再去重,再每个元素乘以2,再每个元素被消费的时候打印自身,在跳过前两个元素,最后取前四个元素进行加和运算(解释一大堆,很像废话,因为基本看了方法名就知道要做什么了。这个就是声明式编程的一大好处!)。
9. 性能问题
有些细心的同学可能会有这样的疑问:在对于一个Stream进行多次转换操作,每次都对Stream的每个元素进行转换,而且是执行多次,这样时间复杂度就是一个for循环里把所有操作都做掉的N(转换的次数)倍啊。其实不是这样的,转换操作都是lazy的,多个转换操作只会在汇聚操作(见下节)的时候融合起来,一次循环完成。我们可以这样简单的理解,Stream里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在汇聚操作的时候循环Stream对应的集合,然后对每个元素执行所有的函数。
flatMap示例
之前的示例没有flatMap的示例,所以还是没有搞懂这个flatMap的用法,这里来研究一下。
在Java 8中,Stream可以容纳不同的数据类型,例如:
Stream<String[]> Stream<Set<String>> Stream<List<String>> Stream<List<Object>>
但是,Stream操作(filter,sum,distinct ...)和collectors不支持它,所以我们需要使用flatMap()进行以下转换:
Stream<String[]> -> flatMap -> Stream<String> Stream<Set<String>> -> flatMap -> Stream<String> Stream<List<String>> -> flatMap -> Stream<String> Stream<List<Object>> -> flatMap -> Stream<Object>
如何flatMap()是如何工作的:
{{1,2}, {3,4}, {5,6}} -> flatMap -> {1,2,3,4,5,6}
{'a','b'}, {'c','d'}, {'e','f'}} -> flatMap -> {'a','b','c','D','E','F'}
示例:使用flatMap()转换Stream<String[]>来Stream<String>
public class FlatMapDemo1 { public static void main(String[] args) { String[][] data = new String[][]{{"a", "b"}, {"c", "d"}, {"e", "f"}}; Stream<String[]> temp = Arrays.stream(data); // 一维字符串数组的流 Stream<String> stringStream = temp.flatMap(x -> Arrays.stream(x)); // 继续降维 Stream<String> stream = stringStream.filter(x -> "a".equals(x.toString())); // 过滤 stream.forEach(System.out::println); // 将上面的串起来 Stream<String> stream2 = Arrays.stream(data) .flatMap(x -> Arrays.stream(x)) .filter(x -> "a".equals(x.toString())); } }
看完了这个例子应该明白了不少吧。
再来一个例子。
Student.java
public class Student { private String name; private Set<String> books; public void addBook(String book) { if(this.books == null) { this.books = new HashSet<>(); } this.books.add(book); } public String getName() { return name; } public void setName(String name) { this.name = name; } public Set<String> getBooks() { return books; } public void setBooks(Set<String> books) { this.books = books; } }
然后是flatMap和Set的例子
public class FlatMapDemo2 { public static void main(String[] args) { Student student1= new Student(); student1.setName("小明"); student1.addBook("数学分析1"); student1.addBook("拓扑学"); student1.addBook("高等代数"); Student student2 = new Student(); student2.addBook("线性代数"); student2.addBook("拓扑学"); student2.addBook("微分几何"); List<Student> list = new ArrayList<>(2); list.add(student1); list.add(student2); List<String> collect = list.stream() // List<Student>转为Stream<Student> .map(x -> x.getBooks()) // Stream<Student>转为Stream<Set<String> .flatMap(x -> x.stream()) // Stream<Set<String>>转为Stream<String> .distinct() // 去重 .collect(Collectors.toList()); // 变成List collect.forEach(x -> System.out.println(x)); // 遍历 } }
Stream + Primitive + flatMapToInt
对于原始类型,可以使用flatMapToInt。
public class FlatMapToIntDemo { public static void main(String[] args) { int[][] intArray = {{1, 2, 3, 4}, {3, 4}}; Stream.of(intArray) // 二维数组转成一维的 .flatMapToInt(x -> Arrays.stream(x)) // 几个一维数组拆开 .forEach(x -> System.out.println(x)); // 遍历 } }
确实好方便,少些很多代码。
Stream中的聚合操作
简单翻译一下:聚合操作(也称为折叠)接受一个元素序列为输入,反复使用某个合并操作,把序列中的元素合并成一个汇总的结果。比如查找一个数字列表的总和或者最大值,或者把这些数字累积成一个List对象。Stream接口有一些通用的汇聚操作,比如reduce()和collect();也有一些特定用途的汇聚操作,比如sum(),max()和count()。注意:sum方法不是所有的Stream对象都有的,只有IntStream、LongStream和DoubleStream是实例才有。
下面会分两部分来介绍汇聚操作:
可变汇聚:把输入的元素们累积到一个可变的容器中,比如Collection或者StringBuilder;
其他汇聚:除去可变汇聚剩下的,一般都不是通过反复修改某个可变对象,而是通过把前一次的汇聚结果当成下一次的入参,反复如此。比如reduce,count,allMatch;
可变汇聚
可变汇聚对应的只有一个方法:collect,正如其名字显示的,它可以把Stream中的要有元素收集到一个结果容器中(比如Collection)。先看一下最通用的collect方法的定义(还有其他override方法):
<R> R collect(Supplier<R> supplier, BiConsumer<R, ? super T> accumulator, BiConsumer<R, R> combiner);
先来看看这三个参数的含义:Supplier supplier是一个工厂函数,用来生成一个新的容器;BiConsumer accumulator也是一个函数,用来把Stream中的元素添加到结果容器中;BiConsumer combiner还是一个函数,用来把中间状态的多个结果容器合并成为一个(并发的时候会用到)。看晕了?来段代码!
public class ReduceDemo1 { public static void main(String[] args) { List<Integer> nums = Arrays.asList(new Integer[] {1,1,null,2,3,4,null,5,6,7,8,9,10}); List<Integer> numsWithoutNull = nums.stream() // 构造一个stream .filter(num -> num != null) // 过滤为空的对象 .collect(() -> new ArrayList<Integer>(), // 生成一个行的ArrayList对象 (list, item) -> list.add(item * 2), // list就是上一步生成的ArrayList对象 (list1, list2) -> list1.addAll(list2) // 两个加到一起 ); final List<Integer> numsWithoutNull2 = nums.stream() .filter(num -> num != null) .collect(Collectors.toList()); } }
上面这段代码就是对一个元素是Integer类型的List,先过滤掉全部的null,然后把剩下的元素收集到一个新的List中。进一步看一下collect方法的三个参数,都是lambda形式的函数(*上面的代码可以使用方法引用来简化,留给读者自己去思考*)。
第一个函数生成一个新的ArrayList实例;
第二个函数接受两个参数,第一个是前面生成的ArrayList对象,二个是stream中包含的元素,函数体就是把stream中的元素加入ArrayList对象中。第二个函数被反复调用直到原stream的元素被消费完毕;
第三个函数也是接受两个参数,这两个都是ArrayList类型的,函数体就是把第二个ArrayList全部加入到第一个中;
但是上面的collect方法调用也有点太复杂了,没关系!我们来看一下collect方法另外一个override的版本,其依赖[Collector]
<R, A> R collect(Collector<? super T, A, R> collector);
其他汇聚
reduce方法:reduce方法非常的通用,后面介绍的count,sum等都可以使用其实现。reduce方法有三个override的方法,本文介绍两个最常用的,最后一个留给读者自己学习。先来看reduce方法的第一种形式,其方法定义如下:
Optional<T> reduce(BinaryOperator<T> accumulator);
可以看到reduce方法接受一个函数,这个函数有两个参数,第一个参数是上次函数执行的返回值(也称为中间结果),第二个参数是stream中的元素,这个函数把这两个值相加,得到的和会被赋值给下次执行这个函数的第一个参数。要注意的是:**第一次执行的时候第一个参数的值是Stream的第一个元素,第二个参数是Stream的第二个元素**。这个方法返回值类型是Optional,这是Java8防止出现NPE的一种可行方法,后面的文章会详细介绍,这里就简单的认为是一个容器,其中可能会包含0个或者1个对象。
public class ReduceDemo { public static void main(String[] args) { List<Integer> ints = Arrays.asList(new Integer[] {1,2,3,4,5,6,7,8,9,10}); System.out.println("ints sum is:" + ints.stream() .reduce((sum, item) -> sum + item) // 这里的+号就是二元操作 .get() ); } }
– 搜索相关
– allMatch:是不是Stream中的所有元素都满足给定的匹配条件
– anyMatch:Stream中是否存在任何一个元素满足匹配条件
– findFirst: 返回Stream中的第一个元素,如果Stream为空,返回空Optional
– noneMatch:是不是Stream中的所有元素都不满足给定的匹配条件
– max和min:使用给定的比较器(Operator),返回Stream中的最大|最小值