Stream 作为 Java8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream 是完全不同的概念,Stream 是对集合的包装,通常和lambda一起使用。使用stream可以支持许多操作,如 map, filter, limit, sorted, count, min, max, sum, collect 等等。
Stream 主要具有如下三点特性
stream不存储数据
stream不改变源数据
stream的延迟执行特性
通常我们在数组或集合的基础上创建stream,stream不会专门存储数据,对stream的操作也不会影响到创建它的数组和集合,对于stream的聚合、消费或收集操作只能进行一次,再次操作会报错
@Test
public void test1(){
int[] arr = new int[]{1, 2, 3};
IntStream intStream = Arrays.stream(arr);
intStream.forEach(System.out::println);
intStream.forEach(System.out::println);
}
输出结果
1
2
3
java.lang.IllegalStateException: stream has already been operated upon or closed
stream的操作是延迟执行的,在列出字符串长度大于3的例子中,在collect方法执行之前,filter、sorted、map方法还未执行,只有当collect方法执行时才会触发之前转换操作
public boolean filter(String s) {
System.out.println("begin compare");
return s.length() > 3;
}
@Test
public void test2() {
List
{
add("abc");
add("abcd");
}
};
Stream
System.out.println("split-------------------------------------");
List
System.out.println(list);
}
打印结果如下:
split-------------------------------------
begin compare
begin compare
[abcd]
由此可以看出,在执行完filter时,没有实际执行filter中的方法,而是等到执行collect时才会执行,即是延迟执行的。
注意:
由于stream的延迟执行特性,在聚合操作执行前修改数据源是允许的。
当我们操作一个流的时候,并不会修改流底层的集合(即使集合是线程安全的),如果想要修改原有的集合,就无法定义流操作的输出。
/**
* 延迟执行特性,在聚合操作之前都可以添加相应元素
*/
@Test
public void test3() {
List
{
add("a");
add("b");
}
};
Stream
wordList.add("END");
long n = words.distinct().count();
System.out.println(n);
}
输出结果
3
延迟执行特性,会产生干扰
@Test
public void test4(){
List
{
add("a");
add("b");
}
};
Stream
words1.forEach(s -> {
System.out.println("s->"+s);
if (s.length() < 4) {
System.out.println("select->"+s);
wordList.remove(s);
System.out.println(wordList);
}
});
}
输出结果
s->a
select->a
[b]
s->null
java.lang.NullPointerException