• Java函数式编程(2):流式计算


    您好,我是湘王,这是我的CSDN博客,欢迎您来,欢迎您再来~

    Lambda表达式虽然将接口作为代码块赋值给了变量,但如果仅仅只是Lambda表达式,还无法让Java由量变引起质变。真正让Lambda能够发挥出巨大威力的,就是流式计算。

    所谓流式计算,就是让数据像在流水线上一样,从一道工序流转到下一道工序。就像这样:

     

    如果把数据处理的方式比作流水线,那么Spark、Storm和Flink就是目前市面上头部的三家工厂。它们有各种各样的数据装配间(也就是各种处理数据的算子),将数据按照所需加工成型。所以,不懂流式计算根本就做不了大数据开发。上面那张图,如果换成流式计算的,就是这样:

     

    Lambda表达式就变成了一个个的数据装配间。

    还是以实际的代码例子来说明。假如有这样的代码:

    1. /**
    2. * 雇员数据
    3. *
    4. * @author 湘王
    5. */
    6. public class Employee {
    7. public enum Type { MANAGER, SELLER, OFFICER };
    8. private String name;
    9. private String genger;
    10. private Integer age;
    11. private boolean married;
    12. private Type type;
    13. public Employee(final String name, final String genger, final Integer age, final boolean married, final Type type) {
    14. super();
    15. this.name = name;
    16. this.genger = genger;
    17. this.age = age;
    18. this.married = married;
    19. this.type = type;
    20. }
    21. public String getName() {
    22. return name;
    23. }
    24. public void setName(String name) {
    25. this.name = name;
    26. }
    27. public String getGenger() {
    28. return genger;
    29. }
    30. public void setGenger(String genger) {
    31. this.genger = genger;
    32. }
    33. public Integer getAge() {
    34. return age;
    35. }
    36. public void setAge(Integer age) {
    37. this.age = age;
    38. }
    39. public boolean isMarried() {
    40. return married;
    41. }
    42. public void setMarried(boolean married) {
    43. this.married = married;
    44. }
    45. public Type getType() {
    46. return type;
    47. }
    48. public void setType(Type type) {
    49. this.type = type;
    50. }
    51. @Override
    52. public String toString() {
    53. return this.name + "(" + this.genger + ")-" + this.age;
    54. }
    55. }

    如果想筛选28岁以下的员工,并按年龄排序,用老办法只能这么做:

    1. List employees = Arrays.asList(
    2. new Employee("张勇", "男", 28, true, Employee.Type.MANAGER),
    3. new Employee("李强", "男", 22, false, Employee.Type.SELLER),
    4. new Employee("王武", "男", 32, false, Employee.Type.SELLER),
    5. new Employee("梅丽", "女", 26, true, Employee.Type.OFFICER),
    6. new Employee("郑帅", "男", 29, false, Employee.Type.OFFICER),
    7. new Employee("曾美", "女", 27, true, Employee.Type.SELLER),
    8. new Employee("郝俊", "男", 22, true, Employee.Type.SELLER),
    9. new Employee("方圆", "女", 24, false, Employee.Type.SELLER)
    10. );
    11. // 传统筛选数据的方法
    12. // 筛选28岁以下的员工
    13. List list1 = new ArrayList<>();
    14. for(Employee employee : employees) {
    15. if (employee.getAge() < 28) {
    16. list1.add(employee);
    17. }
    18. }
    19. // 按年龄排序
    20. list1.sort(new Comparator() {
    21. @Override
    22. public int compare(Employee o1, Employee o2) {
    23. return o1.getAge().compareTo(o2.getAge());
    24. }
    25. });

    如果要转换成Lmabda表达式的话,就是这样:

    1. /**
    2. * 雇员函数式接口
    3. *
    4. * @author 湘王
    5. */
    6. @FunctionalInterface
    7. public interface EmployeeInterface {
    8. boolean select(T t);
    9. }
    10. public static List filter(List employees, EmployeeInterface ei) {
    11. List list = new ArrayList<>();
    12. for(Employee employee : employees) {
    13. if (ei.select(employee)) {
    14. list.add(employee);
    15. }
    16. }
    17. return list;
    18. }
    19. // 使用Lambda表达式得到28岁以下的员工
    20. List list2 = filter(employees, employee -> employee.getAge() < 28);
    21. // 按年龄排序
    22. list2.sort((e1, e2) -> e1.getAge().compareTo(e2.getAge()));

    可以看到,这虽然用了Lambda表达式替代了旧的方法,但可能要写大量的函数式接口,Lambda沦为鸡肋,完全谈不上简便快速,更别说优雅!

    所以,这时候如果用流式计算,那简直不要太优雅:

    1. // Lambda表达式 + 流式计算
    2. List list3 = employees
    3. // 生成「流」
    4. .stream()
    5. // 过滤
    6. .filter(emp -> emp.getAge() < 28)
    7. // 排序
    8. .sorted((o1, o2) -> o1.getAge().compareTo(o2.getAge()))
    9. // 生成新的结果集合
    10. .collect(Collectors.toList());

    仅仅几行代码就搞定了,完全没有之前那种「傻大黑粗」的感觉了。

    上面的代码,可以用这幅图来还原:

     

    1、先用filter算子(流式计算中的函数,或者方法,在大数据中统称为算子,我也习惯这么称呼)将符合年龄条件的雇员筛选出来;

    2、再按照年龄从低到高排序;

    3、将排好序的员工列表输出出来。

    就是这么简单粗暴!

    就像藏宝图一样,只有将Lambda表达式和流式计算这两张碎片拼起来,才是完整的Java函数式编程。

    所有的流式计算算子可以分为两大类:中间操作和终端操作。

    1、中间操作:返回另一个流,如filter、map、flatMap等;

    2、终端操作:从流水线中生成结果,如collect、count、reduce、forEach等。

    现在,咱们已经找到了函数式编程这个宝藏。那么再回到最初的问题:当要实现某宝、某东和某哈哈的员工联谊并解决单身问题时,有更好的办法吗?

    当然有,而且只用一行代码就可以搞定:

    List<Employee> unMarriedList4 = list.stream().filter(company -> Company.Type.BIG == company.getType()).flatMap(companys -> companys.getEmployees().stream()).filter(Employee::isMarried).sorted(Comparator.comparing(Employee::getAge)).collect(Collectors.toList());


    感谢您的大驾光临!咨询技术、产品、运营和管理相关问题,请关注后留言。欢迎骚扰,不胜荣幸~

  • 相关阅读:
    ubuntu20添加一个硬盘
    算法:(七)队列
    回溯专题——day33
    TouchGFX界面开发 | 项目代码结构分析
    非侵入式负荷检测与分解:电力数据挖掘新视角
    2024年小程序云开发CMS内容管理无法使用,无法同步内容模型到云开发数据库的解决方案,回退老版本CMS内容管理的最新方法
    Redis基本数据类型:List
    用Python操控Minecraft我的世界 1.安装Spigot服务器并添加RaspberryJuice插件
    SparkSQL之LogicalPlan概述
    【算法4.2】约数(完结)
  • 原文地址:https://blog.csdn.net/lostrex/article/details/127722439