• Scala基础


    目录

    1.安装与运行Scala

    任务描述

    了解Scala语言

    了解Scala特性

    安装Scala

    运行Scala

    2.定义函数识别号码类型

    了解数据类型

    定义与使用常量、变量

    使用运算符

    定义与使用数组

    任务实现

    3.基本语法

    1 变量

    2 字符串

     3 数据类型&操作符

    4 条件表达式

    5 循环

    6 break和continue

    7 方法 

     8 函数

    9 数组

    10 元组

    11List

    12 Set

    13 Map

    14 iterator

    15 函数式编程

    4.面向对象

    5模式匹配

    3.样例类

    1.安装与运行Scala

    任务描述

    Scala是Spark编程常用的语言之一,本书进行Spark编程时使用的语言也是Scala。因此,在学习Spark之前,需要先了解Scala语言、Scala安装过程和基础编程操作。

    本节的任务如下。

    了解Scala语言及其特性并安装Scala,为后续Scala程序提供运行环境。

    了解Scala语言

    1.Scala是Scalable Language的缩写,是一种多范式的编程语言,由洛桑联邦理工学院的马丁·奥德斯在2001年基于Funnel的工作开始设计,设计初衷是想集成面向对象编程和函数式编程的各种特性

    2.Scala 是一种纯粹的面向对象的语言,每个值都是对象。Scala也是一种函数式语言,因此函数可以当成值使用。由于Scala整合了面向对象编程和函数式编程的特性,因此Scala相对于Java、C#、C++等其他语言更加简洁。

    3.Scala源代码会被编译成Java字节码,因此Scala可以运行于Java虚拟机(Java Virtual Machine,JVM)之上,并可以调用现有的Java类库。

    了解Scala特性

    面向对象,函数式编程,静态类型,可扩展

    安装Scala

    1. 在网页上运行Scala

    (1)通过浏览器查找Scastie并进入,即可进入Scala在线运行环境。

    (2)进入Scastie界面后,在上窗格中输入“println("hello world")”。

    (3)单击“Run”按钮,输出信息将显示在下窗格中,如下图。

    2.Scala环境设置

    (1)Scala运行环境众多,可以运行在Windows、Linux、macOS等系统上。Scala是运行在JVM上的语言,因此必须确保系统环境中安装了JDK,即Java开发工具包,而且必须确保JDK版本与本书安装的Spark的JDK编译版本一致,本书中使用的JDK是JDK 8(Java 1.8)。

    (2)查看Java版本

    3.Scala安装

    (1)在Linux和macOS系统上安装Scala

    从Scala官网下载Scala安装包,安装包名称为“scala-2.12.15.tgz”

    将其上传至/opt目录

    解压安装包至/usr/local目录下

    配置Scala环境变量

    (2)在Windows系统上安装Scala

    从Scala官网下载Scala安装包,安装包名称为“scala.msi”。

    双击scala.msi安装包,开始安装软件。

    进入欢迎界面,单击右下角的“Next”按钮后出现许可协议选择提示框,选择接受许可协议中的条款并单击右下角的“Next”按钮。

    选择安装路径,本文Scala的安装路径选择在非系统盘的“D:\Program Files (x86)\spark\scala\” ,单击“OK”按钮进入安装界面。

    在安装界面中单击右下角的“Install”按钮进行安装,安装完成时单击“Finish”按钮完成安装。

    右键单击“此电脑”图标,选择“属性”选项,在弹出的窗口中选择“高级系统设置”选项。在弹出的对话框中选择“高级”选项卡,并单击“环境变量”按钮,在环境变量对话框中,选择“Path”变量并单击“编辑”按钮,在Path变量中添加Scala安装目录的bin文件夹所在路径,如“D:\Program Files (x86)\spark\scala\bin”。

    运行Scala

    Scala解释器也称为REPL(Read-Evaluate-Print-Loop,读取-执行-输出-循环)。

    在命令行中输入“scala”,即可进入REPL,如下图。

    REPL是一个交互式界面,用户输入命令时,可立即产生交互反馈。

    输入“:quit”命令即可退出REPL,如下图。

    图2是一个Scala类,该类实现了两个数相加的方法。。

    如果要使用该方法,那么需要通过import加载该方法,如图1,其中,add是类名,addInt是方法名。

    图1:

    图2:

    2.定义函数识别号码类型

    任务描述

    中国移动、中国联通和中国电信这3种类型的手机号码都有特定的手机号码段。

    •中国移动的手机号码段有1340~1348、135~139、150~152、157~159、182~184、187、188、178、147、1705等;

    •中国联通的手机号码段有130~132、155、156、185、186、176、145、1709等;

    •中国电信的手机号码段有133、1349、153、180、181、189、1700、177等。

    本节的任务如下。

    •使用数组分别存储不同类型的手机号码段,并编写函数用于识别某个手机号码段的类型。

    了解数据类型

    了解Scala常用数据类型

    Scala会区分不同类型的值,并且会基于使用值的方式确定最终结果的数据类型,这称为类型推断。

    Scala使用类型推断可以确定混合使用数据类型时最终结果的数据类型。

    如在加法中混用Int和Double类型时,Scala将确定最终结果为Double类型,如下图。

    定义与使用常量、变量

    常量

    在程序运行过程中值不会发生变化的量为常量或值,常量通过val关键字定义,常量一旦定义就不可更改,即不能对常量进行重新计算或重新赋值。定义一个常量的语法格式如下。

    val name: type = initialization

    变量

    变量是在程序运行过程中值可能发生改变的量。变量使用关键字var定义。与常量不同的是,变量定义之后可以重新被赋值。定义一个变量的语法格式如下。

    var name: type = initialization

    使用运算符

    定义与使用数组

    数组是Scala中常用的一种数据结构,数组是一种存储了相同类型元素的固定大小的顺序集合。

    Scala定义一个数组的语法格式如下。

    # 第1种方式

    var arr: Array[String] = new Array[String](num)

    # 第2种方式

    var arr:Array[String] = Array(元素1,元素2,…)

    数组常用的方法

    数组的使用

    Scala可以使用range()方法创建区间数组。

    使用range()方法前同样需要先通过命令“import Array._”导入包。

    函数是Scala的重要组成部分,Scala作为支持函数式编程的语言,可以将函数作为对象.

    定义函数的语法格式如下。

    def functionName(参数列表): [return type] = {}

    Scala提供了多种不同的函数调用方式,以下是调用函数的标准格式。

    functionName(参数列表)

    如果函数定义在一个类中,那么可以通过“类名.方法名(参数列表)”的方式调用。

    1.匿名函数

    匿名函数即在定义函数时不给出函数名的函数。

    Scala中匿名函数是使用箭头“=>”定义的,箭头的左边是参数列表,箭头的右边是表达式,表达式将产生函数的结果。

    通常可以将匿名函数赋值给一个常量或变量,再通过常量名或变量名调用该函数。

    若函数中的每个参数在函数中最多只出现一次,则可以使用占位符“_”代替参数。

    2.高阶函数函数作为参数

    高阶函数指的是操作其他函数的函数。

    高阶函数可以将函数作为参数,也可以将函数作为返回值。

    高阶函数经常将只需要执行一次的函数定义为匿名函数并作为参数。一般情况下,匿名函数的定义是“参数列表=>表达式”。

    由于匿名参数具有参数推断的特性,即推断参数的数据类型,或根据表达式的计算结果推断返回结果的数据类型,因此定义高阶函数并使用匿名函数作为参数时,可以简化匿名函数的写法。

    3.高阶函数函数作为返回值

    高阶函数可以产生新的函数,并将新的函数作为返回值。

    定义高阶函数计算矩形的周长,该函数传入一个Double类型的值作为参数,返回以一个Double类型的值作为参数的函数,如下图。

    4.函数柯里化

    函数柯里化是指将接收多个参数的函数变换成接收单一参数(最初函数的第一个参数)的函数,新的函数返回一个以原函数余下的参数为参数的函数。

    定义两个整数相加的函数,一般函数的写法及其调用方式如下图。

    使用函数柯里化

    任务实现

    实现手机号码类型识别,首先用数组存储各种类型的手机号码段,并编写一个函数识别手机号码类型。

    •用数组分别存储各种类型的手机号码段。

    •定义一个函数identify识别手机号码段,并使用该函数查询手机号码段为133的手机号码类型。

    3.基本语法

    1 变量

    在scala中,可以使用val或者var来定义变量,语法格式如下:

    1. /** val定义:不可重新赋值的变量;var定义:可重新赋值的变量 */
    2. val/var 变量标识:变量类型 = 初始值

    [!NOTE]:变量类型写在变量名后面,不需要添加分号,优先使用val定义变量,如果变量需要被重新赋值,才使用var

    使用类型推断来定义变量

    scala可以自动根据变量的值来自动推断变量的类型

    1. scala> val name = "tom"
    2. name: String = tom

     惰性赋值

    在大数据开发中,有时会编写非常复杂的SQL语句,如果直接加载到JVM中,会有很大的内存开销。如何解决?当有一些变量保存的数据较大时,但是不需要马上加载到JVM内存。可以使用惰性赋值来提高效率。语法格式:

    lazy val/var 变量名 = 表达式
    
    2 字符串

    scala提供多种定义字符串的方式,将来我们可以根据需要来选择最方便的定义方式。

    使用双引号

    val/var 变量名 = “字符串”
    

     使用插值表达式

    scala中,可以使用插值表达式来定义字符串,有效避免大量字符串的拼接。

    val/var 变量名 = s"${变量/表达式}字符串"
    

    注意:定义字符串之前添加s;在字符串中,可以使用${}来引用变量或者编写表达式

    1. scala> val name = "zhangsan"
    2. scala> val age = 30
    3. scala> val sex = "male"
    4. scala> val info = s"name=${name}, age=${age}, sex=${sex}"
    5. info: String = name=zhangsan, age=30, sex=male

     使用三引号

    如果有大段的文本需要保存,就可以使用三引号来定义字符串。例如:保存一大段的SQL语句。三个引号中间的所有字符串都将作为字符串的值。

    1. val/var 变量名 = """字符串1
    2. 字符串2"""
     3 数据类型&操作符

    scala中的类型以及操作符绝大多数和Java一样,以下总结与java不一样的用法:

    数据类型

    scala类型与Java的区别:

    1. scala中所有的类型都使用大写字母
    2. 开头整形使用Int而不是Integer;
    3. scala中定义变量可以不写类型,让scala编译器自动推断;

    运算符

    • scala中没有,++、--运算符

    • 与Java不一样,在scala中,可以直接使用==!=进行比较,它们与equals方法表示一致。而比较两个对象的引用值,使用eq

    1. val str1 = "abc"
    2. val str2 = str1 + ""
    3. str1 == str2
    4. str1.eq(str2)
    4 条件表达式

    条件表达式就是if表达式,if表达式可以根据给定的条件是否满足,根据条件的结果(真或假)决定执行对应的操作。scala条件表达式的语法和Java一样。

    有返回值的if

    与Java不一样的是:1、条件表达式也是有返回值的;2、没有三元表达式,可以使用if表达式替代三元表达式

    1. scala> val sex = "male"
    2. sex: String = male
    3. scala> val result = if(sex == "male") 1 else 0
    4. result: Int = 1

    块表达式

    scala中,使用{}表示一个块表达式,和if表达式一样,块表达式也是有值的,值就是最后一个表达式的值。

    1. scala> val a = {
    2. | println("1 + 1")
    3. | 1 + 1
    4. }
    5 循环

    在scala中,可以使用for和while,但一般推荐使用for表达式,因为for表达式语法更简洁

    5.1 for表达式

    1. for(i <- 表达式/数组/集合) {
    2. // 表达式
    3. }
    1. scala> val nums = 1.to(10)
    2. nums: scala.collection.immutable.Range.Inclusive = Range(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
    3. scala> for(i <- nums) println(i)
    4. //简写方式:
    5. scala> for(i <- 1 to 10) println(i)

    嵌套循环

    for(i <- 1 to 3; j <- 1 to 5) {print("*");if(j == 5) println("")}
    

    for推导式

    将来可以使用for推导式生成一个新的集合(一组数据),在for循环体中,可以使用yield表达式构建出一个集合,把使用yield的for表达式称之为推导式.

    示例:生成一个10、20、30…100的集合

    1. // for推导式:for表达式中以yield开始,该for表达式会构建出一个集合
    2. val v = for(i <- 1 to 10) yield i * 10

    5.2 while循环

    scala中while循环和Java中是一致的

    1. scala> var i = 1
    2. scala> while(i <= 10) {
    3. | println(i)
    4. | i = i+1
    5. | }

    6 break和continue

    在scala中,类似Java和C++的break/continue关键字被移除了;如果一定要使用break/continue,就需要使用scala.util.control包的Break类的breable和break方法。

    break用法

    导入Breaks包import scala.util.control.Breaks._;使用breakable将for表达式包起来;for表达式中需要退出循环的地方,添加break()方法调用。示例如下:

    1. // 导入scala.util.control包下的Break
    2. import scala.util.control.Breaks._
    3. breakable{
    4. for(i <- 1 to 100) {
    5. if(i >= 50) break()
    6. else println(i)
    7. }
    8. }

    continue用法

    continue的实现与break类似,但有一点不同:实现break是用breakable{}将整个for表达式包起来,而实现continue是用breakable{}将for表达式的循环体包含起来就可以了。示例如下:

    1. // 导入scala.util.control包下的Break
    2. import scala.util.control.Breaks._
    3. for(i <- 1 to 100 ) {
    4. breakable{
    5. if(i % 10 == 0) break()
    6. else println(i)
    7. }
    8. }
    7 方法 
    1. def methodName (参数名:参数类型, 参数名:参数类型) : [return type] = {
    2. // 方法体:一系列的代码
    3. }

     注意:参数列表的参数类型不能省略;返回值类型可以省略,由scala编译器自动推断;返回值可以不写return,默认就是{}块表达式的值。

    1. scala> def add(a:Int, b:Int) = a + b
    2. m1: (x: Int, y: Int)Int
    3. scala> add(1,2)
    4. res10: Int = 3

     返回值类型推断

    scala定义方法可以省略返回值,由scala自动推断返回值类型。这样方法定义后更加简洁。但是要注意:定义递归方法,不能省略返回值类型。示例如下:

    1. scala> def m2(x:Int) = {
    2. | if(x<=1) 1
    3. | else m2(x-1) * x
    4. | }
    5. :13: error: recursive method m2 needs result type
    6. else m2(x-1) * x

    1.1 方法参数

    scala中的方法参数,使用比较灵活。它支持以下几种类型的参数:

    默认参数:在定义方法时可以给参数定义一个默认值。

    1. // x,y带有默认值为0
    2. def add(x:Int = 0, y:Int = 0) = x + y
    3. add()

    带名参数:在调用方法时,可以指定参数的名称来进行调用。

    1. def add(x:Int = 0, y:Int = 0) = x + y
    2. add(x=1)

    变长参数:如果方法的参数是不固定的,在参数类型后面加一个*号,表示参数可以是0个或者多个。 

    1. def 方法名(参数名:参数类型*):返回值类型 = {
    2. 方法体
    3. }
    1. scala> def add(num:Int*) = num.sum
    2. add: (num: Int*)Int
    3. scala> add(1,2,3,4,5)
    4. res1: Int = 15
     8 函数

    scala支持函数式编程,函数定义不需要使用,无需指定返回值类型;def定义语法如下:

    val 函数变量名 = (参数名:参数类型, 参数名:参数类型....) => 函数体
    
    1. scala> val add = (x:Int, y:Int) => x + y
    2. add: (Int, Int) => Int =
    3. scala> add(1,2)
    4. res3: Int = 3

    方法和函数的区别:

    1.方法是隶属于类或者对象的,在运行时,它是加载到JVM的方法区中
    2.可以将函数对象赋值给一个变量,在运行时,它是加载到JVM的堆内存中
    3.函数是一个对象,继承自FunctionN,函数对象有apply,curried,toString,tupled这些方法。方法则没有

    9 数组

    scala中数组的概念是和Java类似,可以用数组来存放一组数据。scala中,有两种数组,一种是定长数组,另一种是变长数组

    1.1 定长数组

    定长数组指的是数组的长度不允许改变的,数组的元素可以改变的。语法如下:

    1. // 通过指定长度定义数组
    2. val/var 变量名 = new Array[元素类型](数组长度)
    3. // 用元素直接初始化数组
    4. val/var 变量名 = Array(元素1, 元素2, 元素3...)

    注意:在scala中,数组的泛型使用[]来指定,使用()来获取元素

    1. scala> val a = new Array[Int](100)
    2. a: Array[Int] = Array(0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...)
    3. scala> a(0) = 110
    4. scala> a(0)
    5. 110

    1.2 变长数组

    变长数组指的是数组的长度是可变的,可以往数组中添加、删除元素。

    定义变长数组

    创建变长数组,需要提前导入ArrayBuffer类import scala.collection.mutable.ArrayBuffer,语法:

    创建空的ArrayBuffer变长数组:

    val/var a = ArrayBuffer[元素类型]()
    
    val a = ArrayBuffer[Int]()
    

     创建带有初始元素的ArrayBuffer

    val/var a = ArrayBuffer(元素1,元素2,元素3....)
    
    1. scala> val a = ArrayBuffer("hadoop", "storm", "spark")
    2. a: scala.collection.mutable.ArrayBuffer[String] = ArrayBuffer(hadoop, storm, spark)

    添加/修改/删除元素

    • 使用+=添加元素
    • 使用-=删除元素
    • 使用++=追加一个数组到变长数组
    1. // 定义变长数组
    2. scala> val a = ArrayBuffer("hadoop", "spark", "flink")
    3. a: scala.collection.mutable.ArrayBuffer[String] = ArrayBuffer(hadoop, spark, flink)
    4. // 追加一个元素
    5. scala> a += "flume"
    6. res10: a.type = ArrayBuffer(hadoop, spark, flink, flume)
    7. // 删除一个元素
    8. scala> a -= "hadoop"
    9. res11: a.type = ArrayBuffer(spark, flink, flume)
    10. // 追加一个数组
    11. scala> a ++= Array("hive", "sqoop")
    12. res12: a.type = ArrayBuffer(spark, flink, flume, hive, sqoop)

    1.3 遍历数组

    可以使用以下两种方式来遍历数组:

    使用for表达式直接遍历数组中的元素

    1. scala> val a = Array(1,2,3,4,5)
    2. scala> for(i<-a) println(i)

    使用索引遍历数组中的元素

    1. scala> val a = Array(1,2,3,4,5)
    2. scala> for(i <- 0 to a.length - 1) println(a(i))
    3. scala> for(i <- 0 until a.length) println(a(i))

    1.4 数组常用操作

    scala中的数组封装了一些常用的计算操作,在对数据处理的时候不需要再重新实现;以下为常用的几个算法:

    求和:数组中的sum方法可以将所有的元素进行累加,然后得到结果

    1. scala> val a = Array(1,2,3,4)
    2. scala> a.sum

    最大值:数组中的max方法,可以获取到数组中的最大的那个元素值 

    1. scala> val a = Array(4,1,2,4,10)
    2. scala> a.max

    最小值:数组的min方法,可以获取到数组中最小的那个元素值

    1. scala> val a = Array(4,1,2,4,10)
    2. scala> a.min

    排序sorted方法,将数组进行升序排序;reverse方法,将数组进行反转,实现降序排序 

    1. scala> val a = Array(4,1,2,4,10)
    2. scala> a.sorted
    3. scala> a.sorted.reverse
    10 元组

    元组可以用来包含一组不同类型的值。例如:姓名,年龄,性别,出生年月。元组的元素是不可变的。语法定义:

    使用括号来定义元组

    val/var 元组 = (元素1, 元素2, 元素3....)
    

    使用箭头来定义元组(元组只有两个元素)

    val/var 元组 = 元素1->元素2
    
    1. scala> val a = ("zhangsan", 20)
    2. scala> val a = "zhangsan" -> 20

     访问元组

    使用_1、_2、_3…来访问元组中的元素,_1表示访问第一个元素,依次类推.

    1. scala> val a = "zhangsan" -> "male"
    2. scala> a._1
    3. scala> a._2
    11List

    列表是scala中最重要的、也是最常用的数据结构。List具备以下性质:可以保存重复的值,有先后顺序。在scala中,也有两种列表,一种是不可变列表、另一种是可变列表。

    使用ListBuffer[元素类型]()创建空的可变列表,语法结构:

    val/var 变量名 = ListBuffer[Int]()
    

    使用ListBuffer(元素1, 元素2, 元素3...)创建可变列表,语法结构: 

    val/var 变量名 = ListBuffer(元素1,元素2,元素3...)
    
    1. /* 示例一:创建空的整形可变列表 */
    2. scala> val a = ListBuffer[Int]()
    3. /* 示例二:创建一个可变列表,包含以下元素:1,2,3,4 */
    4. scala> val a = ListBuffer(1,2,3,4)

     判断列表是否为空

    1. scala> val a = List(1,2,3,4)
    2. scala> a.isEmpty
    12 Set

    Set(集)是代表没有重复元素的集合。Set具备两个性质:1. 元素不重复;2. 不保证插入顺序。scala中的集也分为两种,一种是不可变集,另一种是可变集。

    1.1 不可变集

    创建一个空的不可变集,语法格式:

    val/var 变量名 = Set[类型]()
    

    给定元素来创建一个不可变集,语法格式:

    val/var 变量名 = Set(元素1, 元素2, 元素3...)
    
    1. /* 示例一:定义一个空的不可变集 */
    2. scala> val a = Set[Int]()
    3. /* 示例二:定义一个不可变集,保存以下元素:1,1,3,2,4,8 */
    4. scala> val a = Set(1,1,3,2,4,8)

    基本操作

    1. // 创建集
    2. scala> val a = Set(1,1,2,3,4,5)
    3. // 获取集的大小
    4. scala> a.size
    5. // 遍历集
    6. scala> for(i <- a) println(i)
    7. // 删除一个元素
    8. scala> a - 1
    9. // 拼接两个集
    10. scala> a ++ Set(6,7,8)
    11. // 拼接集和列表
    12. scala> a ++ List(6,7,8,9)
    13 Map

    Map可以称之为映射。它是由键值对组成的集合。在scala中,Map也分为不可变Map和可变Map。

    1.1 不可变Map

    1. val/var map = Map(键->值, 键->值, 键->值...) // 推荐,可读性更好
    2. val/var map = Map((键, 值), (键, 值), (键, 值), (键, 值)...)
    1. scala> val map = Map("zhangsan"->30, "lisi"->40)
    2. scala> val map = Map(("zhangsan", 30), ("lisi", 30))
    3. /* 根据key获取value */
    4. scala> map("zhangsan")

    1.2 可变Map

    定义语法与不可变Map一致。但定义可变Map需要手动导入import scala.collection.mutable.Map

    1. scala> val map = Map("zhangsan"->30, "lisi"->40)
    2. /* 修改value */
    3. scala> map("zhangsan") = 20
    14 iterator

    scala针对每一类集合都提供了一个迭代器(iterator)用来迭代访问集合。

    使用迭代器遍历集合

    使用iterator方法可以从集合获取一个迭代器,迭代器的两个基本操作:

    hasNext——查询容器中是否有下一个元素
    next——返回迭代器的下一个元素,如果没有,抛出NoSuchElementException
    每一个迭代器都是有状态的;迭代完后保留在最后一个元素的位置,再次使用则抛出NoSuchElementException;可以使用while或者for来逐个返回元素。

    1. scala> val a = List(1,2,3,4,5)
    2. scala> val ite = a.iterator
    3. scala> while(ite.hasNext) {
    4. | println(ite.next)
    5. | }
    6. scala> for(i <- a) println(i)
    15 函数式编程

    1.1 foreach

    使用foreach方法来进行遍历、迭代,它可以让代码更加简洁。

    foreach(f: (A) ⇒ Unit): Unit
    

    示例:有一个列表,包含以下元素1,2,3,4,使用foreach方法遍历打印每个元素

    1. scala> val a = List(1,2,3,4)
    2. scala> a.foreach((x:Int)=>println(x))

    上述案例函数定义有点啰嗦,因为使用foreach去迭代列表,而列表中的每个元素类型是确定的:scala可以自动来推断出来集合中每个元素参数的类型,创建函数时,可以省略其参数列表的类型。如下:

    scala> a.foreach(x=>println(x))
    

    当函数参数,只在函数体中出现一次,而且函数体没有嵌套调用时,可以使用下划线来简化函数定义

    scala> a.foreach(println(_))
    

    如果方法参数是函数,如果出现了下划线,scala编译器会自动将代码封装到一个函数中,参数列表也是由scala编译器自动处理。

    1.2 Map

    map方法接收一个函数,将这个函数应用到每一个元素,返回一个新的列表

     

    def map[B](f: (A) ⇒ B): TraversableOnce[B]
    

     map方法解析

    1. scala> val a = List(1,2,3,4)
    2. scala> a.map(x=>x+1)
    3. /* 或者 */
    4. scala> a.map(_ + 1)

    1.3 flatMap

    扁平化映射可以把flatMap,理解为先map,然后再flatten。

    • map是将列表中的元素转换为一个List
    • flatten再将整个列表进行扁平化
    def flatMap[B](f: (A) ⇒ GenTraversableOnce[B]): TraversableOnce[B]
    

    1.4 filter

    过滤符合一定条件的元素

    def filter(p: (A) ⇒ Boolean): TraversableOnce[A]
    

    scala> List(1,2,3,4,5,6,7,8,9).filter(_ % 2 == 0)
    

    1.5 分组

    如果要将数据按照分组来进行统计分析,就需要使用到分组方法。groupBy表示按照函数将列表分成不同的组。

    def groupBy[K](f: (A) ⇒ K): Map[K, List[A]]
    

    groupBy执行过程 

    1. scala> val a = List("张三"->"男", "李四"->"女", "王五"->"男")
    2. // 按照性别分组
    3. scala> a.groupBy(_._2)
    4. // 将分组后的映射转换为性别/人数元组列表
    5. scala> res0.map(x => x._1 -> x._2.size)
    6. res3: scala.collection.immutable.Map[String,Int] = Map(男 -> 2, 女 -> 1)

    4.面向对象

    scala是支持面向对象的,也有类和对象的概念;依然可以基于scala语言来开发面向对象的应用程序。

    1.1 创建类和对象

    1. object ClassDemo {
    2. // 创建类
    3. class Person{}
    4. def main(args: Array[String]): Unit = {
    5. // 创建对象
    6. val p = new Person()
    7. println(p)
    8. }
    9. }

    1.2 定义和访问成员变量

    一个类会有自己的属性,例如:人这样一个类,有自己的姓名和年龄。具体用法如下:

    • 在类中使用var/val来定义成员变量
    • 对象直接使用成员变量名称来访问成员变量
    1. object ClassDemo {
    2. class Person {
    3. // 定义成员变量
    4. var name = ""
    5. var age = 0
    6. }
    7. def main(args: Array[String]): Unit = {
    8. // 创建Person对象
    9. val person = new Person
    10. person.name = "zhangsan"
    11. person.age = 20
    12. // 获取变量值
    13. println(person.name)
    14. println(person.age)
    15. }
    16. }

    1.3 使用下划线初始化成员变量

    scala中有一个更简洁的初始化成员变量的方式,可以让代码看起来更加简洁,用法如下:

    • 在定义var类型的成员变量时,可以使用_来初始化成员变量;
    • val类型的成员变量,必须要自己手动初始化;
    1. object ClassDemo {
    2. class Person{
    3. // 使用下划线进行初始化
    4. var name:String = _
    5. var age:Int = _
    6. val sign:Boolean = true
    7. }
    8. def main(args: Array[String]): Unit = {
    9. val person = new Person
    10. println(person.name)
    11. println(person.age)
    12. println(person.sign)
    13. }
    14. }

    1.4 定义成员方法

    类可以有自己的行为,scala中也可以通过定义成员方法来定义类的行为。在scala的类中,也是使用def来定义成员方法。

    1. object ClassDemo {
    2. class Customer {
    3. var name:String = _
    4. var sex:String = _
    5. // 定义成员方法
    6. def sayHi(msg:String) = {
    7. println(msg)
    8. }
    9. }
    10. def main(args: Array[String]): Unit = {
    11. val customer = new Customer
    12. customer.name = "张三"
    13. customer.sex = "男"
    14. customer.sayHi("你好")
    15. }
    16. }

    1.5 成员访问修饰符
    和Java一样,scala也可以通过访问修饰符,来控制成员变量和成员方法是否可以被访问。Java中的访问控制,同样适用于scala,可以在成员前面添加private/protected关键字来控制成员的可见性。但在scala中没有public关键字,任何没有被标为private或protected的成员都是公共的。

    1. object AccessDemo {
    2. class Person {
    3. // 定义私有成员变量
    4. private var name:String = _
    5. private var age:Int = _
    6. def getName() = name
    7. def setName(name:String) = this.name = name
    8. def getAge() = age
    9. def setAge(age:Int) = this.age = age
    10. // 定义私有成员方法
    11. private def getNameAndAge = {
    12. name -> age
    13. }
    14. }
    15. def main(args: Array[String]): Unit = {
    16. val person = new Person
    17. person.setName("张三")
    18. person.setAge(10)
    19. println(person.getName())
    20. println(person.getAge())
    21. }
    22. }

    5模式匹配

    scala中有一个非常强大的模式匹配机制,可以应用在很多场景:switch语句,类型查询,使用模式匹配快速获取数据。

    1 简单匹配

    在Java中,有switch关键字,可以简化if条件判断语句。在scala中,可以使用match表达式替代。

    1. 变量 match {
    2. case "常量1" => 表达式1
    3. case "常量2" => 表达式2
    4. case "常量3" => 表达式3
    5. case _ => 表达式4 // 默认匹配
    6. }
    1. println("请输出一个词:")
    2. // StdIn.readLine表示从控制台读取一行文本
    3. val name = StdIn.readLine()
    4. val result = name match {
    5. case "hadoop" => "大数据分布式存储和计算框架"
    6. case "zookeeper" => "大数据分布式协调服务框架"
    7. case "spark" => "大数据分布式内存计算框架"
    8. case _ => "未匹配"
    9. }
    10. println(result)

    2 匹配类型

    除了像Java中的switch匹配数据之外,match表达式还可以进行类型匹配。如果要根据不同的数据类型,来执行不同的逻辑,也可以使用match表达式来实现。

    1. 变量 match {
    2. case 类型1变量名: 类型1 => 表达式1
    3. case 类型2变量名: 类型2 => 表达式2
    4. case 类型3变量名: 类型3 => 表达式3
    5. ...
    6. case _ => 表达式4
    7. }
    1. val a:Any = "hadoop"
    2. val result = a match {
    3. case _:String => "String"
    4. case _:Int => "Int"
    5. case _:Double => "Double"
    6. }
    7. println(result)

    3.样例类

    样例类是一种特殊类,它可以用来快速定义一个用于保存数据的类(类似于Java POJO类)。语法格式:

    case class 样例类名([var/val] 成员变量名1:类型1, 成员变量名2:类型2, 成员变量名3:类型3)
    

    如果要实现某个成员变量可以被修改,可以添加var;默认为val,可以省略。

    1. object CaseClassDemo {
    2. case class Person(name:String, age:Int)
    3. def main(args: Array[String]): Unit = {
    4. val zhangsan = Person("张三", 20)
    5. println(zhangsan)
    6. }
    7. }

    1 样例类方法

    当我们定义一个样例类,编译器自动帮助我们实现了以下几个有用的方法:

    1.1 apply

    apply方法可以让我们快速地使用类名来创建对象(省略了new关键字)。参考以下代码:

    1. case class CasePerson(name:String, age:Int)
    2. object CaseClassDemo {
    3. def main(args: Array[String]): Unit = {
    4. val lisi = CasePerson("李四", 21)
    5. println(lisi.toString)
    6. }
    7. }

    1.2 toString

    toString返回样例类名称(成员变量1, 成员变量2, 成员变量3…),我们可以更方面查看样例类的成员。

    1. case class CasePerson(name:String, age:Int)
    2. object CaseClassDemo {
    3. def main(args: Array[String]): Unit = {
    4. val lisi = CasePerson("李四", 21)
    5. println(lisi.toString)
    6. // 输出:CasePerson(李四,21)
    7. }
    8. }

    1.3 equals

    样例类自动实现了equals方法,可以直接使用==比较两个样例类是否相等,即所有的成员变量是否相等

    1. val lisi1 = CasePerson("李四", 21)
    2. val lisi2 = CasePerson("李四", 21)
    3. println(lisi1.eq(lisi2)) //false
    4. println(lisi1 == lisi2) //true

    1.4copy

    样例类实现了copy方法,可以快速创建一个相同的实例对象,可以使用带名参数指定给成员进行重新赋值

    1. val lisi1 = CasePerson("李四", 21)
    2. val wangwu = lisi1.copy(name="王五")
    3. println(wangwu)


     

  • 相关阅读:
    ssm+java+vue家乡农产品特产销售商城小程序#毕业设计
    两种让python输出更加美观的方式,三分钟看完就会
    ipv6地址概述——带你了解ipv6与ipv4的不同
    玩转Mysql系列 - 第17篇:存储过程&自定义函数详解
    中文写代码?开始不信后来用中文写了剧情小游戏!嗯,真香~
    线段树区间查改(懒标记+代码细节)
    淘宝/天猫API:item_search_shop-获得店铺的所有商品
    【vue导入导出Excel】vue简单实现导出和导入复杂表头excel表格功能【纯前端版本和配合后端版本】
    创建对象在堆区如何分配内存
    Vieworks首款采用CoF接口的工业相机亮相!
  • 原文地址:https://blog.csdn.net/2301_77281478/article/details/138782681