1.以下()组变量之间存在线性回归关系?
A:学生的性别与他的成绩
B:儿子的身高与父亲的身高
C:正方形的边长与面积
D: 正三角形的边长与周长
2.回归问题和分类问题的区别是?
A:回归问题有标签,分类问题没有
B:回归问题输出值是离散的,分类问题输出值是连续的
C:回归问题输出值是连续的,分类问题输出值是离散的
D:回归问题与分类问题在输入属性值上要求不同
3.以下说法错误的是?
A:残差是预测值与真实值之间的差值
B:损失函数越小,模型训练得一定越好
C:正则项的目的是为了避免模型过拟合
D:最小二乘法不需要选择学习率
4.哪些算法不需要数据归一化?
A:kNN
B:k-means
C:SVM
D: 决策树
5.以下()些方法不能用于处理欠拟合?
A:增大正则化系数
B:增加新的特征
C:增加模型复杂度
D:对特征进行变换,使用组合特征或高维特征
6.以下哪些方法不能用于处理过拟合?
A:对数据进行清洗
B:增大训练数据的量
C:利用正则化技术
D:增加数据属性的复杂度
7.下列关于线性回归分析中的残差(Residuals)说法正确的是?
选项:
A:残差均值总是为零
B:残差均值总是小于零
C:残差均值总是大于零
D:以上说法都不对
8.为了观察测试 Y 与 X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合?
选项:
A:散点图
B:柱形图
C:直方图
D:以上都不对
9.假如你在训练一个线性回归模型,则:1. 如果数据量较少,容易发生过拟合。2. 如果假设空间较小,容易发生过拟合。关于这两句话,下列说法正确的是?
选项:
A:1 和 2 都错误
B:1 正确,2 错误
C:1 错误,2 正确
D:1 和 2 都正确
10.关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确的是?
选项:
A:Ridge 回归适用于特征选择
B:Lasso 回归适用于特征选择
C:两个都适用于特征选择
D:以上说法都不对
11.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?
选项:
A:1 个
B:2 个
C:3 个
D:4 个
12.向量x=[1,2,3,4,-9,0]的L1范数是多少?
A:1
B:19
C:6
D:根号111
1.以下哪些是使用数据规范化(特征缩放)的原因?
A:它通过降低梯度下降的每次迭代的计算成本来加速梯度下降
B:它通过减少迭代次数来获得一个好的解,从而加快了梯度下降的速度
C:它不能防止梯度下降陷入局部最优
D:它防止矩阵X^TX 不可逆(奇异/退化)
2.线性回归中,我们可以使用最小二乘法来求解系数,下列关于最小二乘法说法正确的是?( )
A:只适用于线性模型,不适合逻辑回归模型等其他模型
B:不需要选择学习率
C:当特征数量很多的时候,运算速度会很慢
D:不需要迭代训练
3.欠拟合的处理主要有哪些方式:()
A:增加模型复杂度
B:减小正则化系数
C:增大正则化系数
D:添加新特征
4.假如使用一个较复杂的回归模型来拟合样本数据,使用 Ridge回归,调试正则化参数,来降低模型复杂度,若正则化系数较大时,关于偏差(bias)和方差(variance),下列说法正确的是?( )
选项:
A:偏差减小
B:偏差增大
C:方差减小
D:方差增大
1.如果两个变量相关,那么它们一定是线性关系。
答案: 【错误】
2.随机梯度下降,每次迭代时候,使用一个样本。
答案: 【正确】
3.L2正则化往往用于防止过拟合,而L1正则化往往用于特征选择。
答案: 【正确】
4.过拟合的处理可以通过减小正则化系数。
答案: 【错误】