• 【统计学习方法】P2 监督学习


    本笔记基于李航老师书籍《统计学习方法》
    2022年9月6日第一次阅读

    第二节 监督学习

    监督学习的任务 是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做一个好的预测。

    输入空间、特征空间与输出空间的概念

    输入空间: 输入的所有可能取值的集合称为输入空间(input space);
    输出空间: 输出的所有可能取值的集合称为输出空间(output space);

    每个具体的输入是一个实例,通常由特征向量表示。所有特征向量存在的空间称为特征空间,而特征向量的每一个维度对照着一个特征,或者称为属性。该属性其实就是每个实例的属性,而每个实例可能会有很多属性,每个属性也对照着一个属性值。根据属性与属性值张成的空间其实就是特征向量空间。

    特征向量 xi=(xi(1),xi(2),…,xi(m))T 表示第i个实例的m个属性。根据该特征向量张成空间,会发现其实属性的个数往往就是向量空间的维度。


    监督学习的基本概念

    监督学习从训练数据集合中学习模型,对测试数据进行预测。训练数据由输入与输出对组成,训练集通常表示为:T={(x1,y1),(x2,y2),…,(xN,yN)}

    测试数据也由相应的输入与输出对组成,输入与输出对又称为样本或者样本点。


    问题的形式化

    监督学习利用训练数据集学习一个模型,再用模型去对测试样本进行预测。由于训练所用的训练集是由人工给出的,所以叫做监督学习。

    在学习过程中,学习算法试图通过训练数据集中的样本(xi,yi)带来的信息学习模型。模型对输入的xi产生一个输出f(xi),尝试缩小yi与f(xi)之间的差。

  • 相关阅读:
    MySQL34道例题
    《实现领域驱动设计》-聚合
    递归题目树型实战
    UVA 10405【LCS】【背包】
    win10 安装.net framework 3.5,错误代码0x8024401C
    thinkphp8 DB_PREFIX 属性
    list.stream().forEach()和list.forEach()的区别
    域名限制注册有哪些原因?
    .NET应用如何防止被反编译
    代码随想录算法训练营第三十一天 | LeetCode 455. 分发饼干、376. 摆动序列、53. 最大子数组和
  • 原文地址:https://blog.csdn.net/weixin_43098506/article/details/126730349