• Machine Learning Model


    @Brief:一文整理机器学习方法,监督学习,无监督学习,自监督学习,弱监督学习,半监督学习的定义以及关系。

    @Author:Li Dong

    @Date:2022-11-13

    机器学习(Machine Learning)是一门数据驱动(Data-driven)的科学,所谓的 数据驱动 是指需要使用样本数据训练模型(train model),然后再使用训练好的模型预测新的数据;根据样本数据(一般也称为训练数据(train data))携带标签(labels)与否,做以下分类:

    • 监督学习(supervised learning):训练数据需要标签(labels),监督学习分为 分类问题 和 回归问题 两种;常见的监督学习方法有:K近邻算法、线性回归、logistic回归、SVM等;
    • 无监督学习(unsupervised learning):训练数据不需要标签,无监督学习强调通过对数据内在特征的挖掘找到样本间的关系;无监督学习主要是 聚类问题 和 降维问题 ;常见的无监督学习方法有:K-means、最大期望算法、PCA;
    • 半监督学习(semi supervised learning):只有部分训练数据包含标签,通常是大量未标记的数据和少量标记的数据;
    • 半监督学习(self-supervised learning):自监督学习和无监督学习一样都不需要训练数据额外的标签信息,但是自监督学习需要通过辅助任务(pretext)在大规模无监督数据中自动构造监督信息,通过得到的标签,就可以类似有监督学习一样进行训练;半监督学习是弱监督学习的一种。
    • 弱监督学习(weakly supervised learning):弱监督学习分为:不完全监督(Incomplete supervision),不确切监督(Inexact supervision),不精确监督(Inaccurate supervision)三种:
      • 不完全监督(Incomplete supervision):训练数据中只有一部分数据被给了标签,即半监督学习,
      • 不确切监督(Inexact supervision):训练数据只给出了粗粒度标签,
      • 不精确监督(Inaccurate supervision):给出的标签不总是正确的。
    • 强化学习(reinforcement learning):算法通过设计的奖励,不断试错进而提高模型的效果。
  • 相关阅读:
    live555 音视频处理相关文档解读,
    JDBC原生代码
    java.lang.Enum类下hashCode()方法起什么作用呢?
    PostgreSQL逻辑复制(Logical Replication)原理
    系统架构设计:15 论软件架构的生命周期
    alibaba dragonwell jdk
    代码中的解耦思维
    TF/IDF算法
    《剑指 Offer 》—03+11+05+21(offer消失术做题)
    大数据-玩转数据-Flink 海量数据实时去重
  • 原文地址:https://blog.csdn.net/qq_44847636/article/details/127838584