Machine Learning Model

@Brief：一文整理机器学习方法，监督学习，无监督学习，自监督学习，弱监督学习，半监督学习的定义以及关系。

@Author：Li Dong

@Date：2022-11-13

机器学习（Machine Learning）是一门数据驱动（Data-driven）的科学，所谓的 数据驱动 是指需要使用样本数据训练模型（train model），然后再使用训练好的模型预测新的数据；根据样本数据（一般也称为训练数据（train data））携带标签（labels）与否，做以下分类：

监督学习(supervised learning)：训练数据需要标签（labels），监督学习分为分类问题和回归问题两种；常见的监督学习方法有：K近邻算法、线性回归、logistic回归、SVM等；
无监督学习(unsupervised learning)：训练数据不需要标签，无监督学习强调通过对数据内在特征的挖掘找到样本间的关系；无监督学习主要是聚类问题和降维问题；常见的无监督学习方法有：K-means、最大期望算法、PCA；
半监督学习(semi supervised learning)：只有部分训练数据包含标签，通常是大量未标记的数据和少量标记的数据；
半监督学习(self-supervised learning)：自监督学习和无监督学习一样都不需要训练数据额外的标签信息，但是自监督学习需要通过辅助任务（pretext）在大规模无监督数据中自动构造监督信息，通过得到的标签，就可以类似有监督学习一样进行训练；半监督学习是弱监督学习的一种。
弱监督学习(weakly supervised learning)：弱监督学习分为：不完全监督（Incomplete supervision），不确切监督（Inexact supervision），不精确监督（Inaccurate supervision）三种：
- 不完全监督（Incomplete supervision）：训练数据中只有一部分数据被给了标签，即半监督学习，
- 不确切监督（Inexact supervision）：训练数据只给出了粗粒度标签，
- 不精确监督（Inaccurate supervision）：给出的标签不总是正确的。
强化学习(reinforcement learning)：算法通过设计的奖励，不断试错进而提高模型的效果。

相关阅读:
live555 音视频处理相关文档解读，
JDBC原生代码
java.lang.Enum类下hashCode()方法起什么作用呢？
PostgreSQL逻辑复制（Logical Replication）原理
系统架构设计：15 论软件架构的生命周期
alibaba dragonwell jdk
代码中的解耦思维
TF/IDF算法
《剑指 Offer 》—03+11+05+21(offer消失术做题)
大数据-玩转数据-Flink 海量数据实时去重

原文地址：https://blog.csdn.net/qq_44847636/article/details/127838584