【无标题】

【无标题】
机器学习1

提示：适合初学者使用

提示：写完文章后，记得点点关注，持续更新机器学习系列
文章目录
一、机器学习、人工智能、深度学习是什么关系？

概念：机器学习研究和构建的是一种特殊算法（而非某一个特定的算法），能够让计算机自己在数据中
学习从而进行预测。所以，机器学习不是某种具体的算法，而是很多算法的统称。比如说：股票数据，
年份的GDP数据，从这些数据中去学习，学习这些数据的规律，然后使用这个规律去预测未来（例如未
来十天股票的价格）
机器学习包含了很多种不同的算法，深度学习就是其中之一，其他方法包括决策树，聚类，贝叶斯等。
深度学习的灵感来自大脑的结构和功能，即许多神经元的互连。人工神经网络（ANN）是模拟大脑生物
结构的算法。目前非常流行的有CNN,BP神经网络等。
不管是机器学习还是深度学习，都属于人工智能（AI）的范畴。所以人工智能、机器学习、深度学习可
以用下面的图来表示

 二、什么是机器学习？

机器学习的基本思路：
- 把现实生活中的问题抽象成数学模型，并且很清楚模型中不同参数的作用
- 利用数学方法对这个数学模型进行求解，从而解决现实生活中的问题
- 评估这个数学模型，是否真正的解决了现实生活中的问题，解决的如何？
2.2 机器学习的原理

下面以监督学习为例，给大家讲解一下机器学习的实现原理。假如我们正在教小朋友识字（一、二、
三）。我们首先会拿出3张卡片，然后便让小朋友看卡片，一边说“一条横线的是一、两条横线的是二、
三条横线的是三”。
不断重复上面的过程，小朋友的大脑就在不停的学习：
当重复的次数足够多时，小朋友就学会了一个新技能——认识汉字：一、二、三：
我们用上面人类的学习过程来类比机器学习。机器学习跟上面提到的人类学习过程很相似。
- 上面提到的认字的卡片在机器学习中叫——训练集
- 上面提到的“一条横线，两条横线”这种区分不同汉字的属性叫——特征。再比如说：人的眼睛、嘴
  巴也是不同的特征；男生有胡子，女生没有。
- 小朋友不断学习的过程叫——建模
- 学会了识字后总结出来的规律叫——模型
- 当小朋友学会后，我们再给小朋友去识别一些新的卡片，这些卡片叫——测试集
通过训练集，不断识别特征，不断建模，最后形成有效的模型，这个过程就叫“机器学习”！

三、监督学习、非监督学习、强化学习

 3.1 监督学习

监督学习是指我们给算法一个数据集，并且给定正确答案。机器通过数据来学习正确答案的计算方法。
举个例子：我们准备了一大堆猫和狗的照片，我们想让机器学会如何识别猫和狗。当我们使用监督学习
的时候，我们需要给这些照片打上标签。
我们给照片打的标签就是“正确答案”，机器通过大量学习，就可以学会在新照片中认出猫和狗。
这种通过大量人工打标签来帮助机器学习的方式就是监督学习。这种学习方式效果非常好，但是成本也
非常高。

3.2 非监督学习

非监督学习中，给定的数据集没有“正确答案”，所有的数据都是一样的。无监督学习的任务是从给定的
数据集中，挖掘出潜在的结构。
举个例子：我们把一堆猫和狗的照片给机器，不给这些照片打任何标签，但是我们希望机器能够将这些
照片分分类：
通过学习，机器会把这些照片分为2类，一类都是猫的照片，一类都是狗的照片。虽然跟上面的监督学习
看上去结果差不多，但是有着本质的差别：非监督学习中，虽然照片分为了猫和狗，但是机器并不知道
哪个是猫，哪个是狗。对于机器来说，相当于分成了 A、B 两类。

3.3 强化学习

强化学习是机器学习的一种学习方式，它跟监督学习、无监督学习是对应的.强化学习更接近生物学习的
本质，因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为，从而获得最大的累
积回报。通过强化学习，一个智能体应该知道在什么状态下应该采取什么行为。
最典型的场景就是打游戏。2019年1月25日，AlphaStar（Google 研发的人工智能程序，采用了强化学
习的训练方式）完虐星际争霸的职业选手职业选手“TLO”和“MANA”。还有比如王者荣耀里面的人机，很
多大型游戏里面的人机也是强化学习，

四、机器学习实操的7个步骤

机器学习在实际操作层面一共分为7步：
1. 收集数据
2. 数据准备（数据处理整洁）
3. 选择一个模型（也可叫做算法）
4. 训练
5. 评估（准确率之类的指标）
6. 参数调整
7. 预测（开始使用）
  假设我们的任务是通过酒精度和颜色来区分红酒和啤酒，下面详细介绍一下机器学习中每一个步骤是如
  何工作的。
  步骤1：收集数据
  我们在超市买来一堆不同种类的啤酒和红酒，然后再买来测量颜色的光谱仪和用于测量酒精度的设备。
  这个时候，我们把买来的所有酒都标记出他的颜色和酒精度，会形成下面这张表格。
这一步非常重要，因为数据的数量和质量直接决定了预测模型的好坏。
步骤2：数据准备
在这个例子中，我们的数据是很工整的，但是在实际情况中，我们收集到的数据会有很多问题，所以会
涉及到数据清洗等工作。
当数据本身没有什么问题后，我们将数据分成3个部分：训练集（60%）、验证集（20%）、测试集
（20%），用于后面的验证和评估工作。
步骤3：选择一个模型
研究人员和数据科学家多年来创造了许多模型。有些非常适合图像数据，有些非常适合于序列（如文本
或音乐），有些用于数字数据，有些用于基于文本的数据。
在我们的例子中，由于我们只有2个特征，颜色和酒精度，我们可以使用一个小的线性模型，这是一个相
当简单的模型。
步骤4：训练
大部分人都认为这个是最重要的部分，其实并非如此~ 数据数量和质量、还有模型的选择比训练本身重
要更多（训练知识台上的3分钟，更重要的是台下的10年功）。
这个过程就不需要人来参与的，机器独立就可以完成，整个过程就好像是在做算术题。因为机器学习的
本质就是将问题转化为数学问题，然后解答数学题的过程。
步骤5：评估
一旦训练完成，就可以评估模型是否有用。这是我们之前预留的验证集和测试集发挥作用的地方。评估
的指标主要有准确率、召回率、F值。
这个过程可以让我们看到模型如何对尚未看到的数是如何做预测的。这意味着代表模型在现实世界中的
表现。
步骤6：参数调整
完成评估后，您可能希望了解是否可以以任何方式进一步改进训练。我们可以通过调整参数来做到这一
点。当我们进行训练时，我们隐含地假设了一些参数，我们可以通过认为的调整这些参数让模型表现的
更出色。注意：调整好模型参数后，需要从新训练，再重新评估。
步骤7：预测
我们上面的6个步骤都是为了这一步来服务的。这也是机器学习的价值。这个时候，当我们买来一瓶新的
酒，只要告诉机器他的颜色和酒精度，他就会告诉你，这时啤酒还是红酒了。

五、16种经典机器学习算法

线性回归监督学习
逻辑回归监督学习
线性判别分析监督学习
决策树监督学习
朴素贝叶斯监督学习
K邻近（KNN) 监督学习
学习向量量化监督学习
支持向量机监督学习
随机森林监督学习
AdaBoost 监督学习
高斯混合模型非监督学习
限制波尔兹曼机非监督学习
K-means 聚类非监督学习
最大期望算法非监督学习
主成成分分析算法非监督学习
以上是常见的一些算法，希望读者学会，无论你是想要从事机器学习/数据分析的工作，还是学生期间的
数学建模类竞赛，这都是必备的一块知识。
比如说打的数学建模竞赛，几乎每一场比赛都会用到机器学习的知识，当然包括数据分析，首先对数据
分析、清晰，然后再用到机器学习的算法。
本节课主要为概念，理解为主，没有复杂的数学公式，让任何读者都能明白这些概念。后期实际操做
中，我们用到什么数学公式、指标之类的，再做具体的讲解。以实战中领悟机器学习的算法使用。

加入我，让我们一起进步吧
相关阅读:
Vue源码学习(五):<templete>渲染第四步,生成虚拟dom并将其转换为真实dom
如何在idea中隐藏文件或文件夹
 【C++】哈希应用——海量数据面试题
 安利一波C2工具
 Java线程创建的四种方式
 【面试题】JDBC桥接模式如何实现的？
Codeforces Round 933 (Div. 3) A~D
VEX —— Functions|Arrays
《Linux运维总结：使用elasticdump工具迁移单节点elasticsearch数据(方案一)》
Vue模板语法2
原文地址：https://blog.csdn.net/qq_52689354/article/details/128068601

机器学习1

文章目录

一、机器学习、人工智能、深度学习是什么关系？

二、什么是机器学习？

2.2 机器学习的原理

三、监督学习、非监督学习、强化学习

3.1 监督学习

3.2 非监督学习

3.3 强化学习

四、机器学习实操的7个步骤

五、16种经典机器学习算法