• 【黑马-机器学习】0x00 - 机器学习入门课


    一、什么是机器学习?

    1. 定义

    机器学习是从数据中自动分析获得模型,并利用这个模型对未知数据进行预测

    2. 解释

    在这里插入图片描述
    机器学习的思路,简而言之就是模仿人类学习的过程。
    人类认知这个世界的过程是:根据以往的经验分析归纳总结出规律,从而去分析现实的状况。
    机器学习的过程是:根据以往的数据(其实这里就需要把人的经验量化为数据)进行分析得到模型,从而去分析现实的状况。

    3. 数据集

    从上面的描述我们可以看出,数据对于机器学习拥有非常重要的意义。那么,我们该如何从历史数据中获得规律呢?这些历史数据的格式是怎样的呢?

    数据的结构:特征值+目标值
    在这里插入图片描述
    比如这个图,数据就有4个特征(面积、位置、楼层、朝向)。
    一行数据我们称之为一个样本
    有些数据可以没有目标值(一般是分类问题)

    二、机器学习算法分类

    • 分类问题(监督学习) (有特征值和目标值,而且要分清楚类别(离散)),算法一般是K近邻,贝叶斯分类、决策树与随机森林、逻辑回归。
    • 回归问题 (监督学习)(有特征值和目标值,目标值是连续型数据,回归问题),算法一般是线性回归、岭回归。
    • 无监督学习 (数据集当中无目标值, 这类问题叫无监督学习),算法一般是聚类 k-means.

    1. 练习

    预测明天气温 – 回归问题
    预测明天是阴天还是晴天? --分类问题
    人脸年龄预测 – 分类/回归
    人脸识别 – 分类

    三、机器学习开发流程

    1. 获取数据
    2. 数据处理
    3. 特征工程(分为训练数据和测试数据)
    4. 机器学习算法训练 – 得到模型
    5. 模型评估,如果评估不通过,则重复2-5。
    6. 应用

    四、学习框架和资料

    会用算法,会处理数据,能干活就行了。
    工作内容:

    • 分析很多数据
    • 分析具体的业务
    • 应用常见的算法
    • 特征工程、调参、优化

    用什么框架? – sklearn(机器学习框架).

  • 相关阅读:
    centos7中卸载Java、jdk命令
    二、程序员指南:数据平面开发套件
    gcc 编译参数整理
    rtsp 和 rtmp 推流(一)
    大数据行业现在工作很难找吗?
    forfiles批量处理文件工具,定期清理备份文件
    LeetCode:1155. 掷骰子等于目标和的方法数(C++)
    基于openEuler虚拟机本地执行mugen测试脚本
    菜刀webshell特征分析
    Ab3d.PowerToys and Ab3d.DXEngine Crack
  • 原文地址:https://blog.csdn.net/weixin_41687289/article/details/126119945