机器学习是从数据中自动分析获得模型,并利用这个模型对未知数据进行预测。

机器学习的思路,简而言之就是模仿人类学习的过程。
人类认知这个世界的过程是:根据以往的经验分析归纳总结出规律,从而去分析现实的状况。
机器学习的过程是:根据以往的数据(其实这里就需要把人的经验量化为数据)进行分析得到模型,从而去分析现实的状况。
从上面的描述我们可以看出,数据对于机器学习拥有非常重要的意义。那么,我们该如何从历史数据中获得规律呢?这些历史数据的格式是怎样的呢?
数据的结构:特征值+目标值

比如这个图,数据就有4个特征(面积、位置、楼层、朝向)。
一行数据我们称之为一个样本。
有些数据可以没有目标值(一般是分类问题)。
预测明天气温 – 回归问题
预测明天是阴天还是晴天? --分类问题
人脸年龄预测 – 分类/回归
人脸识别 – 分类
会用算法,会处理数据,能干活就行了。
工作内容:
用什么框架? – sklearn(机器学习框架).