数据
算法
计算力
CPU
GPU
主要适合于计算密集型任务
什么类型的程序适合在GPU上运行
TPU
关系
计算机视觉 CV
自然语言处理 NLP
机器人
使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程
会直接影响机器学习的效果
为什么需要特征工程?
包含内容
特征提取
特征预处理
通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程
特征降维
一行数据 → 一个样本
一列数据 → 一个特征
可能有目标值(标签值)
数据类型构成
数据分割
训练集
测试集
划分比例
根据数据集组成不同
监督学习
输入数据是由输入特征值和目标值所组成
输出
无监督学习
半监督学习
强化学习
监督学习和强化学习的对比
小结
分类模型评估
准确率
精确率、召回率、F1-score、AUC指标等
回归模型评估
均方根误差 RMSE
相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)
过拟合
欠拟合
AML Azure Machine Learning
实验目的:根据人口普查数据预测不同人员收入情况
数据集:adult.data.csv
深度学习(Deep Learning)(也称为深度结构学习【Deep Structured Learning】、层次学习【Hierarchical Learning】或者是深度机器学习【Deep Machine Learning】)是一类算法集合,是机器学习的一个分支。