①比较老的概念:
Arthur Samuel(1959):Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
赋予计算机在没有明确设置下,使计算机具有学习能力的研究领域。
②比较新的概念:
Tom Mitchell (1998) :Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improveswith experience E.
计算机程序从经验E中学习,解决问题一些T,进行某一性能衡量P,P所衡量的T的性能随着经验E的增加而提高
举例1:对于一次跳棋游戏来说
E:算法 VS 我 的几万次游戏
T:跳棋游戏
P:与新对手博弈的胜率
举例2:分类邮件系统垃圾问题
1.定义
给算法一个数据集,其中包含了正确答案,算法的目的是为了给出更多正确的答案。
2.监督学习的分类与例子
①回归问题:预测连续值的输出,例如预测房价。
上图为不同面积房子的房价,假设你有一个750英尺的房子,他打算卖掉这个房子,他能卖多少钱?
机器学习能做什么?用线性函数拟合数据(150)或用二次函数或多项式拟合数据(200),或用更高阶的函数拟合(?)。选择一个拟合最合适的值作为预估房价。
②分类问题:预测离散值输出,例如判断肿瘤是良性还是恶性。
上图为肿瘤不同大小是否为良性,假设你的对头有一块肿瘤,怎么判断肿瘤是良性还是恶性?(0/1)
1.定义
无监督学习是不知道数据具体的含义,比如给定一些数据但不知道它们具体的信息,对于分类问题无监督学习可以得到多个不同的聚类,从而实现预测的功能。
举例:
①google中新闻的分类:将新闻分类为军事板块、娱乐板块、要闻板块.....
②社交系统分析:通过聊天记录分析熟悉的人模块