在PAC学习框架下:
strongly learnable:如果存在一个多项式的学习算法能够学习它,并且正确率很高,那么就称这个概念是强可学习的。
weakly learnable:如果存在一个多项式的学习算法能够学习它,并且正确率仅比随机猜测略好,那么就称这个概念是弱可学习的。
提升方法:从弱学习算法(更容易做到)出发,反复学习,得到一系列弱分类器(基本分类器),组合这些弱分类器,构成一个强分类器。大多数提升方法都是改变训练数据的概率分布(训练数据的权值分布),针对不同的训练数据分布调用弱学习算法学习一系列弱分类器。
两个问题:
problem one:每一轮如何改变训练数据的权值或概率分布?(AdaBoost的做法:提高错误分类样本的权值,降低正确分类样本的权值)
problem two:如何将弱分类器组合成一个强分类器?(AdaBoost的做法:加权多数表决,加大类误差率小的弱分类器权值,减小类误差率大的弱分类器权值)
AdaBoost: