w,b求出最优解
序关系:高1.0 中0.8 低0.5
一些青色,浑浊,沉闷变成onehot编码[0 1 0]代表浑浊这样。
逼近对数线性回归
联系函数
几率
对率回归;是分类学习算法
小类比大类重要时候,类别不平衡问题中何时需要做特殊处理
解决类别不平衡问题:1过采样:将原来小类别的样本变大,和原来的大样本平衡;2欠采样:将原来大类别的样本变小,和原来的小样本平衡;3阀值移动:SVM阀值移动
多样性度量
现有的76种多样性度量
diversity和E的关系
无监督学习除了聚类,还有密度估计;有监督:回归,分类。
聚类也可以做分类的预处理。
一些新算法的比较容易诞生
常见的聚类算法
什么是层次聚类,AGNES;越下层,越粒化;
原型聚类都可以看成高斯聚类的特例,比较适合处理椭球结构
密度聚类比较适合与香肠型聚类