以下内容是在学习过程中的一些笔记,难免会有错误和纰漏的地方。如果造成任何困扰,很抱歉。
最简单的机器学习算法之一,可以用于分类和回归,是一种监督学习算法。
k-近邻(k-Nearest Neighbor,简称KNN
)学习是一种常用的监督学习方法,其工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。————根据你的“邻居”判定你的类别,你周围的人决定了你是怎样的人
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pypRhuZD-1668307153453)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/两个样本之间的欧氏距离图片-1.png)]
两个样本之间的距离通过欧氏距离公式计算,公式如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hWs48hEh-1668307153454)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/欧式距离公式-1.png)]
跟之前的学习方法相比,k-近邻是没有明显的训练过程,它是“懒惰学习”的代表,训练阶段仅仅是将样本保存,待收到测试样本后再进行处理,相对应的其它学习处理的方法,叫“急切学习”。
如何通过KNN推算出唐人街探案的电影类型?
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IUXjmEZd-1668307153454)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/K近邻的简单示例-1.png)]
通过KNN的算法思想,最后得到每个电影和被预测的电影的距离
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eINHGX4b-1668307153454)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/K近邻的简单示例-计算解析-1.png)]
结果如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5kyIHfYD-1668307153455)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqclou