sklearn 的 knn 用法

knn原理: 离 x 点最近的 k 个点的出现最多的类别，做为 x 点的分类标识

最近：欧式距离，余弦距离，马氏距离(总样本数大于样本维数，样本间的距离增加协方差的逆，表示样本中不同特征的重要性不同)
最多的类别：越近权重越大
全局遍历：某个半径内遍历
时间复杂度：o(n2)
黑盒模型，比决策树的解释要弱


from sklearn import datasets
iris = datasets.load_iris()
iris_X = iris.data # (n_samples, n_features)
iris_y = iris.target
 
import numpy as np
np.unique(iris_y)
# 将鸢尾属植物数据集分解为训练集和测试集
# 随机排列，用于使分解的数据随机分布
np.random.seed(0)
indices = np.random.permutation(len(iris_X))
iris_X_train = iris_X[indices[:-10]]
iris_y_train = iris_y[indices[:-10]]
iris_X_test  = iris_X[indices[-10:]]
iris_y_test  = iris_y[indices[-10:]]
 
# 创建和拟合一个最近邻分类器
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier()
knn.fit(iris_X_train, iris_y_train)
KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski', metric_params=None, 
                    n_jobs=1, n_neighbors=5, p=2, weights='uniform')
print(knn.predict(iris_X_test))
print(iris_y_test)
# [1 2 1 0 0 0 2 1 2 0]
# [1 1 1 0 0 0 2 1 2 0]

相关阅读:
thymeleaf的日常使用
python查看自己安装的所有库并导出
MyBatis环境配置及查询操作
网站后台删除文章时，如何把内容中的图片也一并删除？
[vue]在鼠标点击处，画点，并弹窗显示两个点的距离
JS进阶-原型
【自动化测试】基于Selenium + Python的web自动化框架
mac命令行安装java
PyTorch Geometric (PyG) 安装教程
【Pytorch深度学习实战】（7）深度残差网络（DRN）

原文地址：https://blog.csdn.net/BigDeng_2014/article/details/126260823