MNIST (“修改后的国家标准与技术研究所”)是事实上的计算机视觉“hello world”数据集。自 1999 年发布以来,这个经典的手写图像数据集一直作为分类算法基准测试的基础。随着新的机器学习技术的出现,MNIST 仍然是研究人员和学习者的可靠资源。
最终目标是从数万张手写图像的数据集中正确识别数字。
图片来源:维基百科
我们现在将尝试从头开始使用KNN(K 最近邻)算法对数字进行分类。
在此之前,我们先来了解一下KNN到底是什么!
读取Mnist可以用tensorflow完成,也可以用numpy完成。如下:
- def load_data(path):
- wi