一、KNN定义
k k k近邻( k − N e a r e s t N e i g h b o r , 简 称 k N N k-Nearest Neighbor,简称kNN k−NearestNeighbor,简称kNN)学习是一种有监督学习方法。
k k k近邻:可以用于分类任务中,也可以用于回归中。
二、KNN工作机制
\qquad
工作机制:给定测试样本数据集,基于某种距离度量找训练集中与其最靠近的
k
k
k个训练样本,然后基于这
k
k
k个邻居的信息来进行预测。
\qquad
图示:
当
k
=
1
k=1
k=1时,属于类别1
当
k
=
3
k=3
k=3时,属于类别2
当
k
=
5
k=5
k=5时,属于类别1
\qquad 从结果中可以看出, k k k是一个重要的参数, k k k的取值不同,会导致不同的分类结果。
\qquad 具体流程如下:
三、距离度量
1.闵可夫斯基距离
2.欧式距离
当 p = 2 p=2 p=2时,闵可夫斯基距离即是欧式距离
3.曼哈顿距离
当 p = 1 p=1 p=1时,闵可夫斯基距离即是曼哈顿距离