From a30d723d2f9e25cf225e7118e68351abdbd2223a Mon Sep 17 00:00:00 2001 From: Joy yx Date: Tue, 15 Aug 2017 21:11:36 +0800 Subject: [PATCH] =?UTF-8?q?Update=202.k-=E8=BF=91=E9=82=BB=E7=AE=97?= =?UTF-8?q?=E6=B3=95.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/2.k-近邻算法.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/docs/2.k-近邻算法.md b/docs/2.k-近邻算法.md index 44015e82..adc73a25 100644 --- a/docs/2.k-近邻算法.md +++ b/docs/2.k-近邻算法.md @@ -5,12 +5,12 @@ ## KNN 概述 -`k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.` +`k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.` ## KNN 场景 电影可以按照题材分类,那么如何区分 `动作片` 和 `爱情片` 呢?
-1. 动作片:打斗次数更多 +1. 动作片:打斗次数更多 2. 爱情片:亲吻次数更多 基于电影中的亲吻、打斗出现的次数,使用 k-近邻算法构造程序,就可以自动划分电影的题材类型。 @@ -31,8 +31,8 @@ knn 算法按照距离最近的三部电影的类型,决定未知电影的类 2. 输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较。 1. 计算新数据与样本数据集中每条数据的距离。 2. 对求得的所有距离进行排序(从小到大,越小表示越相似)。 - 3. 取前 k (k 一般小于等于 20 )个样本数据对应的分类标签。 -3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。 + 3. 取前 k (k 一般小于等于 20 )个样本数据对应的分类标签。 +3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。 > KNN 一般流程 @@ -124,7 +124,7 @@ plt.show() > 优化点 -归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858 +归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858 ### 项目实战2: 手写数字识别系统