Update 2.k-近邻算法.md

This commit is contained in:
Joy yx
2017-08-15 21:11:36 +08:00
committed by GitHub
parent cbb4c83b9c
commit a30d723d2f

View File

@@ -5,12 +5,12 @@
## KNN 概述
`k-近邻kNN, k-NearestNeighbor算法主要是用来进行分类的.`
`k-近邻kNN, k-NearestNeighbor算法主要是用来进行分类的.`
## KNN 场景
电影可以按照题材分类,那么如何区分 `动作片``爱情片` 呢?<br/>
1. 动作片:打斗次数更多
1. 动作片:打斗次数更多
2. 爱情片:亲吻次数更多
基于电影中的亲吻、打斗出现的次数,使用 k-近邻算法构造程序,就可以自动划分电影的题材类型。
@@ -31,8 +31,8 @@ knn 算法按照距离最近的三部电影的类型,决定未知电影的类
2. 输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较。
1. 计算新数据与样本数据集中每条数据的距离。
2. 对求得的所有距离进行排序(从小到大,越小表示越相似)。
3. 取前 k k 一般小于等于 20 )个样本数据对应的分类标签。
3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。
3. 取前 k k 一般小于等于 20 )个样本数据对应的分类标签。
3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。
> KNN 一般流程
@@ -124,7 +124,7 @@ plt.show()
> 优化点
归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858
归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858
### 项目实战2: 手写数字识别系统