mirror of
https://github.com/apachecn/ailearning.git
synced 2026-05-08 23:12:06 +08:00
Update 2.k-近邻算法.md
This commit is contained in:
@@ -5,12 +5,12 @@
|
||||
|
||||
## KNN 概述
|
||||
|
||||
`k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.`
|
||||
`k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.`
|
||||
|
||||
## KNN 场景
|
||||
|
||||
电影可以按照题材分类,那么如何区分 `动作片` 和 `爱情片` 呢?<br/>
|
||||
1. 动作片:打斗次数更多
|
||||
1. 动作片:打斗次数更多
|
||||
2. 爱情片:亲吻次数更多
|
||||
|
||||
基于电影中的亲吻、打斗出现的次数,使用 k-近邻算法构造程序,就可以自动划分电影的题材类型。
|
||||
@@ -31,8 +31,8 @@ knn 算法按照距离最近的三部电影的类型,决定未知电影的类
|
||||
2. 输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较。
|
||||
1. 计算新数据与样本数据集中每条数据的距离。
|
||||
2. 对求得的所有距离进行排序(从小到大,越小表示越相似)。
|
||||
3. 取前 k (k 一般小于等于 20 )个样本数据对应的分类标签。
|
||||
3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。
|
||||
3. 取前 k (k 一般小于等于 20 )个样本数据对应的分类标签。
|
||||
3. 求 k 个数据中出现次数最多的分类标签作为新数据的分类。
|
||||
|
||||
> KNN 一般流程
|
||||
|
||||
@@ -124,7 +124,7 @@ plt.show()
|
||||
|
||||
> 优化点
|
||||
|
||||
归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858
|
||||
归一化是一个让权重变为统一的过程,更多细节请参考: https://www.zhihu.com/question/19951858
|
||||
|
||||
### 项目实战2: 手写数字识别系统
|
||||
|
||||
|
||||
Reference in New Issue
Block a user