mirror of
https://github.com/apachecn/ailearning.git
synced 2026-05-07 22:24:18 +08:00
更新13.利用PCA来简化数据.md文件
This commit is contained in:
@@ -1,4 +1,4 @@
|
||||
# 3) 利用PCA来简化数据
|
||||
# 13) 利用PCA来简化数据
|
||||
|
||||
> 场景描述:
|
||||
|
||||
@@ -66,5 +66,13 @@
|
||||
|
||||
## 3 对半导体数据进行降维处理
|
||||
|
||||
```
|
||||
半导体是在一些极为先进的工厂中制造出来的。设备的生命早期有限,并且话费极其巨大。
|
||||
虽然通过早起测试和频繁的测试来发现有瑕疵的产品,但仍有一些存在瑕疵的产品通过测试。
|
||||
如果我们通过机器学习技术用于发现瑕疵产品,那么它就会为制造商节省大量的资金。
|
||||
|
||||
|
||||
具体来讲,它拥有590个特征。我们看看能否对这些特征进行降维处理。
|
||||
|
||||
对于数据的缺失值的问题,我们有一些处理方法(参考第5章)
|
||||
目前该章节处理的方案是:将缺失值NaN(Not a Number缩写),全部用平均值来替代(如果用0来处理的策略就太差劲了)。
|
||||
```
|
||||
|
||||
Reference in New Issue
Block a user