更新13.利用PCA来简化数据.md文件

This commit is contained in:
jiangzhonglian
2017-04-06 19:47:45 +08:00
parent b9b9d7e82f
commit c3ada3efae

View File

@@ -1,4 +1,4 @@
# 3) 利用PCA来简化数据
# 13) 利用PCA来简化数据
> 场景描述:
@@ -66,5 +66,13 @@
## 3 对半导体数据进行降维处理
```
半导体是在一些极为先进的工厂中制造出来的。设备的生命早期有限,并且话费极其巨大。
虽然通过早起测试和频繁的测试来发现有瑕疵的产品,但仍有一些存在瑕疵的产品通过测试。
如果我们通过机器学习技术用于发现瑕疵产品,那么它就会为制造商节省大量的资金。
具体来讲它拥有590个特征。我们看看能否对这些特征进行降维处理。
对于数据的缺失值的问题,我们有一些处理方法(参考第5章)
目前该章节处理的方案是将缺失值NaN(Not a Number缩写),全部用平均值来替代(如果用0来处理的策略就太差劲了)。
```