From c3ada3efae90a73f3163b3d0ef8b7a2d62fcd370 Mon Sep 17 00:00:00 2001 From: jiangzhonglian Date: Thu, 6 Apr 2017 19:47:45 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B013.=E5=88=A9=E7=94=A8PCA?= =?UTF-8?q?=E6=9D=A5=E7=AE=80=E5=8C=96=E6=95=B0=E6=8D=AE.md=E6=96=87?= =?UTF-8?q?=E4=BB=B6?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/13.利用PCA来简化数据.md | 12 ++++++++++-- 1 file changed, 10 insertions(+), 2 deletions(-) diff --git a/docs/13.利用PCA来简化数据.md b/docs/13.利用PCA来简化数据.md index cfa3c031..a5e1bad9 100644 --- a/docs/13.利用PCA来简化数据.md +++ b/docs/13.利用PCA来简化数据.md @@ -1,4 +1,4 @@ -# 3) 利用PCA来简化数据 +# 13) 利用PCA来简化数据 > 场景描述: @@ -66,5 +66,13 @@ ## 3 对半导体数据进行降维处理 +``` +半导体是在一些极为先进的工厂中制造出来的。设备的生命早期有限,并且话费极其巨大。 +虽然通过早起测试和频繁的测试来发现有瑕疵的产品,但仍有一些存在瑕疵的产品通过测试。 +如果我们通过机器学习技术用于发现瑕疵产品,那么它就会为制造商节省大量的资金。 - \ No newline at end of file +具体来讲,它拥有590个特征。我们看看能否对这些特征进行降维处理。 + +对于数据的缺失值的问题,我们有一些处理方法(参考第5章) +目前该章节处理的方案是:将缺失值NaN(Not a Number缩写),全部用平均值来替代(如果用0来处理的策略就太差劲了)。 +```