From 60c922ea4593f9799ca28a2f2846baaece0aada6 Mon Sep 17 00:00:00 2001 From: jiangzhonglian Date: Mon, 27 Mar 2017 16:19:35 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=207=20AdaBoost=E7=9A=84=20ba?= =?UTF-8?q?gging=E5=92=8Cboosting=20=E9=80=9A=E4=BF=97=E6=A1=88=E4=BE=8B?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/7.利用AdaBoost元算法提高分类.md | 2 ++ docs/9.树回归.md | 2 +- 2 files changed, 3 insertions(+), 1 deletion(-) diff --git a/docs/7.利用AdaBoost元算法提高分类.md b/docs/7.利用AdaBoost元算法提高分类.md index 69036809..e9cdc3a7 100644 --- a/docs/7.利用AdaBoost元算法提高分类.md +++ b/docs/7.利用AdaBoost元算法提高分类.md @@ -11,6 +11,7 @@ * 2. 每个数据集都是通过在原始数据集中随机选择一个样本来进行替换(替换:意味着可以多次选择同一个样本,也就有重复值)而得到的。 * 3. 该算法作用的数据集就会得到S个分类器,与此同时,选择分类器投票结果中最多的类别作为最后的分类结果。 * 4. 例如:随机森林(random forest) + * 追美女:美女选择择偶对象的时候,会问几个闺蜜的建议,最后选择一个综合得分最高的一个作为男朋友 * boosting * boosting是一种与bagging很类似的技术。不论是boosting还是bagging当中,所使用的多个分类器的类型都是一致的。 * 区别是什么? @@ -19,6 +20,7 @@ * 3. 由于boosting分类的结果是基于所有分类器的加权求和结果的,因此boosting与bagging不太一样。 * 4. bagging中的分类器权重是相等的,而boosting中的分类器权重并不相等,每个权重代表的是其对应分类器在上一轮迭代中的成功度。 * 目前boosting方法最流行的版本是: AdaBoost。 + * 追美女:第1个帅哥失败->(传授经验:姓名、家庭情况) 第2个帅哥失败->(传授经验:兴趣爱好、性格特点) 第3个帅哥成功 * AdaBoost(adaptive boosting: 自适应boosting) * 能否使用弱分类器和多个实例来构建一个强分类器? 这是一个非常有趣的理论问题。 * 优点:泛化错误率低,易编码,可以应用在大部分分类器上,无参数调节。 diff --git a/docs/9.树回归.md b/docs/9.树回归.md index e3f23582..91acba04 100644 --- a/docs/9.树回归.md +++ b/docs/9.树回归.md @@ -3,7 +3,7 @@ * 树回归是什么? * 分类回归树(Classification and Regression Tree,CART)是一种典型的决策树算法,CART算法不仅可以应用于分类问题,而且可以用于回归问题。 - * CART算法构建的回归树并介绍其中的树剪枝技术(该技术主要的目的是防止数的过拟合) + * CART算法构建的回归树并介绍其中的树剪枝技术(该技术主要的目的是防止树的过拟合) * 树回归的构建 * 优点:可以对复杂和非线性的数据建模。 * 缺点:结果不易理解。