更新 7.集成方法md

This commit is contained in:
jiangzhonglian
2017-08-17 13:56:58 +08:00
parent 5dcf65293d
commit 48a345d9ef

View File

@@ -104,17 +104,10 @@
### 项目实战: 马疝病的预测
> 项目流程图
![AdaBoost代码流程图](/images/7.AdaBoost/adaboost_code-flow-chart.jpg "AdaBoost代码流程图")
* 基于单层决策树构建弱分类器
* 单层决策树(decision stump, 也称决策树桩)是一种简单的决策树。
* 过拟合(overfitting, 也称为过学习)
* 发现测试错误率在达到一个最小值之后有开始上升,这种现象称为过拟合。
![过拟合](/images/7.AdaBoost/过拟合.png)
> 训练算法:基于错误提升分类器
```
发现:
alpha 目的主要是计算每一个分类器实例的权重(组合就是分类结果)
@@ -125,12 +118,22 @@ D 的目的是为了计算错误概率: weightedError = D.T*errArr求最佳
![AdaBoost算法权重计算公式](/images/7.AdaBoost/adaboost_alpha.png "AdaBoost算法权重计算公式")
### 优化评估: 处理非均衡分类问题
基于单层决策树构建弱分类器
* 单层决策树(decision stump, 也称决策树桩)是一种简单的决策树。
`在分类器训练时,正例数目和反例数目不相等(相差很大)`
### 知识点补充
> 过拟合(overfitting, 也称为过学习)
* 发现测试错误率在达到一个最小值之后有开始上升,这种现象称为过拟合。
![过拟合](/images/7.AdaBoost/过拟合.png)
> 非均衡现象:
`在分类器训练时,正例数目和反例数目不相等(相差很大)`
* 判断马是否能继续生存(不可误杀)
* 过滤垃圾邮件(不可漏判)
* 不能放过传染病的人