mirror of
https://github.com/apachecn/ailearning.git
synced 2026-05-07 06:03:16 +08:00
更新 7.集成方法md
This commit is contained in:
@@ -104,17 +104,10 @@
|
||||
|
||||
### 项目实战: 马疝病的预测
|
||||
|
||||
> 项目流程图
|
||||
|
||||

|
||||
|
||||
* 基于单层决策树构建弱分类器
|
||||
* 单层决策树(decision stump, 也称决策树桩)是一种简单的决策树。
|
||||
* 过拟合(overfitting, 也称为过学习)
|
||||
* 发现测试错误率在达到一个最小值之后有开始上升,这种现象称为过拟合。
|
||||
|
||||

|
||||
|
||||
> 训练算法:基于错误提升分类器
|
||||
|
||||
```
|
||||
发现:
|
||||
alpha 目的主要是计算每一个分类器实例的权重(组合就是分类结果)
|
||||
@@ -125,12 +118,22 @@ D 的目的是为了计算错误概率: weightedError = D.T*errArr,求最佳
|
||||
|
||||

|
||||
|
||||
### 优化评估: 处理非均衡分类问题
|
||||
基于单层决策树构建弱分类器
|
||||
* 单层决策树(decision stump, 也称决策树桩)是一种简单的决策树。
|
||||
|
||||
`在分类器训练时,正例数目和反例数目不相等(相差很大)`
|
||||
|
||||
### 知识点补充
|
||||
|
||||
> 过拟合(overfitting, 也称为过学习)
|
||||
|
||||
* 发现测试错误率在达到一个最小值之后有开始上升,这种现象称为过拟合。
|
||||
|
||||

|
||||
|
||||
> 非均衡现象:
|
||||
|
||||
`在分类器训练时,正例数目和反例数目不相等(相差很大)`
|
||||
|
||||
* 判断马是否能继续生存(不可误杀)
|
||||
* 过滤垃圾邮件(不可漏判)
|
||||
* 不能放过传染病的人
|
||||
|
||||
Reference in New Issue
Block a user