更新文档数据

This commit is contained in:
jiangzhonglian
2017-07-04 13:25:17 +08:00
parent a01f5a12fd
commit 08ecfc4086
31 changed files with 803046 additions and 10 deletions

View File

@@ -14,7 +14,7 @@
机器学习machine learning: 机器学习是最基础的(当下初创公司和研究实验室的热点领域之一)。
在90年代初人们开始意识到一种可以更有效地构建模式识别算法的方法那就是用数据可以通过廉价劳动力采集获得去替换专家具有很多图像方面知识的人
“机器学习”强调的是,在给计算机程序(或者机器)输入一些数据后,它必须做一些事情,那就是学习这些数据,而这个学习的步骤是明确的。
机器学习Machine Learning是一门专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能重新组织已有的知识结构使之不断改善自身性能的学科。
机器学习Machine Learning是一门专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能重新组织已有的知识结构使之不断改善自身性能的学科。
深度学习deep learning: 深度学习是非常崭新和有影响力的前沿领域,我们甚至不会去思考-后深度学习时代。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
@@ -36,18 +36,18 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn
## 机器学习的简单概述
`机器学习`就是把无序的数据转换成有用的信息;机器学习将有助于我们穿越数据雾霾,从中抽取出有用的信息。
* 1.需要获取海量的数据
* 2.才能从海量数据中获取有用的信息
* 1.获取海量的数据
* 2.从海量数据中获取有用的信息
## 机器学习的主要任务
> 机器学习的主要任务就是分类和回归
* 分类:将实例数据划分到合适的类别中。
* 回归:主要用于预测数值型数据。(例子———数据拟合曲线:通过给定数据点的最优拟合曲线)
* 回归:主要用于预测数值型数据。(示例:数据通过给定数据点来拟合最优曲线)
* 目标变量
* 目标变量是机器学习预测算法的测试结果。
* 在分类算法中目标变量的类型通常是标称型,而在回归算法中通常是连续型
* 在分类算法中目标变量的类型通常是标称型(如:真与假),而在回归算法中通常是连续型(如1~100)
* 机器学习的训练过程
* ![机器学习训练过程图](/images/1.MLFoundation/机器学习基础训练过程.png)
@@ -57,7 +57,7 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn
* 必须知道预测什么,即必须知道目标变量的分类信息。分类和回归属于监督学习。
* 样本集:训练数据 + 测试数据
* 训练样本 = 特征(feature) + 目标变量(label)
* 训练样本的集合称为训练样本集,训练样本集必须确定知道目标变量的值,以便机器学习算法可以发现特征和目标变量之间的关系。
* 训练样本的集合称为训练样本集,训练样本集必须确定目标变量的值,以便机器学习算法可以发现特征和目标变量之间的关系。
* 特征(feature-是否有缺失情况) + 目标变量(分类-离散值<A/B/C、 是/否>/回归-连续值<0~100、 -999999>)
* 特征或者属性通常是训练样本集的列,它们是独立测量得到的结果,多个特征联系在一起共同组成一个训练样本。
* `知识表示`(例如-机器已经学会如何识别鸟类的过程)
@@ -76,7 +76,7 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn
![算法汇总](/images/1.MLFoundation/ml_algorithm.jpg)
## 学习机器学习的原因
## 学习机器学习
* 选择算法需要考虑的两个问题
* 使用机器学习算法的目的

View File

@@ -24,8 +24,8 @@
> Sigmoid函数简介
```
我们想要的函数应该是,能接受所有的输入然后预测出类别。例如,在两个类的情况下,上述函数输出 0 和 1 。这类函数称为海维塞阶跃函数,或者直接称之为 单位阶跃函数。
但是,海维塞阶跃函数的问题在于:该函数在跳跃点上从 0 瞬间跳跃到 1这个瞬间跳跃过程有时候很难处理。幸好另外的一个函数也有这样的性质(这里的性质指的是可以输出0和1的性质),
我们想要的函数应该是,能接受所有的输入然后预测出类别。例如,在两个类的情况下,上述函数输出 0 和 1 。这类函数称为海维塞阶跃函数,或者直接称之为 单位阶跃函数。
但是,海维塞阶跃函数的问题在于:该函数在跳跃点上从 0 瞬间跳跃到 1这个瞬间跳跃过程有时候很难处理。幸好另外的一个函数也有这样的性质(这里的性质指的是可以输出0和1的性质),
且数学上更易处理,这就是我们下边要介绍的 Sigmoid 函数。
Sigmoid函数具体的计算公式如下