更新机器学习基础.md

2026-06-28 09:16:08 +08:00 · 2017-06-27 14:28:48 +08:00
parent b416cd6736
commit da5437440a
1 changed files with 7 additions and 7 deletions
--- a/docs/1.机器学习基础.md
+++ b/docs/1.机器学习基础.md
@@ -15,7 +15,7 @@
    在90年代初，人们开始意识到一种可以更有效地构建模式识别算法的方法，那就是用数据（可以通过廉价劳动力采集获得）去替换专家（具有很多图像方面知识的人）。
    “机器学习”强调的是，在给计算机程序（或者机器）输入一些数据后，它必须做一些事情，那就是学习这些数据，而这个学习的步骤是明确的。
    机器学习（Machine Learning）是一门专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能的学科。
-深度学习（deep learning）: 深度学习是非常崭新和有影响力的前沿领域，我们甚至不会去思考后深度学习时代
+深度学习（deep learning）: 深度学习是非常崭新和有影响力的前沿领域，我们甚至不会去思考-后深度学习时代。
    深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。

 参考地址： 
@@ -29,7 +29,7 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn

 * 搜索引擎，根据你的搜索点击，优化你下次的搜索结果。
 * 垃圾邮件，会自动的过滤垃圾广告邮件到垃圾箱内。
-* 超市优惠券，你会发现，你在购买小孩子的尿布的时候，售货员会赠送你一张优惠券可以兑换6罐啤酒。
+* 超市优惠券，你会发现，你在购买小孩子尿布的时候，售货员会赠送你一张优惠券可以兑换6罐啤酒。
 * 邮局邮寄，手写软件自动识别寄送贺卡的地址。
 * 申请贷款 或 进入赌场，通过你最近的金融活动信息进行综合评定，决定你是否合格。

@@ -43,7 +43,7 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn

 > 机器学习的主要任务就是分类和回归

-* 分类：将实例数据划分到合适的分类中。
+* 分类：将实例数据划分到合适的类别中。
 * 回归：主要用于预测数值型数据。（例子———数据拟合曲线：通过给定数据点的最优拟合曲线）
 * 目标变量
    * 目标变量是机器学习预测算法的测试结果。
@@ -60,15 +60,15 @@ http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn
    * 训练样本的集合称为训练样本集，训练样本集必须确定知道目标变量的值，以便机器学习算法可以发现特征和目标变量之间的关系。
 * 特征(feature-是否有缺失情况) + 目标变量(分类-离散值<A/B/C、 是/否>/回归-连续值<0~100、 -999～999>)
    * 特征或者属性通常是训练样本集的列，它们是独立测量得到的结果，多个特征联系在一起共同组成一个训练样本。
-* `知识表示`：机器已经学会如何识别鸟类的过程
+* `知识表示`：(例如-机器已经学会如何识别鸟类的过程)
    * 1.可以采用规则集的形式【例如：数学成绩大于90分为优秀】
-    * 2.可以采用概率分布的形式【例如：通过统计分布发现，90%的同学数学成绩，在70分一下，那么大于70分定为优秀】
-    * 3.可以使训练样本集中的一个实例【例如：通过样本集合，我们训练出一个模型实例，得出 年轻，数学成绩中高等，谈吐优雅，我们认为是优秀】
+    * 2.可以采用概率分布的形式【例如：通过统计分布发现，90%的同学数学成绩，在70分以下，那么大于70分定为优秀】
+    * 3.可以使用训练样本集中的一个实例【例如：通过样本集合，我们训练出一个模型实例，得出 年轻，数学成绩中高等，谈吐优雅，我们认为是优秀】

 > 非监督学习

 * 数据没有类别信息，也不会给定目标值。
-* 聚类：在无监督学习中，将数据集合分成由类似的对象组成的多个类的过程称为聚类。
+* 聚类：在无监督学习中，将数据集合分成由类似的对象组成多个类的过程称为聚类。
 * 密度估计：将寻找描述数据统计值的过程称之为密度估计。【就是：根据训练样本确定x的概率分布】
 * 此外，无监督学习还可以减少数据特征的维度，以便我们可以使用二维或三维图形更加直观地展示数据信息。