diff --git a/README.md b/README.md index ffc5dae1..1de51529 100644 --- a/README.md +++ b/README.md @@ -5,6 +5,7 @@ ## 第一部分 分类 * 1) 机器学习基础 + * [1.机器学习基础](./docs/1.机器学习基础.md) * 2) k-紧邻算法 * 3) 决策树 * 4) 基于概率论的分类方法:朴素贝叶斯 diff --git a/docs/1.机器学习基础.md b/docs/1.机器学习基础.md new file mode 100644 index 00000000..b7ca1006 --- /dev/null +++ b/docs/1.机器学习基础.md @@ -0,0 +1,25 @@ + +# 1) 机器学习基础 + +* 机器学习是什么 + * 把无序的数据转换成有用的信息。 +* 机器学习的意义 + * 我们利用计算机来彰显数据背后的真实含义。 +* 监督学习 + * 样本集:训练数据 + 测试数据 + * 特征(feature-是否有缺失情况) + 目标变量(分类-离散值/回归-连续值<0~100、 -999~999>) + * `知识表示`:机器已经学会如何识别鸟类的过程 + * 1.可以采用规则集的形式 + * 2.可以采用概率分布的形式 + * 3.可以使训练样本集中的一个实例 +* 非监督学习 +* 开发的步骤 + * 1.收集数据 + * 2.准备输入数据 + * 3.分析输入数据 + * 4.训练算法 + * 5.测试算法 + * 6.使用算法 +* Python相关的库 + * 科学函数库:SciPy、`NumPy`(底层语言:C和Fortran) + * 绘图工具库:`Matplotlib` \ No newline at end of file diff --git a/docs/README.md b/docs/README.md deleted file mode 100644 index 60de4d2b..00000000 --- a/docs/README.md +++ /dev/null @@ -1,61 +0,0 @@ -# MachineLearning - -**Mahchine Leaning in Action (python)** - -## 第一部分 分类 - -* 1) 机器学习基础 - * 机器学习是什么 - * 把无序的数据转换成有用的信息。 - * 机器学习的意义 - * 我们利用计算机来彰显数据背后的真实含义。 - * 监督学习 - * 样本集:训练数据 + 测试数据 - * 特征(feature-是否有缺失情况) + 目标变量(分类-离散值/回归-连续值<0~100、 -999~999>) - * `知识表示`:机器已经学会如何识别鸟类的过程 - * 1.可以采用规则集的形式 - * 2.可以采用概率分布的形式 - * 3.可以使训练样本集中的一个实例 - * 非监督学习 - * 开发的步骤 - * 1.收集数据 - * 2.准备输入数据 - * 3.分析输入数据 - * 4.训练算法 - * 5.测试算法 - * 6.使用算法 - * Python相关的库 - * 科学函数库:SciPy、`NumPy`(底层语言:C和Fortran) - * 绘图工具库:`Matplotlib` -* 2) k-紧邻算法 -* 3) 决策树 -* 4) 基于概率论的分类方法:朴素贝叶斯 -* 5) Logistic回归 -* 6) 支持向量机 -* 7) 利用AdaBoost元算法提高分类 - -## 第二部分 利用回归预测数值型数据 - -* 8) 预测数值型数据:回归 -* 9) 数回归 - -## 第三部分 无监督学习 - -* 10) 使用K-均值聚类算法对未标注数据分组 -* 11) 使用Apriori算法进行关联分析 -* 12) 使用FP-growth算法来高效发现频繁项集 - -## 第四部分 其他工具 - -* 13) 使用PCA来简化数据 -* 14) 使用SVD简化数据 -* 15) 大数据与MapReduce - -* * * - -* 附录A Python入门 -* 附录B 线性代数 -* 附录C 概率论复习 -* 附录D 资源 -* 索引 -* 版权声明