mirror of
https://github.com/apachecn/ailearning.git
synced 2026-02-10 05:45:40 +08:00
MachineLearning
Mahchine Leaning in Action (python)
第一部分 分类
-
- 机器学习基础
- 机器学习是什么
- 把无序的数据转换成有用的信息。
- 机器学习的意义
- 我们利用计算机来彰显数据背后的真实含义。
- 监督学习
- 样本集:训练数据 + 测试数据
- 特征(feature-是否有缺失情况) + 目标变量(分类-离散值<A/B/C、 是/否>/回归-连续值<0~100、 -999~999>)
知识表示:机器已经学会如何识别鸟类的过程- 1.可以采用规则集的形式
- 2.可以采用概率分布的形式
- 3.可以使训练样本集中的一个实例
- 非监督学习
- 开发的步骤
- 1.收集数据
- 2.准备输入数据
- 3.分析输入数据
- 4.训练算法
- 5.测试算法
- 6.使用算法
- Python相关的库
- 科学函数库:SciPy、
NumPy(底层语言:C和Fortran) - 绘图工具库:
Matplotlib
- 科学函数库:SciPy、
-
- k-紧邻算法
-
- 决策树
-
- 基于概率论的分类方法:朴素贝叶斯
-
- Logistic回归
-
- 支持向量机
-
- 利用AdaBoost元算法提高分类
第二部分 利用回归预测数值型数据
-
- 预测数值型数据:回归
-
- 数回归
第三部分 无监督学习
-
- 使用K-均值聚类算法对未标注数据分组
-
- 使用Apriori算法进行关联分析
-
- 使用FP-growth算法来高效发现频繁项集
第四部分 其他工具
-
- 使用PCA来简化数据
-
- 使用SVD简化数据
-
- 大数据与MapReduce
- 附录A Python入门
- 附录B 线性代数
- 附录C 概率论复习
- 附录D 资源
- 索引
- 版权声明