2017-02-25 19:19:30 +08:00
2017-02-25 19:19:30 +08:00
2017-02-25 19:19:30 +08:00
2017-02-25 16:53:03 +08:00
2017-02-26 01:28:48 +08:00

MachineLearning

Mahchine Leaning in Action (python)

第一部分 分类

    1. 机器学习基础
    • 机器学习是什么
      • 把无序的数据转换成有用的信息。
    • 机器学习的意义
      • 我们利用计算机来彰显数据背后的真实含义。
    • 监督学习
      • 样本集:训练数据 + 测试数据
      • 特征(feature-是否有缺失情况) + 目标变量(分类-离散值<A/B/C、 是/否>/回归-连续值<0~100、 -999999>)
      • 知识表示:机器已经学会如何识别鸟类的过程
        • 1.可以采用规则集的形式
        • 2.可以采用概率分布的形式
        • 3.可以使训练样本集中的一个实例
    • 非监督学习
    • 开发的步骤
      • 1.收集数据
      • 2.准备输入数据
      • 3.分析输入数据
      • 4.训练算法
      • 5.测试算法
      • 6.使用算法
    • Python相关的库
      • 科学函数库SciPy、NumPy(底层语言C和Fortran)
      • 绘图工具库:Matplotlib
    1. k-紧邻算法
    1. 决策树
    1. 基于概率论的分类方法:朴素贝叶斯
    1. Logistic回归
    1. 支持向量机
    1. 利用AdaBoost元算法提高分类

第二部分 利用回归预测数值型数据

    1. 预测数值型数据:回归
    1. 数回归

第三部分 无监督学习

    1. 使用K-均值聚类算法对未标注数据分组
    1. 使用Apriori算法进行关联分析
    1. 使用FP-growth算法来高效发现频繁项集

第四部分 其他工具

    1. 使用PCA来简化数据
    1. 使用SVD简化数据
    1. 大数据与MapReduce

  • 附录A Python入门
  • 附录B 线性代数
  • 附录C 概率论复习
  • 附录D 资源
  • 索引
  • 版权声明
Languages
Python 93%
JavaScript 2.4%
CSS 2.3%
Jupyter Notebook 1.8%
HTML 0.4%