更新时间:2020-12-22 16:31:17
封面
版权信息
序言
前言
第一部分 初始
1 初识机器学习
1.1 学习机器学习的误区
1.2 什么是机器学习
1.3 Python中的机器学习
1.4 学习机器学习的原则
1.5 学习机器学习的技巧
1.6 这本书不涵盖以下内容
1.7 代码说明
1.8 总结
2 Python机器学习的生态圈
2.1 Python
2.2 SciPy
2.3 scikit-learn
2.4 环境安装
2.5 总结
3 第一个机器学习项目
3.1 机器学习中的Hello World项目
3.2 导入数据
3.3 概述数据
3.4 数据可视化
3.5 评估算法
3.6 实施预测
3.7 总结
4 Python和SciPy速成
4.1 Python速成
4.2 NumPy速成
4.3 Matplotlib速成
4.4 Pandas速成
4.5 总结
第二部分 数据理解
5 数据导入
5.1 CSV文件
5.2 Pima Indians数据集
5.3 采用标准Python类库导入数据
5.4 采用NumPy导入数据
5.5 采用Pandas导入数据
5.6 总结
6 数据理解
6.1 简单地查看数据
6.2 数据的维度
6.3 数据属性和类型
6.4 描述性统计
6.5 数据分组分布(适用于分类算法)
6.6 数据属性的相关性
6.7 数据的分布分析
6.8 总结
7 数据可视化
7.1 单一图表
7.2 多重图表
7.3 总结
第三部分 数据准备
8 数据预处理
8.1 为什么需要数据预处理
8.2 格式化数据
8.3 调整数据尺度
8.4 正态化数据
8.5 标准化数据
8.6 二值数据
8.7 总结
9 数据特征选定
9.1 特征选定
9.2 单变量特征选定
9.3 递归特征消除
9.4 主要成分分析
9.5 特征重要性
9.6 总结
第四部分 选择模型
10 评估算法
10.1 评估算法的方法
10.2 分离训练数据集和评估数据集
10.3 K折交叉验证分离
10.4 弃一交叉验证分离
10.5 重复随机分离评估数据集与训练数据集
10.6 总结
11 算法评估矩阵
11.1 算法评估矩阵
11.2 分类算法矩阵
11.3 回归算法矩阵
11.4 总结
12 审查分类算法
12.1 算法审查
12.2 算法概述
12.3 线性算法
12.4 非线性算法
12.5 总结
13 审查回归算法
13.1 算法概述
13.2 线性算法
13.3 非线性算法
13.4 总结
14 算法比较
14.1 选择最佳的机器学习算法
14.2 机器学习算法的比较
14.3 总结
15 自动流程