上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
3.1 机器学习中的Hello World项目
这个项目是针对鸢尾花(Iris Flower)进行分类的一个项目,数据集是含鸢尾花的三个亚属的分类信息,通过机器学习算法生成一个模型,自动分类新数据到这三个亚属的某一个中。项目中使用的鸢尾花数据集是一个非常容易理解的数据集,这个数据集具有以下特点:
所有的特征数据都是数字,不需要考虑如何导入和处理数据。
这是一个分类问题,可以很方便地通过有监督学习算法来解决问题。
这是一个多分类问题,也许需要一些特殊的处理。
所有的特征的数值采用相同的单位,不需要进行尺度的转换。
接下来我们将通过这个例子一步步地来展示一个机器学习项目的所有步骤。我们将按照下面的步骤实现这个项目:
(1)导入数据。
(2)概述数据。
(3)数据可视化。
(4)评估算法。
(5)实施预测。
我们需要认真完成每一步,尝试自己输入每一行代码,以加深对机器学习项目流程的理解。请启动你的Python环境或IDE,开始实现机器学习的第一个项目吧。