获取原始数据
拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效)
划分比例:训练集70%、75%、80%
数据处理
特征工程
机器学习算法训练,得到模型
模型评估(不合格的话返回到第二步)
应用(离线/在线服务)