本章简要叙述统计学习方法的一些基本概念,这是对全书内容的概括,也是全书内容的基础。
统计学习的定义、研究对象与方法
监督学习,本书的主要内容
统计学习的三要素:模型、策略、算法
介绍模型选择:正则化、交叉验证、学习的泛化能力
介绍生成模型及判别模型
介绍监督学习方法的应用:分类问题、标注问题、回归问题
统计学习(statistical learning):
基于数据建立概率统计模型,并运用模型对数据进行预测与分析的一门学科,也叫统计机器学习(statistical machine learning)
主要特点:
(1)统计学习以计算机及网络为平台,是建立在计算机及网络上的
(2)统计学习以数据为研究对象,是数据驱动的学科
(3)统计学习的目的是对数据进行预测和分析
(4)统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析
(5)统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并在发展中逐步形成独自的理论体系与方法论