机器学习

李宏毅《机器学习》学习笔记3

本文主要是介绍李宏毅《机器学习》学习笔记3，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

误差

模型的误差来源有两个，分别是误差（bias）和方差（variance）。

不同复杂程度的模型倾向于不同的误差类型，复杂度较低的模型的方差较小，也就更集中，但是偏差较大，易欠拟合；复杂模型离散程度更大，但偏差小，易过拟合。

我们要做的，就是在两种误差中权衡，找出相对平衡的模型。

误差改进

偏差大的模型可能是模型复杂程度不够，要考虑更多变量，增加更多次幂。偏差大的情况下盲目添加更多数据是没用的，因为模型本身表现就不好。
方差大的模型，最简单的改进方法是增加更多训练数据，但很多情况我们拿不到更多的数据，但是可以通过一些技巧修改已有数据来丰富数据（比如对于图像数据可以偏转图像角度）。

模型选择

模型不可简单根据测试成绩挑选，因为已有的测试集代表不了真实情况或者完整测试集。

交叉验证
在训练集中划出一部分作为验证集，通过验证集选出模型后再将验证集放回全部训练集重新训练被选中的模型，然后再在公开测试集上测试。
n折交叉验证
将训练集分为三部分，三部分数据分别作一次验证集，取平均验证成绩最好的模型。最后用全部验证集训练该模型。

这篇关于李宏毅《机器学习》学习笔记3的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯