python机器学习之分类预测

本文主要是介绍python机器学习之分类预测，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

逻辑回归

计算机自动寻找垃圾信息共同特征

在新信息中检测是否包含垃圾信息特征内容，
判断其是否为垃圾邮件

在这里插入图片描述
部分特征：发件人、是否群发、网址、元、赢、微信、免费

根据数据类别与部分特征信息，自动寻找类别与特征信息的关系，
判断一个新的样本属于哪种类别

特征信息以列为单位，行是不同人的信息，输出数据类别（如0是正常，1是垃圾），然后去寻找关系

在这里插入图片描述

通过股价预测任务区分回归任务与分类任务

分类：非连续性判断类别
模型输出：非连续型标签
（明天股价预测为：上涨)

回归：连续性数值预测
模型输出：连续型数值
(明天股价预测为：125.1）

水位判断案例
任务：根据水位，判断水池是否需要蓄水或放水

特征信息：水位数据
数据类别：待蓄水（0）、放水（1）

在这里插入图片描述

先尝试用线性回归判断（复杂场景就不适用了）

求得一元线性回归直线方程

但如果数据样本复杂度增加，模型准确率下降明显

增加了一个x=50后，y的直线方程输出了异常的数据，如x=1时，方程判断结果=0
逻辑回归
根据数据特征，计算样本归属于某一类别的概率P(x)，根据概率数值判断其所属类别

Y(x)界线明显，分类效果好！在这里插入图片描述

逻辑回归处理更复杂的分类任务1

在这里插入图片描述
需要画分界线，将p（x）中的x变成了函数g（x），如果g（x）>0 ，则输出方形；如果g（x）<0，则输出三角形

在这里插入图片描述

逻辑回归处理更复杂的分类任务2

g（x）大于0，小于0，等于0分别对应值在圆圈外，圆圈内，圆圈上
在这里插入图片描述

通过以上两个复杂任务的探索，可以知道：
逻辑回归结合多项式边界函数可解决复杂的分类问题
模型求解的核心，在于寻找到合适的多项式边界函数

在这里插入图片描述

因此求解边界函数变成了主要的问题
求解边界函数（可以理解为找到回归方程，但输出的未必是一条直线，而是分界线），需要用到损失函数J来判断预测值和实际值的偏差程度：

求损失函数J（判断预测值和实际值的偏差程度），由原来计算一元线性回归时计算预测yi值与实际y值差的平方和变成了如下图的公式，此时yi就是实际要判断出来值（不是机器预测的值），而-log（p(x)）、-log（1-p(x)）就是对p（x）这个预测值计算出损失函数J
在这里插入图片描述
P（x）就是刚刚的逻辑函数，公式为：

输出的是偏向0或1的值

损失函数J计算值的解释

如果y=1，而p（x）=1，则计算出的J=0
在这里插入图片描述

在这里插入图片描述

如果y=1，而p（x）=0（说明预测错了），则计算出的J会很大，即损失值很大
在这里插入图片描述

同理，对于要测出的实际值是0，如果y=0，而p（x）=1，则计算出的J=0，是符合的
在这里插入图片描述

如果y=0，而p（x）=1（说明预测错了），则计算出的J会很大，即损失值很大，也是符合我们的预期判断的

损失函数有关计算汇总
损失函数的两个公式可以整合成一个，也是合理的，当yi=0时，yi*log（p（x））就会=0，而恰好log（1-P（x））就可以输出值；当yi=0时，同理可得，也能得到相应的值

未完待续……

这篇关于python机器学习之分类预测的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Python教程

python机器学习之分类预测

目录

逻辑回归

未完待续……

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯