Python教程

python机器学习之分类预测

本文主要是介绍python机器学习之分类预测,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

目录

  • 逻辑回归
  • 未完待续……

逻辑回归

计算机自动寻找垃圾信息共同特征

在新信息中检测是否包含垃圾信息特征内容,
判断其是否为垃圾邮件

在这里插入图片描述
部分特征:发件人、是否群发、网址、元、赢、微信、免费

  • 根据数据类别与部分特征信息,自动寻找类别与特征信息的关系,
    判断一个新的样本属于哪种类别

特征信息以列为单位,行是不同人的信息,输出数据类别(如0是正常,1是垃圾),然后去寻找关系

在这里插入图片描述

  • 通过股价预测任务区分回归任务与分类任务
    在这里插入图片描述
    分类:非连续性判断类别
    模型输出:非连续型标签
    (明天股价预测为:上涨)

回归:连续性数值预测
模型输出:连续型数值
(明天股价预测为:125.1)

  • 水位判断案例
    任务:根据水位,判断水池是否需要蓄水或放水
    在这里插入图片描述
    特征信息:水位数据
    数据类别:待蓄水(0)、放水(1)

在这里插入图片描述

  • 先尝试用线性回归判断(复杂场景就不适用了)
    在这里插入图片描述
    求得一元线性回归直线方程
    在这里插入图片描述
    在这里插入图片描述
    但如果数据样本复杂度增加,模型准确率下降明显
    在这里插入图片描述
    增加了一个x=50后,y的直线方程输出了异常的数据,如x=1时,方程判断结果=0
    在这里插入图片描述

  • 逻辑回归
    根据数据特征,计算样本归属于某一类别的概率P(x),根据概率数值判断其所属类别
    在这里插入图片描述

Y(x)界线明显,分类效果好!在这里插入图片描述

  • 逻辑回归处理更复杂的分类任务1

在这里插入图片描述
需要画分界线,将p(x)中的x变成了函数g(x),如果g(x)>0 ,则输出方形;如果g(x)<0,则输出三角形
在这里插入图片描述

在这里插入图片描述

  • 逻辑回归处理更复杂的分类任务2

g(x)大于0,小于0,等于0分别对应值在圆圈外,圆圈内,圆圈上
在这里插入图片描述

通过以上两个复杂任务的探索,可以知道:
逻辑回归结合多项式边界函数可解决复杂的分类问题
模型求解的核心,在于寻找到合适的多项式边界函数

在这里插入图片描述

  • 因此求解边界函数变成了主要的问题
    求解边界函数(可以理解为找到回归方程,但输出的未必是一条直线,而是分界线),需要用到损失函数J来判断预测值和实际值的偏差程度:

求损失函数J(判断预测值和实际值的偏差程度),由原来计算一元线性回归时计算预测yi值与实际y值差的平方和变成了如下图的公式,此时yi就是实际要判断出来值(不是机器预测的值),而-log(p(x))、-log(1-p(x))就是对p(x)这个预测值计算出损失函数J
在这里插入图片描述
P(x)就是刚刚的逻辑函数,公式为:
在这里插入图片描述
输出的是偏向0或1的值

  • 损失函数J计算值的解释
    在这里插入图片描述

如果y=1,而p(x)=1,则计算出的J=0
在这里插入图片描述

在这里插入图片描述

如果y=1,而p(x)=0(说明预测错了),则计算出的J会很大,即损失值很大
在这里插入图片描述

同理,对于要测出的实际值是0,如果y=0,而p(x)=1,则计算出的J=0,是符合的
在这里插入图片描述
在这里插入图片描述
如果y=0,而p(x)=1(说明预测错了),则计算出的J会很大,即损失值很大,也是符合我们的预期判断的
在这里插入图片描述

  • 损失函数有关计算汇总
    损失函数的两个公式可以整合成一个,也是合理的,当yi=0时,yi*log(p(x))就会=0,而恰好log(1-P(x))就可以输出值;当yi=0时,同理可得,也能得到相应的值
    在这里插入图片描述

未完待续……

这篇关于python机器学习之分类预测的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!