Java教程

标签预测思路分析

本文主要是介绍标签预测思路分析,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

标签预测模型思路:

1. 问题描述

通过老用户的静态特征(手机品牌、性别、地域、安装的APP列表),以及用户的兴趣标签tag分数,构造模型预测新用户的兴趣标签tag。

2. 特征说明及预处理

1. 手机品牌组

原始手机品牌非常杂乱,包括各大厂商的子品牌,共计6W个。

取京东上有售的118个手机品牌,从0-118进行编号,其中0为缺省值。

这部分作为一个特征。

2. 地域组

一共237个地区(包括国外地区),由于国外地区人数分布比较多,将其保留,并从0-237进行编号,其中0为缺省值。

这部分作为一个特征。

3. 性别组

包括男性、女性、未知,从0-2进行编号,其中0为缺省值。

这部分作为一个特征。

4. applist组

这部分为128个特征。

 

这篇关于标签预测思路分析的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!