我们了解什么叫大数据分析么?
麦肯锡给大数据定义:
“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。“
基于我对以上定义的理解,我总结的大数据分析就是,将获取的数据,打通,整合,找寻规律,立即得出决策信息。
数据获取
我总结的数据源可分类三类:
(1)一方数据:用户事实数据
例如用户在某金融机构购买的理财产品,时间,哪个出单口,姓名,电话等,或者运营数据,例如某互联金融app,用户操作行为数据
(3)三方数据:行业数据,也叫公开数据
例如行协的数据,或者互联网行为数据,例如某互联网公司用户在此网站的行为数据,或者嵌入sdk的app后我们能采集到的安装活跃列表,以及可采集到线下数据。
为什么需要大数据分析?看上去大数据分析似乎按照这些步骤来,但是从第一步的数据源来说,其实已经反应了大数据的特点,就是杂乱无章,那么怎么从这些数据找寻规律,分析的内容和目标是否对应上,似乎就是我们需要大数据分析的理由
现在,大数据的分析通常采用的数据报表来反映企业运营状况,同时,对于热点,人群分析,我们看到的统计值,目标核心都是用数据分析报告提炼的观点来指导运营,那么问题来了,怎么用数据分析来指导数据决策呢?
数据分析的报告思路(本文从移动端的角度进行切入)
基于我对数据分析的理解,我将数据报告会分成三大类:市场分析、运营分析、用户行为分析。
市场分析
由于市场分析一般而言是定性、定量分析,最近热播剧《我的前半生》贺函和唐晶的职业就是来去咨询公司的一般会以访谈、问卷调查来一份市场分析报告去告诉客户他们的市场占有量,消费者观点等。
这里,我们以移动互联网数据的市场分析为例,通常来说,数据源是公开数据,或者在第三方数据。正如我们所讲,将sdk嵌入开发者应用,就可以收集到安装以及使用列表,那么开发者使用的sdk越多,我们能收集的数据源也越多,这样就可以形成安装app排名,使用app排名,这里面所说的覆盖率、活跃率也是这个意思,例如:即此款应用安装量、使用量在整体金融类的安装量、使用量占比。
同时,根据市场的走势图,我们能发现潜在的竞争对手,例如:我们能看出下图中的工商银行由于手机属于高覆盖高活跃组,即安装xxapp活跃人群也是最高的,因此,无疑xx银行是所有银行组潜在竞争对手。需要更加注意他们的市场策略
运营分析
移动互联网提出的方法论:3A3R,笔者之前在做咨询的时候,此方法论也可以将网站分析套用,总结来说3A3R就是:
感知 → 获取 → 活跃 → 获取 → 营收 → 传播 → 感知
这里需要注明下,运营分析只是一个公司的baseline,让产品经理,运营人员,市场人员根据自己本公司的数据参考做出合理的决定,同时,运营的数据只是参考或者叫警示,若要具体,需要特定细节的分析,例如是否app改版,怎么改?需要增加哪家渠道合作?
(1)Awareness 感知
(2)Acquisition 获客
例如下图中,我们发现4成用户是搜索流量较上个月增加了6%,是不是我们需要增加和sem的合作呢?而在媒体引荐渠道中,我们通过渠道衡量客户转化率,点击-用户激活的,激活的注册转化,可否重点对某应用商店增加合作
(3)Activities 活跃
获客后,我们想看看我们的新增、活跃用户的表现情况,那么就到了第三步 活跃,其实就是为产品经理改版app或者页面提供数据支持
活跃分析可参考以下三个步骤:
第一:从页面浏览次数,独立访问人数,来圈定主要页面分析。
例如某款app首页是pv,uv最高,我们会重点分析首页。
第二:根据圈定页面,制作点击热力图,便于产品经理对后续页面改造提供数据支持,例如我们可以将点击量小的按钮在下次改版删除,对点击量大的重新排序
第三:根据圈定页面,制作点击热力图,便于产品经理对后续页面改造提供数据支持,例如我们可以将点击量小的按钮在下次改版删除,对点击量大的重新排序
(4)Retention留存分析& Revenue & Refer
这几个实际上在企业运用的并不多,这里简要说明下。
① Retention
用户积累到一定数量后,我们想看下用户粘性,那么我们就来到retention,一般是衡量活动效果时候运用的比较多,来看此次活动过后,是否用户依旧会使用我们的app,但是由于金融app属性不会像游戏应用每天进行访问,因此Retention 在实际应用中不会太多,下面的例子是个展示,不做赘述
② Revenue
这些留下来的客户给公司贡献多少现金呢?会看收入步骤, 一般公司不会将现金流数据放入在统计平台中,但是我们需要提出用户贡献的流水金额数据供我们使用,便于人群划分,例如下面简要分析:
Refer 传播:
用户分析
若说大数据分析的核心,其实就是在于用户分析,正如我们前面所讲,用户分析的步骤流程如下:
即在力所能及的搜集数据范围内,打通数据,客户用户,精准营销。
第一,我们可以筛选的条件列表,我们可以通过应用条件,位置,标签条件将数据整合,整合的目的就是刻画客户,定出营销策略。
例如:我们想筛选金融客户(应用条件筛选),出现在五星级酒店(位置条件),且为母婴人群(标签)
但是需要注意的是,条件越多,用户轮廓越清晰,人群会越少。
第二,根据筛选的人群,我们将线上/线上统计化,或者建模多维度分析。
例如,我们根据筛选的人群,发现男性多于女性,苹果手机属性最高,常手机工具使用,那么我们可以将这部分目标人群用增加手机工具合作、或者和苹果合作获客或者促活。
第三,整合以上数据分析,形成人群画像。
结束语
这篇文章基于我多年数据分析的经验,总结的一体化数据分析框架,其实就是简单介绍下数据分析能分析能落地的几点。当然,这里面需要大量的数据清洗工作,以及对行业的认知,此篇只是从数据分析角度的概要,内容上的细化,其实可以单拿出来细细分析,尤其用户画像那章节。
我们了解什么叫大数据分析么? 麦肯锡给大数据定义: “一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。“ 基于我对以上定义的理解,我总结的大数据分析就是,将获取的数据,打通,整合,找寻规律,立即得出决策信息。 数据获取 我总结的数据源可分类三类: (1)一方数据:用户事实数据 例如用户在某金融机构购买的理财产品,时间,哪个出单口,姓名,电话等,或者运营数据,例如某互联金融app,用户操作行为数据 (3)三方数据:行业数据,也叫公开数据 例如行协的数据,或者互联网行为数据,例如某互联网公司用户在此网站的行为数据,或者嵌入sdk的app后我们能采集到的安装活跃列表,以及可采集到线下数据。 打通:其实就是利用关键点的采集整合一二三方数据。例如我们可以通过手机号将一方和三方数据整合,或者利用cookie,或者imei号等将二方、三方数据整合。但是由于现在监管制度对手机号敏感数据的控制,以及互联网和移动端数据的跨平台打通技术难点,我们现实的匹配率很低,例如一方和三方的数据匹配达到20%其实就算比较不错的情况,当然运营商数据除外。 找寻规律:目标就是数据清理,从非结构化数据变成结构化数据,以便统计,数据探索,找寻规律,形成数据分析报告观点。本文将会在第三部分阐述。 立即决策:将数据分析报告中的观点系统化或产品化,目前而言,大部分公司还是会依靠人工决策。 为什么需要大数据分析?看上去大数据分析似乎按照这些步骤来,但是从第一步的数据源来说,其实已经反应了大数据的特点,就是杂乱无章,那么怎么从这些数据找寻规律,分析的内容和目标是否对应上,似乎就是我们需要大数据分析的理由 现在,大数据的分析通常采用的数据报表来反映企业运营状况,同时,对于热点,人群分析,我们看到的统计值,目标核心都是用数据分析报告提炼的观点来指导运营,那么问题来了,怎么用数据分析来指导数据决策呢? 数据分析的报告思路(本文从移动端的角度进行切入) 基于我对数据分析的理解,我将数据报告会分成三大类:市场分析、运营分析、用户行为分析。 市场分析 由于市场分析一般而言是定性、定量分析,最近热播剧《我的前半生》贺函和唐晶的职业就是来去咨询公司的一般会以访谈、问卷调查来一份市场分析报告去告诉客户他们的市场占有量,消费者观点等。 这里,我们以移动互联网数据的市场分析为例,通常来说,数据源是公开数据,或者在第三方数据。正如我们所讲,将sdk嵌入开发者应用,就可以收集到安装以及使用列表,那么开发者使用的sdk越多,我们能收集的数据源也越多,这样就可以形成安装app排名,使用app排名,这里面所说的覆盖率、活跃率也是这个意思,例如:即此款应用安装量、使用量在整体金融类的安装量、使用量占比。 同时,根据市场的走势图,我们能发现潜在的竞争对手,例如:我们能看出下图中的工商银行由于手机属于高覆盖高活跃组,即安装xxapp活跃人群也是最高的,因此,无疑xx银行是所有银行组潜在竞争对手。需要更加注意他们的市场策略 运营分析 移动互联网提出的方法论:3A3R,笔者之前在做咨询的时候,此方法论也可以将网站分析套用,总结来说3A3R就是: 感知 → 获取 → 活跃 → 获取 → 营收 → 传播 → 感知 这里需要注明下,运营分析只是一个公司的baseline,让产品经理,运营人员,市场人员根据自己本公司的数据参考做出合理的决定,同时,运营的数据只是参考或者叫警示,若要具体,需要特定细节的分析,例如是否app改版,怎么改?需要增加哪家渠道合作? (1)Awareness 感知 (2)Acquisition 获客 目的1:衡量第一步提供的数据是否准确,即是否渠道作弊 目的2:判断渠道是否好坏 目的3:判断营销活动是否有效 例如下图中,我们发现4成用户是搜索流量较上个月增加了6%,是不是我们需要增加和sem的合作呢?而在媒体引荐渠道中,我们通过渠道衡量客户转化率,点击-用户激活的,激活的注册转化,可否重点对某应用商店增加合作 (3)Activities 活跃 获客后,我们想看看我们的新增、活跃用户的表现情况,那么就到了第三步 活跃,其实就是为产品经理改版app或者页面提供数据支持 活跃分析可参考以下三个步骤: 第一:从页面浏览次数,独立访问人数,来圈定主要页面分析。 例如某款app首页是pv,uv最高,我们会重点分析首页。 第二:根据圈定页面,制作点击热力图,便于产品经理对后续页面改造提供数据支持,例如我们可以将点击量小的按钮在下次改版删除,对点击量大的重新排序 第三:根据圈定页面,制作点击热力图,便于产品经理对后续页面改造提供数据支持,例如我们可以将点击量小的按钮在下次改版删除,对点击量大的重新排序 (4)Retention留存分析& Revenue & Refer 这几个实际上在企业运用的并不多,这里简要说明下。 ① Retention 用户积累到一定数量后,我们想看下用户粘性,那么我们就来到retention,一般是衡量活动效果时候运用的比较多,来看此次活动过后,是否用户依旧会使用我们的app,但是由于金融app属性不会像游戏应用每天进行访问,因此Retention 在实际应用中不会太多,下面的例子是个展示,不做赘述 ② Revenue 这些留下来的客户给公司贡献多少现金呢?会看收入步骤, 一般公司不会将现金流数据放入在统计平台中,但是我们需要提出用户贡献的流水金额数据供我们使用,便于人群划分,例如下面简要分析: Refer 传播: 用户分析 若说大数据分析的核心,其实就是在于用户分析,正如我们前面所讲,用户分析的步骤流程如下: 即在力所能及的搜集数据范围内,打通数据,客户用户,精准营销。 第一,我们可以筛选的条件列表,我们可以通过应用条件,位置,标签条件将数据整合,整合的目的就是刻画客户,定出营销策略。 例如:我们想筛选金融客户(应用条件筛选),出现在五星级酒店(位置条件),且为母婴人群(标签) 但是需要注意的是,条件越多,用户轮廓越清晰,人群会越少。 第二,根据筛选的人群,我们将线上/线上统计化,或者建模多维度分析。 例如,我们根据筛选的人群,发现男性多于女性,苹果手机属性最高,常手机工具使用,那么我们可以将这部分目标人群用增加手机工具合作、或者和苹果合作获客或者促活。 第三,整合以上数据分析,形成人群画像。 结束语 这篇文章基于我多年数据分析的经验,总结的一体化数据分析框架,其实就是简单介绍下数据分析能分析能落地的几点。当然,这里面需要大量的数据清洗工作,以及对行业的认知,此篇只是从数据分析角度的概要,内容上的细化,其实可以单拿出来细细分析,尤其用户画像那章节。