数据扫盲(2):新增用户与留存到底是啥?
我们可以看下下图是关于渠道A和B七天日活用户的折线图,我们严格按照算法二计算会得出渠道A留存率高于渠道B,实际上我们由图可以看出渠道B的活跃用户曲线更接近于自然平缓下降,同时第七日的活跃用户也高于渠道A。综合来说渠道B的用户质量是高于渠道A。 所以用算法二来计算留存评估渠道质量是不ok的,究其原因,恰恰是引入第二日和第六日的数据,反而影响了结果的判断。 通过以上的案例,大家应该理解了两者的区别。 算法一我们可以称之为七日日留存,算法二为七日内留存。 当然,存在既有合理性,算法二并不是没有适用场景,针对一些用特定使用周期的app就更适合,例如某app是专注于周末轰趴,活跃用户大部分聚集在周六和周日,我们如果去计算工作日(周一至周五)任一天的新增用户七日日留存,会发现明显偏低于周末。 针对这种情况,我们只看第七天的日留存显然不能反应真实情况,反之,关心七日内的留存就更为真实可靠。 那么,宋老湿还是以友盟数据平台一组七日留存的表格,大家可以尝试看下友盟采用的是算法一还是算法二。 有些朋友可能有些摸不到头脑,有些朋友直觉可能觉得友盟用的是算法一。实际上,友盟平台计算方法和算法一很相似但有些许不同。我们暂且称之为算法三。 算法三(第七天的留存用户数/第0天的新增用户)*100%。 这个第0天其实指的就是计算留存的当日,和算法一中的第一天指的是同一天。如上图所示,如果计算2018—08—01的七日日留存,则算法一中的第1天和算法三中的第0天都是指的08-01的新增用户数339人。再仔细看上图会发现,友盟统计时采用1天后,2天后对应就是算法一中的第二天与第三天。 那么友盟为什么采用算法三,这样计算有什么好处吗?希望大家动脑子想一下。 (这里给一个提示:和一周七天有关联)。 揭晓答案:这是因为采用算法三我们可以规避星期对数据的干扰。 举一个例子,2018-08-01是星期三,采用算法一的第七天则是08-07星期二,算法三则是七天后08-08星期三,这样同时用星期三的数据,就可以合理规避今日是周几对数据的干扰。 那么我们一共讲了三种算法,每种算法都有其存在的意义,具体的要根据自己公司业务进行选择,保证公司内部采用同一种标准即可。 这里,宋老湿给大家做一个表格进行总结,大家可以保存图片备用。 基于此,新增或和留存咱们是聊得差不多了。大家应该会有种毛塞顿开的感觉。 下一期,具体主题宋老湿可能会继续聊一些数据指标,也可能会聊一些UI设置的基础。敬请期待。
作者:宋老湿,公众号:产品经理吐槽喵,一个有温度的公众号 互相学习交流进步 本文素材来自互联网 (编辑:PHP编程网 - 黄冈站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |