• 产品中的异常行为分析


    首先,不妨将产品中出现的“非期望行为”定义为“异常行为”。

    “异常行为”并不一定是坏事,比如某款面向幼儿教育的app,但是有一群未婚年轻女性在使用,倒不是因为这些用户在学习养育知识,而是因为app中的虚拟产品形象看起来“很治愈”,所以原来定义的以“教育”为核心的产品在这些用户中则是“陪伴”。

    把用户的行为分为两个部分——行为+目标,那么用户可以分为如下几类:

    • 行为正常&目标正常,此乃普通用户;
    • 行为异常&目标正常,这类算是文章开头中提到的情况,有可能非目标人群在使用你的产品,但他们并无恶意,也可能是产品设计的用户操作路径并不那么“顺滑”;
    • 行为正常&目标异常,在产品中的行为和普通用户没有明显差异,但是行为目标是异常的,e.g.金融借贷业务,这里的行为是产品内表现的行为,一个用户进来上传四要素、身份认证、打款,整个流程基本都是正常的,但是借款之后就不见踪影了(这就是目标异常);
    • 行为异常&目标异常,在产品中会搞“骚操作”,比如爬虫、刷单、黄牛党、羊毛党之类。

    因为本文主要关注是产品内的异常行为分析,故第①、③类用户在此处不做讨论。

    本文主要讨论第②、④两种情况。

    行为异常&目标正常

    这种情形下发生的异常或变化通常是产品设计有问题,或者用户需求匹配问题。

    单一行为

    衡量单一行为问题通常关注行为的质量

    • 单次访问sesession的时长,app打开不到3秒退出,是不是兼容性有问题导致闪退?
    • 页面访问深度、页面停留时长,是商品不给力还是内容太垃圾?
    • 首页推荐是否有点击行为?推荐给用户的商品、内容是用户不感兴趣的

    行为序列

    此处主要探讨用户在进行“漏斗式”的行为操作中的异常情况。

    假设产品设计的完整的用户使用路径如下:

    [A ightarrow B ightarrow C ightarrow D ]

    说明:用户每次访问的session都是要从(A)开始的,(D)是最后一步。

    从既定的行为序列来看,可能出现的异常情况如下:

    • 中断,(A ightarrow B ightarrow C)
    • 回退,(A ightarrow B ightarrow C ightarrow B)
    • 重复,(A ightarrow B ightarrow B ightarrow C ightarrow D)
    • 插队,(B ightarrow C ightarrow D)
    • 跳跃,(A ightarrow C ightarrow D)

    最后两种情况一般较少出现,除非产品设计有严重的bug或者这样的路径本身在产品定义中是“合法”的(如果是这种情况,那么在进行漏斗分析的时候要注意)。

    行为变化

    即不同时间段观测到的行为不一致。

    • 对于单一行为而言,可能出现用户行为质量或行为频率的下降(甚至消失),e.g. 以前每天都逛app,现在半个月访问一次,以前某公众号用户一周发文3篇以上,后来基本不更新了;
    • 行为指向物发生变化,e.g. 以前账号主要买男装,后来主要是女装,或者Vlog博主先前主要发美妆类视频,后来变成了美食类;
    • 行为间的迁移,指多个并列行为(达到同一目的的不同行为方式)间的转移,e.g. 先前用户偏向于使用微信支付订单,后来是支付宝;
    • 行为场景的变化,e.g.先前用户主要在PC端下单,现在主要是在小程序下单;
    • 不同行为的分布比例变化;

    行为异常&目标异常

    行为异常&目标正常上一节中提到的异常行为,也可能出现在行为异常&目标异常的场景下,,这种场景下都是有问题的“用户”跑到app里面(或者网页)来“搞事情”。

    用户属性

    业务的时空匹配

    • 登陆地是否和业务覆盖范围有关,e.g. 主要用户分布在北上广深,但是某天突然从某三线城市增加了大量访问;
    • 每天的访问量主要集中在早7点~晚10点,某天突然凌晨的流量激增,或者说平时节假日流量很少,但是某天流量异常增多;

    用户属性稳定性

    • 收货地址有没有变化,环境设备变化?
    • 常用登陆地、登陆设备、常用网络是否变化?
    • 常购买的品类或者商品单价范围

    人和物的关联映射

    • 1对多关系,一张银行卡绑定了多个账户,一设备多账户登陆;
    • 多对多关系,多账户交叉绑定多张银行卡,多账户多IP等;

    生活基本常识

    • 是不是主流网络类型,4Gwifi有线网络
    • 手机机型、操作系统、浏览器版本、设备、app版本等是不是太久远

    个性化配置

    有没有进行个性化设置,比如:

    • 绑定手机、邮箱
    • 修改昵称、密码、头像、签名等;

    行为模式

    表现突出

    通常表现为“行为效率太高”或者“用力过猛”。
    e.g.问卷施测的时候,有的被试用时短的不可思议;
    e.g.某账户1秒钟访问一个页面,连续访问了100个页面,大概率是爬虫;

    规律性强

    规律性的背后是“低成本”,尽快搞定,怎么省时间省力气怎么来。
    e.g. 刷单留言的规律性,刷的好评大部分文字或者完全重复——这就是很多人会先看差评的原因,而且很多时候好评不说话,差评就是一大堆。
    e.g. 有的被试参加调研,选项很多是AAAAA,CCCCC,DDDDD这种;

    随机性强

    一般行为中随机性太强的时候,就会出现前后不一致的现象。

    还是拿问卷调研的情形来举例,有的人就是想乱答题,这样除了问卷答题时间短、可能出现规律性选项外,还会在“侦测题目”中前后回答不一致

    另一方面,正常用户都会有行为偏好的,比如会对某个栏目或主题的内容感兴趣,或者对某个行业或职位感兴趣,如果这个“用户”看起来没有明显的偏好还“涉猎广泛”,很可疑呢。

    功利性强

    用户要么是为钱而来,要么是为了找有价值的信息。
    e.g. 用户的优惠订单数比例、优惠金额比例等很高;
    e.g. 购买的品类是性价高(价格可能低于其他平台)且容易转手的非个性化商品(没有尺码、颜色、风格等因素);
    e.g. 访问最多的页面是优惠活动页;

    不管是爬虫、刷单,还是黄牛什么的,因为背后都是人在操作,不管最终登陆账户的是真人还是程序,都会表现出很强的目的性。

    所以通常这类操作都是“不绕弯,不做多余的事,做完就走”,e.g.薅羊毛的时候可能连基本的搜索或浏览等常规的前置操作都没有;

    一方面可以从访问的页面特征上检查:

    • 从哪个页面着陆(session的第一个页面),从哪个页面退出;
    • 访问页面的热度是否和站内热度能匹配上,也就是说哪些受欢迎的页面在不同人群中都是很受欢迎的,访问的时候页面占比会更高或者停留时间更长
    • 是否到达关键页面,有没有发生关键行为,比如付费、互动等
    • 页面访问顺序

    在页面相关的一些指标上也能体现出来:

    • 页面跳出率
    • 平均访问深度
    • 平均访问时长
    • 活跃度、访问间隔异常,平时几个月不来,来的时候就抽风
    • 单页面访问次数,通常来说一个用户不大会重复访问同一页面,首页、详情页之类

    OK,本文到此结束,文章仅做抛砖引玉之用,欢迎留言交流。

    本博客所有文章仅用于学习、研究和交流目的,欢迎非商业性质转载。

    转载请注明作者及出处

  • 相关阅读:
    实验四 决策树算法及应用
    实验三 朴素贝叶斯算法及应用
    实验二 K-近邻算法及应用
    实验一 感知器及其应用
    园区网核心、防火墙、边界出口冗余实验配置
    PNETLab模拟器部署及使用配置
    基于RPS开发模式的可视化设计解决方案
    Python学习手册《Learning Python》
    【转】Windows 64bit下Python环境配置与集成IDE PyCharm
    时间复杂度完美例子---数组最大子序列和
  • 原文地址:https://www.cnblogs.com/dataxon/p/13491592.html
Copyright © 2020-2023  润新知