在当今人们的日常生活中,手机占据了重要的角色。在大多数人的手机里,已经装满了各种五花八门的手机应用,无时无刻不在想着瓜分我们的时间。
很多时候,我们惊奇的发现,手机上的应用越用越聪明,智能手机真的越用越「智能」了。没刷多久的短视频,就似乎已经掌握了我们的爱好和兴趣,不断的推送相关的视频和内容;每次打开淘宝,总能从一堆玲琅满目的商品中推荐出自己心念念已久的好物;陪伴着我们无数个深夜的网抑云,同样也能推荐出一个又一个让人循环不止的歌单。
似乎,这些应用总在不断窥探着我们的内心,不断着迎合着我们的兴趣和喜好。那这到底是app
真的越来越智能了,还是说我们的隐私越来越不值钱了?
1
事实上,app
获得用户习惯的方式很简单。无非就是埋坑、打点、上报、喂养、预测而已。
一款产品在更新迭代的过程中,除了需要前端、后端、客户端以及测试这些我们比较熟知的角色外,还有一个角色对成熟的产品而言及其重要。每一个产品在功能需求层面上的决策,都离不开这种角色。
这就是所谓的数据分析师,俗称DA(DATA Analysis)
。数据分析师是一群专门跟数据打交道的人,他们最擅长的是将现象、状态等通过定性描述的东西定量化。定了量,就有了数据。
然后从数据分析行为,从量级推倒趋势,从置信区间决策功能逻辑。听起来怪神奇的。不过简单来说,就是负责在app
里设计埋点的。
我们知道每一个app其实就像是一座冰山,我们能看到的和体验到的也只是其中很小的一部分。一般来说,你没办法知道在app
上点了一个按钮后,它在后台干了些什么。
可能它向某个服务器上传了某个参数,可能它把你点击按钮的时间存入了数据库,也可能什么都没干,只是平白的告诉你「请求失败」。
而埋点的行为,往往都在这些时候发生。埋点是所有商业应用必需的手段,用来收集app
使用者或者设备的信息。它实际上就相当于在代码里做了标记,当程序运行到某个位置,就会自动标记上这个。常用的手段是通过将必要的参数上报给服务器。
比如某某产品的注册量超过了6
亿,它是怎么得到这个数据的呢?就是通过用户在注册时,上报这个埋点。最终在后台统一处理数据,就可以得到更多层次上的数据分析结果。
不夸张的说,现在随随便便一个主流app
上,都有成千上万个埋点。这些埋点对用户而言是无感知的,但是却无情的暴露了用户的使用习惯。
数据分析师会根据app
的核心指标以及应用场景,设计合适的埋点,并让开发同学在合适的位置打下这些埋点,然后用户就能够在合适的时机上报这些埋点。
用户的每一次点击,每一个手势,每一种行为,都会被不同的埋点记录;甚至,用户什么都不干的时候,也会被记录下来,因为时间也能反映操作习惯。
这些点位没有直接的侵入用户的隐私,没有获得你的地理位置,没有请求你的通讯录,更没有打开你的摄像头和录音机,只是单纯的记录下了用户的操作路径。如雁过留痕。
2
数据分析师往往钟情于埋点数据,他们能从一堆埋点中找寻用户操作的惯性,从而提炼出所谓的用户心智。但这只能分析出用户喜欢或者不喜欢某个功能或者某个页面。离推荐,还有一定距离。
埋点的数据是很珍贵的用户数据,除了数据分析师外,还有一群人会对这些数据进行一轮又一轮的处理和提炼。广义上,这群人都可以被称作算法工程师。
数据分析师看重的是群体效益,而算法的目标则是你的个性化推荐。 羊毛出在羊身上,想要推荐出你喜欢的东西,那就得知道你喜欢什么。
当你在抖音上看到一个美女换装视频,停留了许久,并且重复观看了3次以上,大概率也能推测出你是个lsp
了。所以推荐算法会根据你观看视频时上报的埋点,比如观看时长,点赞数等等量化数据来训练针对你个人的喜好模型。随后,不过是对症下药。
所以为什么你会在短视频平台上老是刷到看不完的妹子,不要先怪平台,先反省下自己。
到这,一个初级但是有效的获取用户习惯的流程已经走完。你在app
上花费的每一段时间,都以定量数据都形式存在了服务器的数据库里,经历着数据分析师的打磨,承受着推荐系统的洗礼。
最终,你的使用习惯被app
以及它背后无数个支撑它的系统学习并模仿,虽然直接并且粗暴,但是很有用。
3
但是事情总是没那么完美。相同的内容看久了,始终会感到厌倦;那些被数据分析师认为数据正向的功能,也开始多了许多不好的反馈。数据是准确的,无情残酷的,却也是片面的。
每一份数据的产生、处理、以及持久化,都只能代表那一个状态。数据的存在就意味着它是历史性的,不是当下,更无法代表将来。 所以,由数据产生的预测误差是无法避免的。
随着人工智能的兴起以及推荐算法的实际应用,「信息茧房」 这个词越来越广泛的出现在各种观点中。所谓信息茧房,意味着个人所能接受的信息被束缚在一个狭窄的领域,个人的认知范围被局限在自己的兴趣爱好上。
这实际上就是推荐算法滥用,过度推测用户的兴趣和喜好。在很多深度学习的算法里,都会有一个对其 「泛化能力」 的评估标准。也就是说,有时候精准并不是一件好事,偶尔的扩展或许能获得意想不到的收益。
当然,这里所说的只是针对用户的偏主动行为产生的数据所做的分析和推测,而在实际的操作中,还会采用多方面多角度的数据收集手段。那些就跟隐私跟安全权限息息相关。
总的来说,虽说各种软件应用不太会偷偷摸摸的去收集用户行为习惯,但是只要你使用了,就难免会暴露你的用户特征。
这些特征可能你自己都不曾意识到,但是经过一堆机器的大数据处理,你的某个下意识的操作就有了定量的描述。
现在真正能够做大做强的软件应用,都不再是为了提供某个功能,更多的是提供平台,提供服务。在这些空洞的平台中,需要大量的用户行为分析数据作为填充,才能保证平台服务的正常运行,提供平台生态的健康发展。
这就是不可挡的趋势。如果说科技的发展就是人类懒惰化的历史,那么为了能够变得更懒,就需要付出更多的隐私和空间。
不过这样一来,有些东西就更加难能可贵了。