在人手一部手机的世界里,我们正深困于算法而不自知,如果站在倒退十年的视角,再来面对今天的我们,一定会觉得匪夷所思。

一、困于“算法”的我们

在这个人手一部手机的时代,每个人似乎都变得很忙碌,以下的情景我们早已习以为常:在迎着清晨的阳光奔赴职场的路上,地铁公交上挤满了目光呆滞死气沉沉的我们,齐刷刷的盯着手机是我们统一的动作。

结束了一整天的忙碌,拖着疲惫的身体回到家中,原本计划读本书的我们,拿起手机躺在柔软的沙发上,当回过神的时候已经过了两个小时。在朋友或是同学聚会上,越来越不善于聊天的我们正准备发起某个话题,突然发现对面的人正刷着手机,于是我们也只好尴尬地拿起手机。

短视频不仅俘获了年轻人,其魔力也伸向了小孩、中年人、老年人!尚不识字的小孩、看不清文字的大爷大妈叔叔阿姨们也通通玩起了短视频。是的,我们正困于算法而不自知。

如果有可能乘坐时空隧道回到十年之前,当我们面对今天的自己时,一定会觉得匪夷所思。根据中国互联网络发展状况统计报告,截至2023年12月,我国网民规模达10.92亿,网络视频用户规模10.67亿。其中,短视频用户规模为10.53亿,占网民整体的96.4%;网络直播用户规模达8.16亿人。

我们为何困于推荐算法?-火擎网
我们为何困于推荐算法?-火擎网

根据QuestMobile《2023年新媒体生态洞察》披露的数据,截至2023年9月,抖音月活跃用户达到7.43亿,人均单日使用时长从2022年9月的108.4分钟提升至115.2分钟。

数字是冰冷的,也是理性的。面对单个用户平均每天使用时长近两个小时这样的结果,你真的会无动于衷吗?你我是否又是其中的某一个?

二、推荐算法是什么?

庞大的用户规模和超乎寻常的使用时长背后,是我们经常听到的推荐算法在发挥作用,以下的部分将简单的介绍推荐算法的基本原理和过程。这部分的内容参考了多篇相关的研究文章,也结合我自己的一些感受和体会。

在移动互联网之前,传统门户网站所展示的信息由网站的编辑进行筛选和排序,所有的用户看到的信息是一样的。这个时候,是由用户主动寻找自己感兴趣的信息,用户与信息的交互也相对比较简单。

推荐算法实现了由人找信息到信息找人的关键转变,或者更加准确的说实现和人和信息的一对一高效匹配,这样的匹配过程,既是人找信息,也是信息找人。

推荐算法从本质上而言是一套完整的运营策略,其最核心的目标是提升APP的用户数及使用时长。APP的使用时长是一个非常重要的指标,其能够反映用户的满意度,且用户使用时长的提升一般也会带来用户留存的提升。

那么推荐算法到底是怎么工作的?

我们以视频推荐为例来讨论。其实视频推荐算法做的事情,就是按照一定的权重公式给候选视频打分和排序,然后把得分最高的视频推荐给用户。用户可以对观看到的视频做出各种互动,这些互动体现了用户对这个视频的喜好和满意程度。

例如用户点赞比不点赞要好,看完比没看完要好,没有点不喜欢比点不喜欢要好。简而言之,用户对观看到视频的每一次互动都有正向和负向的价值。推荐算法模型假设用户看一个视频获得的价值等于用户对这个视频上产生的所有互动的价值的总和。

推荐系统的目标就是把价值最高的视频推荐给用户。在推荐系统选择推给用户的视频的时候,用户其实还没有看过这个视频,那么究竟会发生哪些互动是未知的,所以视频播放的精确价值是无法计算的。为了在不知道用户实际的互动的情况下完成打分,系统需要使用预测模型来预测每个互动发生的概率,用这次视频播放创造的价值的期望值来代替这次视频播放实际发生的价值。

预测模型是预测各种互动发生的概率的模型。预测模型一般是机器学习模型,它们用视频和用户相关的数据做输入,输出一件事情发生的概率。

算法模型在输入相关的特征后,会输出相应的预估。常见的预测模型包括:用户点赞、评论等预测互动是否发生的模型;视频播放时长、个人页停留时长等预测某件具体值的模型;骗赞、骗评论等对内容做分类的模型。

预测模型的输入特征可以分成这样几个部分:用户相关信息、视频相关信息、作者相关信息等。预测模型是个性化的,一个模型对同一个视频,在不同的观看者上,或者同一个观看者的不同环境下,给出的预估往往是不同的。比如点赞模型预测的是当前用户在当前场景下,看到当前视频,给这个视频点赞的概率。

一个明星的视频,他的粉丝和非粉丝点赞的概率可能会不同,这个明星的一个粉丝,在刚打开抖音的时候看到这个视频,或者已经刷腻快要退出的时候看到这个视频,点赞模型给出的点赞的概率可能也会不同。价值模型是给互动赋予价值的模型。

互动的价值主要分为用户价值(用户的使用时长、留存率,以及满意度等)、作者价值(作者获得的流量、互动、收入等)、平台价值(品牌效应,内容安全,平台收入等),以及间接价值等。价值模型是平台对应该给用户推荐什么视频的理解,会经过持续不断地优化,才能达到理想的效果。对价值模型做优化,就是更好地把每个互动的价值分解清楚,并把分解好的价值公式写进融合公式,从而最大化视频推荐获得的收益。

以上便是推荐算法最基础也最核心的逻辑,了解了这部分内容之后,我们再来看一个完整的算法推荐过程是怎么样的?

一个完整的推荐过程大致分为三个步骤:筛选视频、读取数据和收集反馈。首先是筛选视频:平台的全量视频至少是数亿级别的,每次都从几十亿条视频里面选视频做推荐是不现实的,所以平台会预先选择一个候选集,用户每次请求推荐,会给这个候选集里面的视频做排序,把打分最高的返回给用户。这个候选集对于所有用户都是几乎完全一致的,通常包括比较新的视频和表现比较好的老视频。

每次用户请求,推荐系统会从这个候选集里面,通过多个召回源初步选取几千个视频,供后续阶段做进一步筛选。这个过程叫做召回。其次是读取数据:价值模型和预测模型需要输入信息,推荐系统需要请求存放着这些信息的服务器,把数据取回来,用来计算排序公式。

数据有非常多的来源,其中最主要的是正排,正排里面存储的是每一个视频的各种属性信息,例如观看数,是否是电商视频,视频的类型,作者的id等。还有很多存储用户、作者、音乐的信息的服务器等等。系统会把读取到的所有的数据作为排序公式的输入,算出各个预测模型和价值模型的值,再融合起来得到总分,把得分最高的排在最前面。

因为计算性能限制,只有一小部分,大概几百个视频可以做完整的模型计算。但是召回返回的视频要远多于这个数量,所以在最终的排序(精排)之前,还有额外的一步粗排。在粗排中,系统会用一个简单的排序模型,尽可能地模拟精排模型的打分,在所有召回的视频里面,选出最靠前的几百个视频,送给精排。

精排打分之后,还会应用一些规则。这些规则都应用完之后,会把排在最前面的视频返回给用户。最后是收集反馈:视频推给用户后,用户对视频的反馈(点赞、评论,是否滑走等)会被收集起来,用于训练模型。

三、何以自由?

当我们感慨被困于算法时,其实并非特指某一个企业或平台,而是推荐算法本身。推荐算法作为一种技术,作为一种运营策略,已经被非常多的平台企业所使用。在“股东利益最大化”作为企业绩效管理基本原则的今天,我们所谈论的“困或被困”一定不是平台企业所关注的重点。因此我们无法寄希望于平台企业给予我们身心的自由。

在行文即将结束的时候,我想起了罗翔老师在一个视频中曾经举过的例子:通过阅读小黄书、‌观看相声表演与阅读莎士比亚作品所带来的快乐,‌来探讨不同形式的快乐及其价值。‌

无论是通过低俗内容还是高雅文学,‌我们或许都能找到快乐,‌但是哪种快乐更能持久和有意义?你更愿意你的孩子享受哪一种快乐呢?其实每个人心中或许都有答案,但吊诡之处在于,或许看完这篇短文的你,又要开始刷短视频了。

via公众号:巴芒门徒(gh_01a5dc48409a)