抖音推荐算法原理公开
今天下午的时候,偶然刷到抖音集团公众号发布的文章《一文全解!抖音算法原理公开》。没错,官方公布了抖音推荐算法原理。根据抖音官方介绍:推荐平台依靠算法,能智能主动地发掘用户兴趣,帮助解决超大规模信息分发的效率问题。推荐算法核心目标是通过分析用户的“行为”(点击、浏览、喜欢、转发、收藏等),构建个性化的推荐模型。系统会基于用户历史动作、对象特征和上下文环境,采用算法模型,预测用户可能会对什么样的内容产生什么样的行为。重点来了,官方说:抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估
今天下午的时候,偶然刷到抖音集团公众号发布的文章《一文全解!抖音算法原理公开》。
没错,官方公布了抖音推荐算法原理。
根据抖音官方介绍:推荐平台依靠算法,能智能主动地发掘用户兴趣,帮助解决超大规模信息分发的效率问题。
推荐算法核心目标是通过分析用户的“行为”(点击、浏览、喜欢、转发、收藏等),构建个性化的推荐模型。系统会基于用户历史动作、对象特征和上下文环境,采用算法模型,预测用户可能会对什么样的内容产生什么样的行为。
重点来了,官方说:
抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。
抖音应用的深度学习算法包括Wide&Deep模型、双塔召回模型等。前者可解决协同过滤算法容易造成信息单一、泛化不足的问题;后者在召回环节提供更好的推荐效果。
看完这两段介绍,我们是不是可以这么理解:
抖音目前的推荐算法是基于神经网络深度学习算法的,也就是系统会通过神经网络算法给用户建立画像,也会通过神经网络算法给内容进行建立画像,而不是通过打标签的形式了,完全依赖神经网络算法,然后把感觉对用户用价值的视频内容推荐到用户面前。
当时,我看到前面的话的时候,是这么理解的, 后来,我接着往下看,官方也介绍了用户行为背后的算法推荐逻辑,根据的理解意思差不多。
看截图:
根据官方的介绍,要点如下:
1、推荐算法是基于人工智能机器学习和深度学习构建的推荐算法。
2、抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”:综合预测用户行为概率 × 行为价值权重 = 视频推荐优先级。
3、模型需要内容和用户两端的数据做输入,其中主要是学习用户行为数据。结合用户行为和视频本身的价值权重,推算出视频推荐的价值分数,并将综合得出的价值最高的视频推送给用户。
这三个要点其实就是我刚才的那个简单的理解意思大概差不多。
同时,根据官方的介绍,完播率并不是那么重要了,我们做短视频的都知道,5 秒完播率和整体的完播率,完播率越高被算法推荐的几率越高。
官方认为完播率并不能满足需求了。
原话如下:随着抖音的用户愈发多样化,内容风格也日益多元,平台上有了越来越多的优质中长视频,完播率等少数目标难以满足需求,多目标建模成为技术上的自然选择。
目前抖音已经发展出非常复杂的多目标体系,比如将收藏率纳入多目标,帮助知识类内容推送给有需求的用户。具体如下:
1、增强“收藏+复访”“关注+追更”“打开+搜索”等组合目标,预估用户长期行为,帮助用户探索长期需求;
2、设置探索类指标,帮助用户探索可能他们自己都还没发现的潜在需求,助力破除“信息茧房”;
3、设置原创性目标,鼓励优质、新颖且具有独特价值的内容推荐。
综合下来,我们可以看出:
目前抖音的推荐算法跟之前已经不一样了。
1、不再是打标签的形式了,而是依靠神经网络算法来构建用户和内容的画像,推荐的逻辑是用户的需求和视频内容价值的匹配。
2、更看重互动,比如:收藏、重复观看、关注、追更等行为,完播率的级别已经很低了。这背后的逻辑其实就是更强调价值了,因为只有有价值的内容,才会被收藏、重复观看和追更。