You need to enable JavaScript to run this app.

如何用技术驱动音视频业务全链路增长

最近更新时间2021.09.17 10:34:46

首次发布时间2021.09.17 10:34:46

整个泛娱乐行业的产业链路是怎么样的?我们要如何聚焦产业链,并结合业务需求,实现持续增长?

近日,火山引擎解决方案专家戴唯伟分享了对泛娱乐行业的认知和分析,并详细介绍了火山引擎是如何用技术,驱动音视频业务全链路增长。

戴唯伟表示,火山引擎正在将字节跳动做的比较好的技术、产品以及最佳实践,对外去帮助更多的行业。

以下为演讲实录:

今天我简单分享一下自身对泛娱乐行业的分析,以及从火山引擎的角度,看泛娱乐行业方案,要怎样达到比较好的增长,主要介绍三个角度:

  • 基于AI的沉浸式体验构建力;

  • 基于科学实验的数据决策力;

  • 基于云原生的技术创新力。

这些能力也是字节跳动目前做的比较好的能力,并且这些能力已经形成了一些产品。我们希望把这些产品以及最佳实践,对外去帮助更多的行业。

泛娱乐行业分析

image

整个泛娱乐行业的产业链,首先有大的内容平台,根据内容时长不同,通常会区分长视频、短视频平台。从内容来源不同,也会分为PGC(专业生产内容)平台、以及UGC(用户生产内容)为主的平台。实际上在移动互联网来到之前,内容主要是PGC,但现在有很多MCN(网红经纪公司)机构和个人创作者,产生大量的PUGC(专业用户生产内容)、UGC内容。

内容平台首先需要投放,获得大量初始用户,然后通过精细化的内容运营、用户运营两个关键闭环来留住大量用户。内容运营的核心会围绕构建完善的内容生态,持续不断的生产优质内容,汇聚到内容平台后,根据内容标签和用户喜好,去精准服务用户。用户运营的核心会围绕投放获客、用户洞察、用户留存及转化展开,确保用户在平台全生命周期的ROI(投资回报率)大于1。

然后通过会员收费、广告、电商带货、观众“打赏”等方式进行变现。字节跳动有广告投放平台巨量引擎,解决广告主营销投放需求;也有流量变现平台穿山甲,为开发者提供用户增长、流量变现、LTV(用户生命周期价值)提升等全生命周期的服务和成长方案。

后面我介绍的方案,不聚焦在某个技术方案上,而是通过产业链,结合我们业务的最终需求,去看到底是怎么样把整套能力打通。

image

在泛娱乐行业,现在一些比较流行的玩法:

  • 个性化推荐:千人千面的内容和消息推荐。

  • 视频资讯:视频作为资讯的一个主要载体,随着5G的到来,未来空间会更大。

  • 基于AI的内容创意和审核:通过视频AI能力,实现智能内容创作和审核。举个例子,抖音每天产出的UGC内容大概是几千万条,却做到了分钟级的审核发布,这就需要AI来实现。

  • 社交化:将社交互动融入资讯传播中。

image

这个行业中有很多行业共性的痛点,比如获客成本。

举个例子,在苹果4S刚出来的时候,当时App Store里面大概只有500个APP。做个APP放上去,很大概率会获得高流量,但现在App Store有超过250万款APP。如果我们的产品不吸引人,那就没有价值,没有流量,也难以存活。

另外,还有新颖创意少、留存转化困难、用户体验差等等,这些大多跟用户体验相关的,而用户体验既涉及生理学问题,也涉及心理学问题。在泛娱乐行业里面,用户体验必然是一个深水区的问题。

image

那么火山引擎的解决方案是什么样的,以及字节跳动内部到底是怎么做的?

围绕“增长”这个目标,首先基于云原生的基础设施服务。抖音春晚红包的任务,为什么我们能在27天搞定?一般来说要花一个月时间买服务器,买硬件,上架,压测,而我们花一天不到的时间,就可以把服务平滑地弹性扩容,这就是基于了云原生的基座和微服务架构。

其次是增长的能力中台,实际上是一个中台群。中台群包含了数据中台、视频中台、移动中台、研发中台。字节跳动有很多APP,我们为什么能够这么快速地构建这些APP?因为我们不需要重复造轮子,几个人的小团队,就能够基于底层和中台能力,快速地去构建一个新的产品。

最后的整个智能营销场景,包含了智能获客、智能营销和运营,以及智能互动体验。从产品获客开始,围绕内容运营、用户体验,始终坚持ROI大于1、可规模化、可复制的增长方法论。

image

从这个图可以看到除了下面的基础增长支撑,还有体验构建、数据决策、技术创新,来构成核心增长能力。增长的维度从用户增长、市场规模增长、收入增长、利润增长、效率增长、业务创新等方面出发,我们并不是单纯强调在某一个技术上取得的优势,还是要回归到增长维度,这是智能增长方案的顶层规划。

基于AI的沉浸式体验构建力

image

下面来展开一下基于AI的沉浸式体验构建力,主要是如何从创意体验、个性化体验以及性能体验进行整体的提升。

创意体验上面提到过,抖音每天可能会有几千万条UGC视频,会用到AI智能。实际上AI智能的使用不仅仅在此,因为每天抖音上面还有大量的广告投放。这些广告素材如果用人工去做,由于每天工作效率是有瓶颈的,可能做到20条、30条就了不得了,但是就算人做的视频素材火的成功率高一点,比如20%,那一天也就成功四五条。如果通过机器做素材,也许成功率是千分之一,但是我们一天做几十万条。那么这些广告素材拿出去跑的时候,我们再会根据这些素材里面跑的比较好的广告素材留下来,然后把其他的淘汰掉。通过这种方式,整个创意体验,我们在广告生成,包括音视频处理,视频特效交互都有大量的技术创新。

个性化体验这块,我们会根据用户喜好做内容的定制和推荐。这里面有一整套的底层逻辑,我们需要通过用户的点击情况,判断用户的喜好,基于喜好,再根据内容的标签,把它精准地和用户匹配到一起,形成完整的个性化的体验。

性能体验这里先一笔带过,主要是点播云服务、直播云服务等等。

image

大家在抖音上,经常看到一些很火的广告,其实都是自动生成的。只需要有些图片、文字,或者小的视频素材,我们就可以将其自动生成创意广告。

image

这里介绍一个电商行业的一个口红试色案例案例,我们方案的最大优势是脸部识别的特征点多,而且即使有手遮住嘴唇,也不会出现“穿帮”情况。基于此,很多商品试穿试戴的需求,都可以通过这种方式来实现,创新的体验也产生了实际增长。

image

关于个性化体验,前面介绍了怎么做内容定制、算法推荐以及智能内容中台,这些整合起来之后,就提供了内容定制,或者叫个性化推荐的方案能力。这主要针对于什么样的场景?

一些企业没有字节跳动那么成熟的内容生态,也没有原创者提供内容,要怎么解决这些问题?我们提供内容池,这个内容池有字节跳动的全部内容,包括长视频内容、短视频内容以及Feed流。

内容池里的内容我们可以自定义,因为企业想在自有平台上放的内容,肯定要和自身相关,至少要没有竞品视频。举个例子,比如汽车4S店或者汽车厂商,想把A品牌汽车的视频放进来,那肯定不希望其他品牌汽车的视频大量出现。

所以企业可以基于内容池做内容定制,定制完之后,再做内容自建和运营管理平台。因为他本身不是做内容平台的,所以内容创建、管理、分发这一整套体系,没必要自己建一个很重的平台。

这个时候我们就把这些能力打包起来,通过SaaS化的方式,做成一个推荐引擎,就是说,用户在自己的APP里面只要集成我们的SDK、调用API接口。我们就能根据APP用户请求,返回针对这个用户的精准推荐内容。

这非常简单,开发成本也非常低,实际上现在有很多工具类APP已经把这些能力都上线了。

image

当然除了提供打包方案,对于自身需要有自己的内容生产、内容管理以及内容分发的全套平台,我们也把字节跳动内部的那一套平台给沉淀下来了。

我们现在服务的行业除了泛互,也有文化传媒方向的。这些客户有大量的PUGC,也就是机构合作或者是PGC内容。这些内容可以多源、多类型地接入。

在接入后,我们会把它放到加工环节,这里面就有内容质检和内容理解。推荐算法固然很重要,但是如果没有理解好内容,没有这些内容的特征,那推荐算法也就没有用武之地。

之后到了数据分发环节,这里设计了各种各样的分发规则,包括做内容素材的分类,场景管理,算法推荐。下面会有数据大屏,可以在推荐场景、投放场景,进行实时的产品呈现。

最后就可以把内容推到客户C端场景、APP、小程序包括一些其他的平台。

image

第三部分体验是性能体验。

现在因为手机或者其他终端设备,拍照的图片越来越大,虽然网络越来越好了,但在一些传统的JPEG业务中,还无法满足业务发展需要。例如很多没有数据大盘,不管是图片、点播、视频、直播,如果没有全链路的数据监控,用户没法得到保障。

这些基本功需要花很长时间去解决,这对于用户体量还没有达到临界点的企业,不会花太多精力去关注这些。

image

这里简单介绍ImageX。很多大型的互联网企业都会有一个基于开源的图片格式,字节跳动现在是HEIF图片压缩编码格式。怎么来理解?简单来说,它在相同的主观质量情况下,通过自有的压缩算法,可以降低图片尺寸以及文件大小。

这样分发的时候,它可以帮助解决:图片太大传得慢,图片太小清晰度不够,想把清晰度调高,又需要考虑网络带宽以及成本。

例如字节跳动每年都会有非常大的宽带支出,那我们只要做3-5%的优化,就可以带来非常大的成本优化效果。所以很多企业都会做自己的视频、图片的私有化格式,通过底层的编码、压缩算法提升性价比。

ImageX还有很多处理能力,包括裁剪、水印、压缩等等,都是大家比较通用的能力。

image

在多媒体云架构上,也有极致性能体验以及成本优化。前面介绍了端上的特效或者短视频内容,我们会覆盖到直播、点播或者图片这些场景,然后对这些内容进行智能分析。这里包括了图片处理、图片存储的能力。

字节跳动现在每天增长的文件存储量非常大,因为有很多视频内容,并且还在每天几千万条地快速产生。因此存储的成本、技术要求,都是比较高的。

上面不管是创意体验的好玩、有趣,还是个性化体验的内容精准推荐,都是让内容对大家有吸引力,让大家百看不厌。性能体验则是帮助提高视音频性能,降低成本。

基于科学实验的数据决策力

接着是基于科学实验的数据决策力。现在市面上大DAU的产品,都会有灰度发布的场景,比如,抖音作为日活六亿的产品,这些产品做发版的时候,肯定不会轻易地发个功能就直接全线上了,一定会通过灰度、A/B测试。

A/B测试在字节跳动是被践行到非常极致的决策方式。字节跳动是怎么样来构建一套科学的数据决策体系?我们做所有的事不是站在上帝视角拍脑袋。诚然,强大的产品经理是会有敏锐的同理心、洞察力,但即使是在这样的情况下,我们依旧会用数据,做科学的决策。

image

这里是我们做精细化运营、数据运营的流程。

数据采集之后,对数据进行分析,要了解用户、了解产品,再做用户的分层。因为做运营策略,不同的用户要做不同的策略。比如电商做发代金券活动,发给大家代金券一定不是统一的发5块或发10块,一定是根据每个用户的情况,有的人发5块,有的人发10块,这样效果更好。然后设计运营的策略,包括选择用户、触达用户,触达完后,用户被激活或者再次唤醒,被产品承接、效果回收,包括把匹配的关系做迭代,最后做产品的迭代。

我们很多产品虽然用户量已经非常大,但是每天仍然会有大量的迭代。

image

前面是运营流程,这是整个精细化用户运营的系统架构。

可以看到,下面是经客户授权的全渠道数据采集和分析,包括第三方数据、企业第一方数据,这些数据全部汇聚到数据中台里面去。数据中台里面要把大数据团队要做的事情做完。

之后,我们会基于授权后的数据进行分析,包括基于分析做用户洞察的智能报表,构建实时数仓。实时数仓会支持到包括A/B测试,通过科学决策的机制,做好营销触达、版本迭代、产品优化。

如果用户数据只是在境内的内部业务用的话,我们是可以直接用的,但是还要考虑到,很多时候用户画像要服务到第三方公司。因为基于数据合规,用户画像首先不能出境、不能出公司,只能在合规的前提下使用,所以我们有联邦学习的系统。

我们现在内部的数据洞察中心,就是ABI系统,字节跳动70%的员工每天都会用。这个BI系统不是管理者去看的BI分析的报表。在字节跳动内部,所有的工作都是基于数据去做判断和决策的,所以大家在工作当中会不断地在这个系统里面看数据、看报表、看归因分析。

image

前面讲了整个一套架构,这里通过一个简单的链条说一下如何通过实验验证,对假定或者猜想去进行验证和判断、做决策。

大家关注的东西,喜欢的东西肯定是不一样的。那我们首先通过用户的喜好、偏好,对用户进行洞察,再基于用户洞察,我们可以更好地理解客户,最终做到做千人千面的服务。

那到底要怎么样去把不同用户的洞察沉淀下来?

实际上,这块我们接触行业里面的公司或者客户非常多,真正能够做到像这样一个比较体系化,比较成熟的,都是一些大的游戏公司、电商公司或者互联网平台。因为他们有长时间的业务数据积累,可以建立一套用户画像系统。

但这样的体系积累,至少在现阶段并不是所有公司都能拥有的。但现在业界比较新的做法是联邦学习,通过横向联邦或者纵向联邦,通过自己用户画像,跟多方做联邦。这样在保护用户数据隐私安全的同时,又可以取各家所长,沉淀出自己的体系积累。

image

接着,我们再通过A/B测试进行科学的决策。这就是前面提到的,我们在定投放策略、发新版本,或者迭代一个产品功能的时候,都要通过数据做决策。

举个简单的例子,我不确定现场有多少头条APP的用户。如果大家有头条,可以跟家人一块把APP打开看一下。可能大家首屏的版式是不一样的,有人是大图模式,有人是三图模式,各自推的文章也不一样,内容关注不一样。年轻人可能关注财经、科技,老人可能关注其他的一些东西。

除了内容不一样,同一篇文章,它的呈现方式,有的可能是大图模式,有的可能是三图模式,这都不一样。除了呈现形式,包括营销策略,唤醒策略是不是好的,这都需要通过A/B测试做对比。

基于云原生的技术创新力

前面讲的第二个部分是我们基于科学实验的数据决策力。第三部分会简单介绍一下我们基于云原生的技术创新力,这是字节跳动能够快速取得增长的重要部分。

image

这块可以简单说一下,这套能力在端、边、云上面,都有固化下来或者沉淀下来的东西。

比如“端”,像在体验监测上,弱网、弱机体验全链路防裂化;APM上,我们做链路追踪,包括Web上、框架、引擎、集成、IDE;小程序上,框架、引擎、集成、IDE;还有组件市场、轻服务、平台、开发平台、跨平台技术栈。

在“边”上,在边缘场景会有些计算引擎或者边缘场景,包括边缘网络。

“云”这块前面也介绍了,因为我们用了很多家的云,所以我们对多云的使用和管理,包括多云架构的经验也比较丰富。这块包括服务网格、DevOps、服务治理、云边协同、应用观测,我们内部都做了大量的工作,也沉淀了很多的能力。

image

这里介绍一个和泛娱乐行业关系较大的,移动应用的开发平台。

前面介绍过我们需要做很多的移动应用的开发,开发完后,还要做很多机型的适配,做很多测试,包括开发时要做版本迭代。这一套流程下来,一个公司如果不去借用现有的工具或者成熟能力的话,而是全部自己弄的话,成本和代价会非常大。举个例子,我们在国内做APP开发的适配,需要七、八百款的机型适配。所以这里,我们已经沉淀下来一套开发框架、流程、工具。这样我们在做新APP开发时,就可以直接复用。

所以我觉得大家如果要去做自己的产品,上来一定不要蛮干,如果市面上有比较成熟的,而且是比较低成本的,那就直接拿来主义。

image

应用多云是多云管理的正确路径,现在很少有哪个用云的公司只用一家云,大家用云至少会用2-3家云。

比较初阶的用云是一个资源多云,做一个统一的管理界面,或者平台能够把各个资源、监控界面统一管控起来。这就达到了现在比较主流或者比较有追求的多云管理的一个状态。

但实际上真正要想做到比较成熟,做到应用多云的话,可能在包括安全策略、架构一致性、数据多活、灾备、应用架构这块都要做很多的工作。这块我相信很多公司如果要用多云的时候,从公司本身来讲是不会花精力来做这件事,因为这个东西跟咱们的核心KPI、核心业务没关系,所以可以找已经做过这些事的人。

image

最后再说一下我们的容器服务,其实也是基于一个多云的应用平台,因为我们很多业务要去保证在多朵云之间能够灵活调度。

我今天介绍就到这里,非常感谢大家。