You need to enable JavaScript to run this app.

火山引擎副总经理张鑫:智能技术在媒体内容创作领域的应用与实践

最近更新时间2021.09.17 10:54:46

首次发布时间2021.09.17 10:54:46

近日,2021中国国际智能传播论坛在江苏无锡成功举办,本届论坛以“新时代 智传播”为主题,搭建起一个聚焦智能传播的国际高端交流平台,关注前沿动向、分享一线观点、贡献中国智慧、凝聚国际共识。

火山引擎副总经理张鑫参与了本次大会,在智技术论坛发表了以《智能技术在传媒领域的应用与实践》为主题的分享。在分享中,张鑫通过几个关键词介绍了字节跳动,并指出字节跳动相关的技术能力、方法论与技术理念,目前正通过旗下的智能科技品牌火山引擎对外服务。

以下为演讲实录:

感谢大家,今天非常荣幸有这个机会来到智能传播论坛。

先简单做一下自我介绍,我并不是传媒行业的圈内人,但我自己也算是一个斜杠青年,早年在清华毕业以后,在卡耐基梅隆从事和人工智能数据相关算法的研究,之后毕业进入了谷歌从事云计算相关产品的研究。之后我创业,创办了一家准独角兽的企业,被字节跳动收购后,现在在字节跳动做企业服务业务的孵化,对外的品牌叫火山引擎,希望能够做成一家服务其他行业的技术服务公司。

谈到字节跳动,我今天想讲几个关键词,也是外界对于字节跳动经常会打的几个标签。第一个标签我管它叫“字节速度”。

「字节速度」

字节跳动是一家成立仅九年的公司,但目前为止已经在150多个国家开展业务,产品已经超过了75个语种,在40多个国家的应用排行榜里,我们的APP下载量排名前三。

image

在宏观的字节速度背后,有一个非常具象的体现。今年年初,我们和央视进行了紧密的合作,成功举办了抖音春晚抢红包的活动,这背后体现了两大能力:

第一,规模大。整个活动积累了非常多的用户,每秒形成了数亿并发的请求。

第二,速度快。当我们第一次接到与央视春晚合作的消息时,距离春晚只有27天时间。往年举办类似的活动,头部互联网公司平均需要50天左右的时间,而我们只用了27天的时间,差不多一半的时间,就成功地完成了这样一个全民级的活动支持。

在字节速度的背后,其实是我们多年来技术和能力的沉淀,正所谓“台上一分钟台下十年功”。这里面包括日常每天进行的上万次敏捷业务迭代;包括字节跳动内部非常典型的中台架构,让我们能把很多通用的能力在拓展新业务的时候进行快速的复制;也包括算法的沉淀以及对于海量数据的敏捷分析。

这一系列的技术和能力积累,是“字节速度”的主要驱动力。开头也提到字节跳动旗下的智能科技品牌「火山引擎」,就是希望能够把字节跳动内部所有的能力和经验形成可对外的产品,复制到其他行业里。

「字节速度」的产品背后

从字节跳动的角度来讲,算法和技术仅仅是工具,最终我们要产生影响力,产生对用户的黏性,靠的还是产品。字节跳动打造多个爆款产品的背后有一整套Know-how和特有的逻辑,今天我就简单分享几个。

第一,字节跳动做产品的时候是极其数据驱动的偏执狂。我想问一下在座有多少位是抖音的用户,可能有日活用户,月活用户。大家知道,抖音最基本的操作是滑,用户看了一个视频后去滑,但是其实在简单一滑背后产生了丰富的行为数据,这些行为数据都会作为算法的反馈去持续提升产品体验。

举一个非常生动的例子,比如说我们会观测滑和停留的时间。如果一个视频,用户看了几秒再滑,可能确实不感兴趣,但如果用户瞄一眼立刻就滑,那可能其实是感兴趣的,只是此刻不敢看或者不方便看。这种细微的差别反映了用户不同的情绪,可以作为优化推荐算法很好的输入数据。

除此以外,字节跳动还是一家非常讲究科学实验的公司。很多人都会问,字节跳动这些爆款应用是怎么打造的?是不是有超强的产品经理?其实依靠很强的用户同理心、头脑风暴决策,只是一部分,我们还会依靠A/B测试。

今天很多人都知道今日头条、抖音,但其实在公司创立之初,我们总共研发了差不多20多款产品,具体怎么抉择呢?就是投放到市场,产生不同的实验对照组,同时基于数据观测广大用户最喜欢哪一款。

这种A/B测试不光应用在产品的选型上,还包括产品起名。今日头条这个名字怎么来的?就是通过A/B测试测出来的,另外抖音的名字,同样也是通过A/B测试,最后结合人为决策,确定最终产品名。

除此之外,我们做一个新产品时,还非常关注这个产品的价值本源,避免自嗨。熟悉增长领域的朋友都知道有一个成熟的方法论AARRR。第一步就是拉新,我们做一个产品最重要的,就是先看这个产品本身是不是能够留住用户,产生价值。这个达到以后再谈其他的事情。

大家做产品最终的目标还是希望能够实现商业化的成功,对于商业公司来讲可能是实现商业变现。

image

这个例子是我们跟某个手机厂商的合作案例,可以看出来是应用商店的排版。最左边是一个经典的款式,按照卡片去排不同的应用,但是基于我们的方法论后,我们建议该产品设计成右边的模式——瀑布流。那么左右两边会有什么样的差异?以及为什么右边会更好?

答案是采用瀑布流的模式以后,用户在下拉的过程中会产生更多的反馈。卡片模式下只能观测到用户点了没有,但在下拉模式可以看到停留的时间、下拉的力度和速度,这些都是可以作为优化算法的依据。

智能传播的应用与实践

回到今天的主题,我们做智能传播的时候,除了算法还有个问题,对于内容单一怎么解决?

作为字节跳动,其实有很大的优势点,因为不管是头条图文的资讯,还是抖音、西瓜视频的视频,其实已经形成了一个庞大的生态库。这些生态库,火山引擎可以以API或者是SDK的方式,输出到合作伙伴端,迅速让合作伙伴的内容形态变得更加丰富。此外,火山引擎具有的数据分析能力,也可以作为洞察工具提供给行业内合作伙伴。

image

这里简单分享一些我们在AI领域的尝试。以上是一些小的案例,最上面是人脸融合,不光做照片和背景的修复和增强,甚至可以把另外一张照片的现代化人脸融合到另外背景里面,此外还包括抖音特效里,使用鼻子作为一个标记点去做标记的跟踪,以及线上的动态试装等。

火山引擎很好的一点是,所有的能力大家都可以在抖音上看到。如果你使用抖音,那么火山引擎所有技术能力、算法能力都能在抖音上体验到。

image

最后,字节跳动各种App产品背后其实是有成熟的方法论,这些方法论和技术体系都会通过火山引擎产品、行业解决方案输出,赋能给其他的企业。

比如AI中台能力,以计算机视觉(CV)、视频编辑(VE)、AR特效能力为核心,牵引语音和自然语言处理(NLP)等多模态AI能力赋能融媒体广电客户。针对融媒体行业比较共性的需求痛点,我们结合内部最佳实践和平台产品,包括内容合作、内容推荐算法、视频智能标签、视频智能创作、智能拆条、视频编辑、内容管理及分发平台、多媒体视音频平台等,覆盖融媒体业务的采、编、分发全流程,提供整体解决方案。

时间关系简单分享这些,感谢各位。