You need to enable JavaScript to run this app.

2023第一期|如何通过大模型应用,创新用户体验

最近更新时间2023.07.26 18:58:13

首次发布时间2023.07.17 19:07:54

每一次技术变革都会带来体验创新的新机会,大模型已经当仁不让地拿起了技术革新的接力棒。那么,国内大模型已经发展到了什么样的阶段?模型企业如何降低千亿级训练参数所带来的高成本,持续升级模型性能?应用企业如何规避风险,放心拥抱大模型,助力业务增长?产业链条又要如何构建健康又可持续发展的大模型生态?
7月21日,2023火山引擎V-Moment第一期《如何通过大模型应用,创新用户体验?》如约而至。火山引擎特别邀请到了润米咨询创始人刘润、华泰证券信息技术部联席负责人、数字化运营部总经理王玲、智谱AI CEO张鹏以及火山引擎总裁谭待,共同就大模型当前发展及应用情况、模型企业面临的机会与挑战、模型应用企业的需求与展望、火山引擎的解决之道展开了深入的探讨。

火山引擎谭待:多模型格局下的训练与应用

未来的大模型市场,将呈现出百花齐放的多模型生态。火山引擎谭待指出,国内大模型领域的追赶进程分为三个阶段。第一个阶段是从无到有;第二个阶段是经过不断的迭代,让整个模型能够达到或者是超过GPT-3.5的水平;第三个阶段要更进一步,能够到达和超越GPT-4.0。
不过在模型应用的过程中也会遇到一些挑战:

  • 第一是双向信任,既要保护模型企业的大模型安全、又要保障应用企业的数据安全,只有把信任成本降到足够低,才会让应用更广泛。

  • 第二是性价比,未来推理端的成本支出将比训练端更高,因此只有推理成本足够低,企业才能有正收益。

  • 第三个是上下游生态,让模型的应用场景和企业已有系统打通,就可以在更多的场景里面发挥价值。

解决了这三个问题,才能让大模型商用更进一步。
谭待还认为,未来一定会有多种大模型,顶级基座是万亿参数级别的大模型,中间是一些千亿参数、万卡级别的模型,再往下是千卡级别的模型,每一层都会有不同模型的生态位。
而站在企业应用的角度,大模型会呈现“1+N”的态势:即1个主力模型和N个垂直场景模型。为了更好地服务多模型格局中的模型企业和应用企业,火山引擎近日正式发布的大模型服务平台“火山方舟”,可以帮助企业练好、用好大模型:

  • 对于模型企业:“火山方舟”提供极具性价比的算力和平台,帮助他们更高效稳定的去训练出自己的模型。

  • 对于应用企业:“火山方舟”汇聚了国内顶尖的大模型公司并且提供一站式工作台,方便应用企业能够快速接入多个模型去进行推理的应用或是精调。

  • 围绕着应用的核心痛点,通过类似于第三方数据托管的安全沙箱机制,解决模型使用过程中双向信任的问题。

  • 通过训推一体、混部等方式,“火山方舟”实现了资源的高利用率,把推理的成本进一步的降低。

  • 提供丰富的上下游的组件,把企业在各个场景应用的成本降低。

面对多模型格局,火山引擎将携手模型企业和应用企业,共同促进中国大模型技术的发展,以火山方舟为连接器,帮助模型企业和应用企业不断提升效率,创造更大价值。

智谱AI张鹏:云可以更好地帮助大模型推理训练

迈向通用人工智能,大模型是很重要的阶梯。智谱AI CEO张鹏指出,在迈向整个阶梯当中,还需要更多的算力、更多的数据、更好的算法来完成螺旋上升的迭代过程。
此外,在科技创新的道路上,追随别人的脚步是无法成功的。在大模型这件事上一定要有坚定的信念、核心的技术和创新的理念。因此在智谱AI追赶世界顶尖水平的过程中,在算法、架构甚至底层算力技术架构方面都在做自主创新。
因此,智谱AI在2020年就研发 GLM 预训练架构并开始训练百亿参数模型,2021年成功训练万亿级别稀疏模型,2022年进一步推出高精度开源千亿模型 GLM-130B,斯坦福报告显示 GLM-130B 是性能上可与 GPT-3 基座对标的双语开源模型。2023年2月,团队研发了ChatGLM,该模型基于 GLM-130B 持续进行文本和代码预训练并通过有监督微调等技术实现人类意图对齐,开源的 ChatGLM-6B 模型全球下载超过400万。然而在长期的训练当中,在算力上的投入也十分庞大。
云是很好的解决方案,云既可以按需在短时间之内提供大量算力,在闲置时释放以节省成本;又可以优化由人力、维护等带来的一系列成本支出,可以给企业更为灵活机动的选择。火山引擎所提供的机器学习平台以及底层资源调度平台,帮助智谱AI节省了大量的资金和时间成本。
智谱AI的愿景是让机器像人一样思考,希望跟火山引擎携手,用大模型服务千行百业。

华泰证券王玲:用大模型增强、放大本职能力

人工智能普及后,各个行业的应用企业最重要的是先学会用工具。华泰证券信息技术部联席负责人、数字化运营部总经理王玲从行业应用的角度,分享了大模型在金融领域的现状。王玲表示,从金融行业企业角度,最重要的是如何利用大模型的能力,增强和放大本职核心能力。从模型应用的角度来看,大模型的应用过程中数据的安全隐私非常重要,金融行业尤其如此。但大模型本身又是模型企业最重要的知识产权,因此数据与模型如何打通循环,成为了双方都有的顾虑。这就需要公正、中立的第三方进行安全和监督审计,让大模型能够真正的ToB落地,进行场景应用。
王玲认为,大语言模型具有强大的交互能力,可以先在客服领域尝试落地。包括语音客服电话、在线客服,以及知识库等。另一个应用方向是“智能副驾”(Copilot),程序员、研究员或投行工作者,都可以借助大模型来辅助进行生产和决策,如研报的生成效率可以成倍提升。可以预见的是大模型能够服务于企业,并创造更大效益。华泰证券也希望能够借助于大模型的这一波浪潮,把艰深晦涩的金融知识门槛降下来,真正实现普惠金融。

润米咨询创始人刘润:大模型会遍地开花,提升商业效率

所有技术进步,最后目的都是为了提高效率。润米咨询创始人刘润表示,坚信大模型能够改变行业、企业的商业效率。
在不断发展的过程中,以智谱AI为代表的模型企业即将会提供更具价值的大模型;以华泰证券为代表的应用企业,将不断创造出商业场景,改变消费者体验;以火山引擎为代表的综合服务商,支持模型训练推理,并提供平台桥梁,让产业链条的上下游都能安全地各取所需。
更多内容,可点击下方视频观看。