腾讯大模型,有啥不一样?

2023-06-25 08:02:35 47

来源:深AI(DeepAI2023)

作者:王敏

编辑:黎明

整个上半年,互联网大厂们轰轰烈烈地追赶AI大模型浪潮时,腾讯一直对外保持着低调姿态。就在外界以为腾讯在憋大招时,它带着行业大模型的最新动态来了。

6月19日,腾讯云召开发布会,首次正式公布行业大模型研发进展——已经为10余个行业提供了超过50个大模型行业解决方案。同时,腾讯云还发布了面向B端客户的腾讯云MaaS(Model-as-a-service,模型即服务)服务解决方案,要面向B端打造行业大模型精选商店,帮助企业快速打造专属模型。

 

在ChatGPT出来后,相较于其余多家头部大厂狂卷通用大模型、把发布类ChatGPT的对话机器人产品作为发布会标配时,腾讯似乎选择了一个不太一样的思路,先从行业大模型切入。

 

腾讯选择这个思路,其实也不难理解。毕竟通用大模型研发难度高、投入大、落地难,而行业大模型从前期研发到后期落地,都要相对容易一些。即便是已经发布通用大模型的百度、阿里等大厂,同样也在盯着行业大模型。

 

当然,腾讯也没有放弃做通用大模型,只是还没有发布,而且,自研只是腾讯的一条路。今年上半年,腾讯已经通过投资,站在了国内多家头部AI独角兽的背后。

 

面对新一轮激烈的市场竞争,一手自研、一手投资,在AI这股新浪潮中,腾讯有几分胜算?

没有聊天机器人,

腾讯先发了行业大模型

在发布会上,腾讯的行业大模型解决方案,以To B为主,面向企业端,距离C端用户较远,但透过一些案例,我们还是可以看到一些腾讯行业大模型的效果。   以腾讯云副总裁、腾讯云智能负责人吴运声现场演示的文旅行业智能客服场景为例,如果让普通的大语言模型推荐端午节江浙沪出行计划,那么得到的方案,可能只是泛泛而谈,给出的方案十分简单,甚至有点老套,并不具备实操性。   然而当类似的问题递给文旅客服行业大模型后,获得的方案则十分详细,甚至,当被问到非常具体的问题时,比如“请推荐一些苏州的酒店”,其不仅可以给出不同档次的酒店和介绍,还可以直接提供酒店的预订链接。   由此,文旅客服行业大模型让文旅行业的智能客服系统,得以在服务的同时促进商业化。   这只是腾讯云的行业大模型之一,据介绍,腾讯云已经为文旅、传媒、政务、金融等10余个行业提供了超过50个大模型行业解决方案。   在拥有这些行业大模型解决方案的基础上,腾讯云更看重的,是让企业加入自己独有的场景、数据,通过对行业大模型精调,快速生成自己的专属模型。   工具链决定着企业能不能真正把大模型的能力和自己的业务、产品相结合。为了让企业能够打造专属模型,腾讯云提供了大模型工具链和配套服务,包括数据标注、训练、评估、测试和部署等全套工具,企业可以依托TI平台(基于腾讯云计算能力的一站式机器学习生态服务平台),进行一站式大模型精调。   腾讯云MaaS全景图   根据腾讯公布的MaaS能力全景图,腾讯可以提供一整套的专属大模型落地流程,涵盖模型工具、流程方法和相关的配套服务。   腾讯将其MaaS服务比作一个精选商店,企业可以根据自身业务场景按需挑选 “产品”,自由组装。   据悉,腾讯云TI平台可以实现针对行业场景的低成本落地,比如智能客服场景,训练性能可提升10倍,训练成本下降90%。   洛克资本研究员王恬对深AI表示,腾讯云的MaaS一站式服务,可以帮助企业客户低门槛、低成本、高效率地部署量身定制的专属大模型,并借此实现收入提升,双方实现共赢。   腾讯云自身也已将大模型能力应用在腾讯会议、腾讯企点、腾讯云AI代码助手等多款头部SaaS产品中。   其中,腾讯会议即将推出的AI小助手,能够完成信息提取、内容分析等多种复杂任务;腾讯企点分析AI助手,能通过标准化数据采集和治理,以业务视角提出问题并获得可视化图表结果,提升数据分析效率;腾讯云AI代码助手覆盖开发关键流程,包括沟通、编码、排错、评审和调优,承接机械性工作,让开发者精更专注代码创作。   在腾讯集团高级执行副总裁汤道生看来,具体的产业场景,才是大模型的最佳练兵场。

为什么先盯上行业大模型? 在腾讯发布行业大模型之前,投身AI大模型的大厂们,也没有绕开行业大模型。   从百度的文心一言,到阿里的通义千问、商汤的日日新大模型、科大讯飞的讯飞星火认知大模型,乃至360的360智脑,每一家在发布大模型时,都会提及相应的垂直行业大模型。尤其百度和阿里,提供行业解决方案的同时,更要让企业能够打造自己的专属大模型。   大厂盯上行业大模型的原因很简单,正如汤道生所言,“通用大模型不一定是满足行业场景需求的最优解”。企业需要大模型能够在实际场景中真正解决某个问题,而不是在100个场景中解决70%-80%的问题。   他表示,通用大模型的训练数据主要来自公开数据集或网络数据,对于特定行业的专业领域知识了解有限;通用大语言模型的训练需要大量计算资源和漫长的训练周期,对企业而言昂贵且耗时;安全和合规是企业的必要考量因素。

此前有从业者对深AI指出,大语言模型正加速用户习惯从搜索交互到对话交互,这中间最大的改变是决策权的让渡。但是,目前即便是ChatGPT,提供的答案也做不到完全可信,因此,利用自己的场景和数据进行针对性训练,形成壁垒,市场也需要这样的行业模型。   深度科技研究院院长张孝荣对深AI总结道,总体而言,行业大模型的技术难度低于通用大模型。行业大模型是基于特定行业技术参数配置,不需要千亿参数级别的大模型也能实现,使用行业语料数据训练模型,所需算力成本和运营成本也低于通用大模型。而且,从实际来看,通用大模型无法满足企业实际运营需求。   吴运声认为,基本在亿级别参数以上的都可以称为大模型,但规模参数越高,消耗的资源和成本也越高。行业大模型的核心在于根据客户需求制定相关的模型参数,而不是一味追求“规模大”或是“参数高”。   百度副总裁沈抖也曾提到,未来所有企业都将强依赖大模型,所有产品都要基于大模型开发,这已经成为了一个产业共识。   包括腾讯在内,大厂们盯上行业大模型,正表明大模型正从天马行空,加速走向产业落地。

左手自研、右手投资,

腾讯很难“慢慢来”

今年以来,面对外界的如火如荼,腾讯给人的印象是低调,不着急、慢慢来。   就在此前,腾讯创始人马化腾在腾讯股东大会上也强调,“不能操之过急”。人工智能是互联网行业几百年不遇的、类似发明电的工业革命一样的机遇,互联网企业在AI领域都有很多的积累,腾讯在埋头研发,但是并不急于早早做完,把半成品拿出来展示。   在自研层面,腾讯确实对外相对谨慎。发布行业大模型后,吴运声对外表示,对于C端通用大模型,腾讯内部也有相关应用,但目前尚不能对外公开相关信息。   然而,腾讯在对外投资上,并没有那么保守,在6月初的一周之内被曝出投资了三家大模型企业。   6月1日,腾讯被曝4000万美金参与投资了MiniMax,后者新一轮融资完成后,估值达12亿美金,已经晋升AI独角兽行列。   接下来几天内,据天眼查显示,腾讯分别在6月2日与5日完成了对AI公司深言科技与光年之外的投资。

深言科技属于AI江湖中的“清华帮”,曾差点被王慧文收购,创始人岂凡超为清华大学计算机系博士,是清华大学孙茂松教授的学生。光年之外作为互联网大佬王慧文的创业公司,问世便深受瞩目,最新一轮融资获得的投资金额高达2.3亿美元,同属于AI独角兽。   布局大模型,腾讯以自研+投资“两条腿”走路。在内部研发上,To B和To C同步推进;而通过对外投资,腾讯已经包揽了众多具备潜力的AI企业。   根据天风证券相关报告,腾讯从2016年就开始投入AI基础研究,并先后成立AI和前沿科技实验室。2022年,腾讯首次披露大模型的研发进展,并在年末推出混元NLP万亿大模型。腾讯今年曾在财报会上表示,AI将是中长期的增长乘数之一,正在加速对于大模型的研发。   过去几年,腾讯对于AI基础领域的研究,已经有一定积累。进入2023年,当AI大模型成为大厂的竞争高地后,腾讯并非从零追赶,布局也并不算过度激进,但也不得不有所动作。   大模型时代,MaaS正改变云计算的游戏规则,成为一种新的商业模式。企业对于大模型的需求正与日俱增,哪家厂商能够提供能力更强且更加完整的模型服务,就能够抢到更多客户。   云计算大厂卷基础设施,卷行业大模型,也正酝酿着新的洗牌。在头部云厂商中,今年以来,伴随着阿里云和百度智能云凭借着AI大模型吸引客户,云计算市场竞争加剧,腾讯云很难无动于衷。   AI技术变革之下,新一轮“血雨腥风”才刚刚开始。腾讯想要“慢慢来”,但恐怕市场不允许。

追加内容

本文作者可以追加内容哦 !