中国大模型的应用层突破,为何注定从搜索引擎开始?

2023-06-30 08:02:15 63

本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。

没有人能预见未来,但我们可以因循常识,去捕捉技术创新演进的节奏韵脚。 毋论大模型本身,还是基于大模型的应用突破,捕捉它们的演进趋势,存在一个放诸海内外皆准的认知框架:“需求-供给”这一最朴素的经济学原理。也就是说,AI大模型在应用层的最终突破,一定将指向两个问题:1、最广泛的需求在哪里2、更优质的供给在哪里基于对这两个问题的逐层抽丝剥茧,我们可以得到这样一个答案:中国AI大模型的应用层突破,注定从搜索引擎开始。

01 寻找比尔:大模型应用层的破局时刻

科技领域有两大著名的经验规律,一个是为人熟知的摩尔定律,另一个是相对冷门但十分重要的安迪比尔定律(Andy and Bill's Law, Andy gives, Bill takes away)。安迪比尔定律表达的是:提高的硬件性能很快又会被软件消耗掉。正是因为这个特性,科技进步带来的优质供给会被需求持续吸收,形成供需相互促进的双螺旋循环,而非恶性的过剩。AI大模型已经进化到需求侧的“寻找比尔”阶段。大模型到底该怎么落地到应用?什么领域可以率先看到爆发?我们认为,大模型由于极高的智能化属性和极强的广泛嵌入性,它可以被用作一个非常优质的效率工具、智能伙伴。基于此,大模型在C端的定位理解,就从“替代”变成了“赋能”、“助理”。如何寻找AI大模型应用场景,也就是寻找真实可靠的需求,成了打通行业的任督二脉的关键。回头看过去30年的互联网革命,也遵循同样的发展轨迹,比如人们的衣食住行的需求被互联网实现了颠覆式的优化,但衣食住行这个底层需求并未改变。对于面向未来的大模型同样如此,抛开API、MaaS 等不同模式的优劣分歧不谈,当务之急是需要找到确定的底层需求,然后探索大模型对底层需求的优化路径。图:大模型应用场景归类;资料来源:广发证券

02“搜索与大模型的结合,像倚天剑、屠龙刀双剑合璧”

聚焦到需求侧,各领域智能化升级的节奏显然将是参差的:

通用性的需求,由于数据密度高、市场空间大、刚性强,是最先将可能被突破的。比如搜索引擎、行政办公、创意设计等。

垂直类领域,由于数据孤岛、专业性较强、私域封闭,通用的AI大模型可赋能进行升级改造的空间较小。

更进一步,从第一性原理出发,基于对“最广泛的需求在哪里”这一底层问题的审读,我们可以得到这样一个答案:中国AI大模型的应用层突破从搜索引擎开始。大语言模型,2023年已经全面迈入百亿、千亿参数规模阶段,其已经具备优秀的上下文学习能力、可观的知识容量、优秀的泛化性和复杂推理能力,简单来说,就是机器学会了用自然语言进行聆听和表达。作为赋能的效率工具,大语言模型已经具备切实可行的落地能力。在需求侧,无论生活,还是工作,人们对于提升日常行为效率,最大规模、最普惠大众的数字化与智能化应用场景当属搜索。从古代的《四库全书》到如今的百度搜索引擎,我们愈发认识到搜索是信息时代的通用性刚需。上一次搜索的革命工具为互联网,而AI时代的到来,将促进搜索的第二次重大革命。互联网解决了搜索信息丰度的问题,而AI内容生成与搜索场景有天然的契合度。 大模型与搜索的结合,会产生以下效果:搜索+AI在理解力、准确度和个性化上都有明显优化,能大幅降低处理信息复杂度、提升用户体验。展开来讲,搜索+AI能够很好去除传统搜索引擎大量同质化和片面化的低信息熵内容,过滤信息噪音,在搜索准确度上更高;同时AI赋予搜索更强的自我学习能力,能够持续优化输出结果,更好贴合用户使用习惯,更具个性化。对于这样的图景,百度集团副总裁、百度搜索平台负责人肖阳给出了明确指引:大语言模型(生成式AI)并没有威胁到搜索,而是让搜索更强了。搜索与大模型的结合,像倚天剑、屠龙刀双剑合璧,为用户提供更大价值。一言以蔽之,搜索一直是世界上规模最大的AI应用场景和成功的商业模式。我们苦苦寻找的需求场景就在手边。在海外英文搜索领域,我们已经看到这样的趋势得到验证。微软的发布基嵌入AI大模型的New Bing,增加了“问答式搜索”功能,问答机器人可以与用户聊天、协助撰写文本、汇总全网信息,其后APP的日均下载量增长了超过800%,远超同期谷歌搜索的表现;截止到5月,用户在New Bing上已累计完成5亿次对话,当前日活已经超过1亿人次。不难发现,优质供给在广泛需求上落地后,产生的效果是立杆见影的。图:New Bing推出后APP下载量快速增长;资料来源:Data.ai,中金公司

03最广泛的需求在搜索,更优质的供给也在搜索

在我们看来,随着AI+搜索的供需商业模式跑通,具有大模型能力+搜索业务的龙头玩家百度,将引领这一次代际变革的潮流。AI+搜索供需商业模式,需要玩家同时在两个领域均能够给出优质的供给,以及将优质的供给无缝对接给广泛的需求,难度远超API类的嫁接式做法。放眼中国整个TMT赛道,具备这样比较优势能力的目前只有百度。1)搜索与AI均具有极高技术壁垒,百度搜索的AI+搜索技术基座最为完善搜索是一个看似简单,但实际壁垒极高的生意,因为它需要满足用户的极致需求。搜索引擎用户迁移的成本极低,但格局却十分固定,正是因为满足用户极致需求这个事又很难、投入又很大,数据的壁垒又很高。在过去的二十多年里,百度的搜索框仍然是那个简简单单的搜索框,但背后的技术投入和沉淀,非一日之功。作为离搜索最近的专业人士之一,肖阳对此有着深刻的见解:搜索有一个特点,它的马太效应,拥有用户的、技术的、数据的、算力的公司,往往它的效果会越来越好,其实大模型也有这个特点,你跑的前面会跑的越来越快,从这个角度来说你看世界上的搜索引擎各个国家,一共就4个国家有搜索引擎,都没有被后来者颠覆过。另外如我们所知,百度集团多年All in AI已经形成强大的综合能力:

在模型层,百度是我国最早开放邀测知识增强大语言模型产品的企业,文心一言大模型已经构建了“基础+任务+行业”三级模型,具备强大的通用性。

在算力层,算力基础设施均由百度智算中心支持,昆仑芯二代已广泛应用在文心大模型。

在平台层,百度飞桨 Paddle是其自主研发的深度学习平台,文心大模型通过百度飞桨平台,实现模型训练、推理部署和场景应用。

合抱之木,生于毫末,九层之台,起于垒土。鲜明的AI+搜索技术优势,意味着大模型应用层更优质的供给注定是在搜索领域。2)百度引领搜索的下一代变革,有硬核技术,也更懂用户需求未来探究百度将如何引领搜索的下一代变革,我们可以从现在百度长期主义式的用户需求战略中管孔窥豹。 据肖阳介绍,在满足需求侧的用户体验工程上,百度搜索长期聚焦做好“三件事”:一是降低用户表达需求的门槛,让每个人都能以更自然的方式表达自己的需求;二是降低用户获取内容和服务的门槛,通过各种手段为用户提供更极致便捷的满足方式;三是丰富搜索引擎的内容供给,建立生态机制,使商家、机构等参与者能与用户精准匹配。 引领搜索的下一代变革,发力点仍然是从用户出发,做好需求端适配。我们不妨再从用户侧推演,作为用户,我们希望搜索引擎扮演什么样的角色呢?

一位勤奋的全能学者?搜索引擎通过阅读、理解、推理和总结海量的知识,充分理解用户的需求,并对信息进行整理和加工,让更多、更复杂的问题在第一条搜索结果中就得到全面满足。

一位值得信赖的贴心朋友?用户可以像与朋友聊天一样与搜索引擎对话。它能够听懂你的任何问题,并且你可以完全用语音进行互动。它将帮助你标记答案中的重点,提供权威的来源,并且可以调用各种工具和服务。

一位工作中的得力助手?能帮助用户处理个性化的任务,如输出研究报告、提供旅行向导、创作应用文案、生成图片等。……对于极致满足而言,在当前百度搜索每天已有的问答需求中,首条满足的比例已达到70%,半年前这个比例只有40%,开年以来,百度搜索日均新增问答需求超过3000万次,搜索+AI的技术飞轮已经开始越转越快。 小孩子才做选择,用户选择全都要。既然是满足极致需求,那用户自然是希望新一代的搜索引擎能够满足多重场景化需求。这有没有可能做到?百度给出的答案是“AI伙伴”。在2023万象·百度移动生态大会上,百度宣布内测“AI伙伴”,目的就是为了一站式解决这些极致需求。在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,降低了用户的输入表达门槛和成本,AI伙伴将大大拓展搜索的外延。 目前,AI伙伴虽然还处在内测时期,但我们有理由对其抱有更多期待。今年的6月7日高考首日。百度搜索正在内测的“AI伙伴”现场挑战高考语文考试,包括作文、微写作、古诗词赏析、文言文翻译、阅读填空等题型。一篇文言文作文甚至“迷惑”了资深语文老师,误以为是真人所写,给了很高的评价,认为水平都超过95%的同学。以上,奇点已经降临,AI大模型引领的经济新周期变革正在徐图展开,中国大模型的应用层突破,注定即将从搜索引擎开始。这既是大模型时代,中国在AI原生应用领域弯道超车的机会,也将是每个个体通往新周期所须搭乘的那辆时代列车。 往 期 推 荐


追加内容

本文作者可以追加内容哦 !