“文心一言”争议不断,但现在断言还为时过早
2023-03-22 08:01:04 76
当天深夜,微软召开“The Future of Work with AI”发布会,推出搭载了最新GPT-4的Microsoft 365 Copilot,势要在AI这块领域拿下属于自己的市场和地位。 大模型火爆全网,但“文心一言”大模型的应用价值、在全球科技圈的地位、相较于GPT-4之间的差异几何,等等问题还不甚清楚。当然,不清楚归不清楚,这并不妨碍百度因为“没准备好”,而受到网友“群嘲”。 在“文心一言”亮相后,市场并非没有负面声音,主要聚焦于没有应用产品落地。对于科技创新来说,没有实际应用价值的“大饼”,越来越难以被市场和资本接受,种种质疑也都指向——应用这一方面。 然而,“文心一言”现阶段就没有价值吗? 未必。 大模型的价值大模型的应用,目前最典型的莫过于搜索应用等个人场景,以及微软将GPT-4和办公业务结合,衍生出的商务应用价值。 对于ChatGPT,相信有条件的朋友都已经试过了。大模型在C端的风靡,帮助大众更快了解到大模型的未来前景,包括网页、本地安装的程序、移动端小程序、群聊机器人等等。 大家的共识是,虽然现在的AIGC产品仍然存在一些bug,但机器学习的速度惊人,bug能够在可见的时间内被修复。 然而,C端的应用不是大模型的全部。笔者以为,大模型的真正价值在于,它是“通才”,且可“大”可“小”。 通才的意思是,大模型什么都知道一点,也能够非常合乎逻辑地把一些信息进行整合,比如 ChatGPT就是一个典型的“万金油”。它的缺点在于不够精准,不够深度,但它的潜力在于,能够通过算法,不断迭代优化,答案会随着对话的深入而逐渐完善,“进化能力”才是大模型的真正价值。 可“大”可“小”的意思则是,它能够精简并适用单一场景,即在大模型的基础上,对大模型进行“瘦身”,再投入垂直领域的数据进行增量训练,即可训练出服务于垂直领域的小模型,降低成本,这是“小”。 大模型也可以通过提升算力、扩大数据库,适用复杂场景,这是“大”。 可大可小,意味着在未来数字化生产的时代,大模型有希望在大多数行业进行应用,只不过应用程度有深有浅。当然这只是我们的畅想,具体未来如何还有待时间检验,但大模型应该有这个潜力。 东方证券认为,未来大模型可能率先落地的场景,涵盖了B端通用软件和垂直行业领域,如办公软件、OA、ERP等企业日常管理经营必备系统,以及医疗、教育、金融等行业所需的辅助诊断、辅助学习和智能风控等专业化的场景。 毫无疑问,生成式AI会带来需求的爆发性增长,这的确是一项突破想象的应用。 我们常说没有应用价值的理论和前沿技术就是耍流氓,但事实上很多大模型的应用,可能会最先应用在B端,因而没有那么为人所熟知。
笔者认为,百度的“文心一言”也可能面临这样的情况。“文心一言”发布后,网友吵翻了天,无非是在对标GPT-4时,发现“文心一言”还只停留在规划阶段。 但笔者以为,这不妨碍百度有机会成为GPT-4第二。消费端的应用固然重要,但行业端应用所产生的经济效益,更是巨大难以忽略。 至于我们为什么认为百度有这个机会,以及现阶段的“文心一言”为什么有推出的价值,我们下文接着说。
图片来源:东方证券百度可能是最佳“人选”对于百度来说,押宝“文心一言”似乎是个不得已的举措,毕竟这可能是百度最有希望实现“翻身”的一个业务。 百度陷入增长困境已经多时,无论是押注自动驾驶,还是旗下扛起增长重任的公有云业务,都是百度实现增长的抓手。在外界质疑不断的时候,已经成立20余年的百度需要给外界更多信心。 百度在发布会上表示:深度学习、自然语言处理,需要多年的坚持和积累,没法速成。对于百度来说,不管是否准备好将这个产品推向前台,在面临微软和GPT-4这样突破性创新后,百度很难不有所动作。 所以,推出“文心一言”被认为是“形势所逼”,也无可厚非。但笔者以为,百度有机会。 的确,从实际应用来看,现在的百度好像是比不上GPT-4,但百度至少有这个底蕴在。过去10年,百度在AI领域投入的研发费用超过1100亿元。百度知道、百度文库、百度知识图谱、百度搜索等核心产品都是文心大模型重要的数据集和语料库来源。 根据东方证券数据,百度搜索作为百度生态的核心,能够直接和百度知道、百度文库、百度贴吧等中文语料库连接,本身就是一个超大型数据集合入口。 同时,百度搜索每天要处理用户上万亿次的搜索需求,可以持续从全网形态各异的资源中持续学习,是大语言模型天然的迭代方式。 此外,百度在B端业务上天然有优势,特别是百度的云服务,跟大模型的发展十分契合。 笔者认为,未来“文心一言”或将率先在B端带来应用落地也未可知。毕竟,大模型与办公、OA、ERP、代码生成等场景天然契合,能有效促进企业经营管理全流程的降本增效,这一点也是百度擅长的。 当然,我们说百度有机会,并非对于百度目前大模型的认可,只是说,作为国内最大的搜索引擎,百度势必要成为基于“大数据+强算力”这个盘子的承载者。 现阶段,在B端业务上,在公有云的竞争上,百度还有很多竞争对手。不过,一旦百度能够将“文心一言”率先接入到B端服务上,相信对于其他竞争对手而言,打击是巨大的。 就像发布会上李彦宏所言,自然语言的发展速度超过想象,未来会是“飞速发展,日新月异”的面貌。
未来是大模型的未来基础大模型距离大规模产业应用、并成为产业基座还有很长的一段路要走,需要“大模型+接口平台+生态应用”三层协同共建,共同促进AI和产业共同发展。 未来几年是大模型的快速发展窗口期,相关的大模型算法、算力基础设施、下游B端通用应用软件和垂直行业领域都有望迎来加速增长。 不管百度现阶段是“不得已”推出“文心一言”,还是真的做好了准备,作为国内最有希望对标GPT-4的企业,“文心一言”接入各项业务,并拓宽合作边界,是看得见的未来。 我们期待百度,给出一份令行业和用户都满意的答卷。 参考资料: [1]《文心一言发布在即,大模型有望引领产业智能化变革》东方证券 【免责声明】文章内容仅供研究和学习使用,不构成任何投资建议。
【延伸阅读】
本文作者可以追加内容哦 !