英特尔在中国推定制版AI处理器,可用于大模型对标英伟达

2023-07-16 08:00:24 57

英特尔推出针对中国市场的定制版高端AI处理器Gaudi2。7月11日,英特尔在北京召开发布会,宣布于中国市场推出深度学习处理器HabanaGaudi2,可用于加速AI训练及推理,包括浪潮信息、新华三、超聚变等公司,预计将推出搭载Gaudi2的服务器产品。

Gaudi2已与去年于海外发布,此次针对中国市场推出定制版以满足监管需求。据相关负责人介绍,此次发布的Gaudi2集成了24个可编程Tensor处理器核心(TPCs),配置21个(国际版为24个)Gbps以太网接口和96GBHBM2E内存容量,具备2.1TB/秒的总内存带宽等。在发布会上英特尔称,采用FP8软件的Gaudi2预计可提供比英伟达H100更高的性价比。

HabanaGaudi2作为落地英特尔AI战略的重要产品,英特尔对其有巨大市场期望。Habana原为以色列初创芯片公司,2016年成立,旗下产品曾渗透进入中国主要互联网公司,2019年12月,英特尔以20亿美元收购Habana。

英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立介绍,在将Gaudi2从海外引进中国的数月中,英特尔亦针对时下大模型热潮进行了软件层面的迭代优化。这一努力已取得成果,在6月公布的MLCommonsMLPerfAI基准测试中,其在GPT-3模型等多个AI模型训练中,均取得较好的训练成果。该公司称,与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有性能与性价比优势,可帮助客户降低成本。

AI计算大致分为两个层面,首先是对模型进行训练(training);之后是训练出的模型响应实际请求,做出推理(inference)。目前在AI训练领域,英伟达主导的GPU仍然是统治地位。在ChatGPT引发的大模型热潮中,大模型训练需求增多,使得英伟达用于训练大模型的A100/H100更加稀缺。除英特尔外,AMD、AI芯片初创公司均意图抢占部分市场。

面向AI计算负载,英特尔拥有CPU、GPU、FPGA、AI专用芯片等多种芯片产品。英特尔公司执行副总裁数据中心与人工智能事业部总经理SandraL.Rivera告诉界面新闻,Gaudi2作为用于AI加速的专用处理器,是英特尔产品组合适用于大模型负载中,性能最优的产品。面向科学计算,英特尔的MAX系列GPU也有较好性能表现。

她同时表示,英特尔将会对数据中心产品路线图进行更新,“在2025年的时候,我们会把高性能AI芯片与GPU整合,推出一个更完整的下一代的GPU产品。”

对于英特尔来说,推出中国定制版AI处理器,意味着英特尔在中国市场也在全力争取客户。2022年,中国区营收在英特尔总营收中占比约为27%。

GPU是全球数据中心处理人工智能应用的标配,占据超九成市场份额。英伟达的A100和H100,是同类产品中的领先者,在数据中心、超算中心等应用领域扮演关键角色。此前Habana的Gaudi处理器已为中国主流互联网、云服务厂商所熟悉,

开发者亦看重AI芯片的软件生态。SandraL.Rivera称,从英特尔看到,开发者通常从Pytorch、TensorFlow等AI框架层从事AI创新工作,在底层方面,英特尔采用了OneAPI(一种统一编程模型和应用程序接口)对标英伟达的CUDA,利用OneAPI提供的优化库,希望以打包的平台方案整合自家庞杂的产品路线,降低客户对底层硬件差异的敏感度。

在ChatGPT掀起的新一轮AI大模型浪潮中,提供底层算力的英伟达是最大的受益者,其GPU产品在大模型训练上几无替代品。英伟达CEO黄仁勋曾在3月举办的GTC大会上称,英伟达AI超级计算机DGX就是大模型背后的引擎。

市场期待在大模型领域,具有真正的芯片竞争者,挑战英伟达市场地位。在刚结束的WAIC人工智能大会上,AI芯片初创公司燧原科技CEO赵立东即在芯片主题论坛的发言称,长远去看,产业界需要第二解决方案,给市场、客户第二选择。他认为,创新架构和开源生态,对比现有主流方案可以促进市场化竞争,满足市场对性价比、能效比等需求。


追加内容

本文作者可以追加内容哦 !