20230626(周一)美国:世界最大GPU集群(超级计算机)建设完毕
2023-06-26 08:02:21 52
中科曙光(超级计算机总成制造)、龙芯中科(CPU)、华为海思(GPU设计)、寒武纪-U(GPU设计)、中芯国际(7纳米制程芯片制造)、中科院微电子所(…)、中国软件(系统软件)、国防科大(…)、清华大学(AI大模型)、中科大(AI大模型)、北京大学(AI大模型)、南京大学(AI大模型)、等请加油!
——
AI超级计算机最新进展…20230622
芯智讯报道摘要:
美国时间2023年6月22日,英特尔(Intel)官方宣布,美国能源部阿拉贡国家实验室已经完成基于英特尔CPU及GPU的新一代超算“Aurora”的安装工作,今年晚些时候上线后将提供超过2 exaflops(2百亿亿次计算每秒)的FP64浮点性能,将超越隶属于美国能源部橡树岭国家实验室的“Frontier”,有望成为全球第一台理论峰值性能超过2 exaflops的超级计算机。
据介绍,Aurora 超级计算机由英特尔、惠普企业 (HPE) 和美国能源部 (DOE) 合作,旨在大规模释放高性能计算 (HPC) 三大支柱的潜力:模拟、数据分析和人工智能 (AI)。该系统配备了所有 10624 个刀片服务器,每个刀片由两个英特尔Xeon Max 系列 CPU(至强Max 9480) 和六个英特尔 Max 系列GPU 组成,使得Aurora 超级计算机总共拥有 63744 个英特尔数据中心 Max 系列 GPU 和21248 个英特尔Xeon Max 系列CPU。
……
为了更好的发挥Aurora的性能,近期,英特尔还公布了一个主要面向于科学领域的生成式 AI 模型——Aurora genAI。
据介绍,Aurora genAI 模型以 Megatron 和 DeepSpeed 为基础,其规模达到了 1 万亿个参数,相比之下基于GPT-3的ChatGPT 的规模仅为 1750 亿参数,Aurora genAI 在参数规模上提升到了5.7倍。该模型将在通用文本、科学文本、科学数据和与该领域相关的代码上进行训练。可以推动清洁能源聚变、催化剂、癌症、航空航天、神经科学研究、宇宙学等方面的研究。
英特尔公司副总裁兼超级计算集团总经理Jeff McVeigh表示:“Aurora是英特尔Max系列GPU的首次部署,这是世界上最大的基于Xeon Max CPU的系统,也是世界上最大的GPU集群。我们很自豪能成为这个系统的一部分,并为Aurora将实现的突破性AI,科学和工程感到兴奋。”
阿贡国家实验室副实验室主任Rick Stevens表示:“在我们努力进行验收测试的同时,我们将使用Aurora来训练一些大规模的开源生成AI模型,Aurora 拥有超过 60000 个 Intel Max GPU、非常快速的 I/O 系统和全固态大容量存储系统,是训练这些模型的完美环境。”
编辑:芯智讯-浪客剑
本文作者可以追加内容哦 !