阿里大模型来袭,先体验压缩版终端交互!1、时间比预期的快!4月11日,发布通用大
2023-04-07 08:02:06 46
$数据港(SH603881)$
阿里大模型来袭,先体验压缩版终端交互!
1、时间比预期的快!4月11日,发布通用大模型;4月18日,发布行业类大模型。
2、阿里AI过往战绩佳:2022发布了通义大模型系列,整体的架构分为统一底座、通用模型层以及行业模型层。目前通用模型主要包括了通义 - M6 、通义 - AliceMind、通义 - 视觉大模型,其中:1)M6是中文社区最大的跨模态预训练模型,参数规模已经从20年的3亿参数发展到了10万亿参数;2)AliceMind是阿里达摩院开源的深度语言模型体系,包含了多种通用语言模型,比如超大中文 PLUG模型(270亿参数)以及多模态 mPLUG 模型等;3)通义 - 视觉大模型,目前已经在电商行业实现图像搜索和万物识别等场景应用。
阿里构建了大模型社区“魔搭”,社区目前已经有300多个优质AI模型,其中百亿参数以上的大模型超过10个。阿里通过魔搭社区,主力开发者的AI模型开发。
3、压缩版内测表现在GPT2.5-GPT3水准,真实大模型精度应该高一个量级!语音+交互模态体验有时会卡顿,但总体回答正确率比文心高。
总结:
1)影响大模型三元素:模型参数,算力,训练语义库!
阿里大模型和算力云计算上独领风骚,看到压缩内测版对电商交互问答 流畅,阿里淘宝多年天量真人交互数据 为大模型奠定training 基础。在三元素锚定下,腾讯/字节大模型同样值得期待。
2)Ai+硬件部署加快!此外推荐了斯坦福大学的alpaca(羊驼)模型,平替gpt3.5 试探压缩后部署在手机上,彻底打开应用天灵盖。现在阿里大模型压缩版接到天猫精灵路径也探索这条路径。可以观测到大模型+硬件终端的路径可能会爆发巨大生命力!
(转)
本文作者可以追加内容哦 !