DIGIPUNK
去投稿
发表于:2023年12月03日

阿里云发布通义千问2.1版及新大模型

数智朋克

   阿里云最近更新了通义千问至2.1版本,并推出了三款新的大模型:Qwen-72B、Qwen-1.8B和Qwen-Audio,展示了在多个领域的领先技术。

   Qwen-72B模型,拥有720亿参数,基于3T tokens训练,其性能在多个权威基准测评中超越了其他开源模型,甚至在某些测试中超过了闭源的GPT-3.5和GPT-4。这个模型在英语和中文任务、数学推理和代码理解方面表现卓越。

   Qwen-1.8B模型旨在为端侧应用提供支持,能在资源受限的设备上运行。阿里云也首次开源了音频理解大模型Qwen-Audio,能够理解多种类型的声音信号。这些模型的发布标志着阿里云在AI领域的进一步发展,特别是在开源模型方面的领先地位。阿里云的大模型社区“魔搭”已有超过150万次模型下载,用户可以通过多个平台体验和应用这些模型,推动AI技术的商业应用和学术研究。

本文链接: https://www.shuzhipunk.com/articles/xrBHtVzVmWk
转载请注明文章出处

文章所属标签
Qwen-72B
Qwen-1.8B
Qwen-Audio
大模型
通义千问