DIGIPUNK
去投稿

阿里通义七款模型跻身Hugging Face全球开源前十,Qwen3-Omni夺冠

Hugging Face发布新模型榜单,阿里通义七款模型占据全球开源前十席位,全模态大模型Qwen3-Omni摘得桂冠。阿里通义已开源300余模型,全球下载量超6亿次,衍生模型逾17万个,均列全球首位。

2025年09月29日
DeepSeek开源视觉多模态模型Janus-Pro-7B,面临三重挑战与市场竞争

DeepSeek开源视觉多模态模型Janus-Pro-7B,支持图像生成与本地部署,被誉国产AI突破。同时面临技术迁移瓶颈、市场竞争加剧及模型幻觉问题,阿里巴巴Qwen3-VL多模态模型形成技术对比。

2025年09月26日
阿里巴巴与英伟达达成Physical AI战略合作,云栖大会发布Qwen3-Max模型

阿里巴巴集团与英伟达在2025云栖大会上宣布达成Physical AI战略合作,阿里云PAI将集成英伟达软件栈。吴泳铭披露追加AI基础设施投资,并发布评测全球前三的Qwen3-Max模型,推动阿里巴巴港股当日大涨9.16%。

2025年09月25日
阿里通义推出下一代基础模型架构Qwen3-Next并开源80B-A3B系列模型

阿里通义团队发布全新基础模型架构Qwen3-Next,同步开源基于该架构的Qwen3-Next-80B-A3B系列模型。新架构针对上下文长度扩展与参数扩展深度优化,通过混合注意力机制与极致稀疏MoE方案实现训练推理双重突破。

2025年09月13日
阿里云发布Qwen3-30B-A3B-Instruct-2507模型,激活3B参数媲美顶尖闭源模型

阿里云通义千问团队推出Qwen3-30B-A3B-Instruct-2507模型,在非思考模式下仅激活3B参数即实现与Gemini 2.5-Flash和GPT-4o相当的性能水平。该模型支持256K上下文长度,具备多领域通用能力并通过开源策略推动技术迭代与社区协作。

2025年07月30日
Groq 集成 Hugging Face Hub,三行代码部署 AI 模型,金融科技与工业研发周期缩短近半

Groq 正式集成至 Hugging Face Hub,开发者可通过 SDK 无缝调用服务,显著降低 AI 原型验证门槛。Groq 的 LPU 架构在实时推理中展现出十倍于 GPU 的速度优势,但面临基础设施扩张和盈利挑战。

2025年06月18日
阿里开源Qwen3-Embedding系列模型, 优化文本表征与排序任务

阿里开源了Qwen3-Embedding系列模型,涵盖Embedding和Reranker组件,专为文本表征、检索与排序任务优化。该模型在多项基准测试中表现突出,支持超过100种语言,并已在ModelScope、Hugging Face和GitHub平台提供资源。

2025年06月07日
阿里巴巴发布通义千问 Qwen3 系列模型,混合推理架构引发技术界关注

阿里巴巴推出新一代通义千问 Qwen3 系列模型,通过混合推理架构与动态路由机制实现运算效率倍增,其 2350 亿参数模型在代码补全准确率提升 15%,现已通过 Apache 2.0 协议开源。该系列支持 119 种语言及 128K 上下文窗口,开源两小时内 GitHub 星标数激增 17000 次。

2025年04月29日