阿里巴巴推出新一代通义千问 Qwen3 系列模型,通过混合推理架构与动态路由机制实现运算效率倍增,其 2350 亿参数模型在代码补全准确率提升 15%,现已通过 Apache 2.0 协议开源。该系列支持 119 种语言及 128K 上下文窗口,开源两小时内 GitHub 星标数激增 17000 次。
阿里巴巴即将发布通义千问 Qwen 第三代旗舰模型,引发行业对技术格局重构的关注。DeepSeek V3 版本凭借混合专家架构降低 27% 算力消耗,推动国内科技巨头加速技术迭代。
阿里云宣布在日本市场实施生成式 AI 战略升级,依托新建数据中心与本土合作伙伴共同开发行业定制模型。数智朋克讯,该计划重点突破制造业、服务业垂直领域 AI 应用,通过通义千问大模型技术底座实现自然语言处理与图像生成模块的精细化调参。
阿里巴巴集团开源通义千问 QwQ-32B 推理模型,凭借 320 亿参数规模追平行业标杆并实现 20 倍参数效率突破。该模型支持消费级显卡运行,企业 AI 推理成本降至传统方案 10%,适用于金融风控、医疗诊断等高需求领域。
阿里巴巴集团宣布未来三年将投入超 3800 亿元用于云与 AI 硬件基础设施建设,该金额超过去十年总和。在云业务 13% 增长及 AI 收入连续六季度三位数飙升的业绩支撑下,此次战略布局瞄准 AI 算力需求井喷与数字经济转型关键窗口期。
在OpenAI宣布终止对中国提供API服务后,阿里云百炼迅速回应,推出最具性价比的中国大模型替代方案,为中国开发者提供2200万免费tokens和专属迁移服务。阿里云百炼的Qwen2-72B模型在全球测评中表现出色,替代方案成本仅为GPT-4的50分之一。
阿里云宣布对通义千问大模型的商业化模型和开源模型进行降价。其中,GPT-4级主力模型Qwen-Long的价格降幅高达97%,API输入价格从0.02元/千tokens降至0.0005元/千tokens。
阿里云在通义大模型发布一周年时推出通义千问2.5版本,官方称其在中文语境下全面超越GPT-4-Turbo,并在Open Compass测评中追平GPT-4-Turbo。通义千问1100亿参数开源模型在GPQA等权威基准测试中表现优异,超过Meta的Llama-3-70B,并在Hugging Face开源模型排行榜上位列第一。
中国科学院国家天文台人工智能工作组宣布,成功推出新一代天文大模型——“星语3.0”。这一模型基于阿里云的通义千问开源模型进行构建
阿里云最近更新了通义千问至2.1版本,并推出了三款新的大模型:Qwen-72B、Qwen-1.8B和Qwen-Audio,展示了在多个领域的领先技术。