DIGIPUNK
去投稿

阿里云发布Qwen3-30B-A3B-Instruct-2507模型,激活3B参数媲美顶尖闭源模型

阿里云通义千问团队推出Qwen3-30B-A3B-Instruct-2507模型,在非思考模式下仅激活3B参数即实现与Gemini 2.5-Flash和GPT-4o相当的性能水平。该模型支持256K上下文长度,具备多领域通用能力并通过开源策略推动技术迭代与社区协作。

21 hours ago