DIGIPUNK
去投稿
发表于:4 hours ago

腾讯混元开源四款小尺寸AI模型,覆盖0.5B至7B参数范围

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 开源四款小尺寸AI模型(0.5B-7B),降低硬件门槛
  • 💡 快思考与慢思考双模式推理,支持复杂问题处理
  • 🧠 原生长上下文窗口256k,可处理40万汉字
  • 🔧 部署简便,兼容主流框架,支持多种量化
  • 🌐 推动AI民主化,获多家芯片平台支持

数智朋克获悉,腾讯混元宣布开源四款小尺寸人工智能模型参数涵盖0.5B、1.8B、4B和7B专为消费级显卡设计运行,显著降低硬件门槛。这些模型适用于笔记本电脑、手机、智能座舱及智能家居等低功耗场景,支持垂直领域低成本微调,赋予开发者灵活适配能力。

作为融合推理架构,模型提供快思考与慢思考双模式:前者输出简洁高效,后者处理复杂问题具备全面推理步骤。技术亮点聚焦于agent能力,通过强化学习优化任务规划、工具调用及决策反思,胜任深度搜索、Excel操作等场景;同时,原生长上下文窗口达256k,一次性处理40万汉字内容,记忆细节并推导后续发展。

部署过程仅需单张显卡,部分PC、手机和平板设备可直接接入,兼容主流推理框架如SGLang、vLLM和TensorRT-LLM,支持多种量化格式提升开放性。实际应用中,模型已在腾讯内部业务验证:腾讯会议AI小助手和微信读书AI问书利用超长上下文解析完整会议或书籍;腾讯手机管家实现毫秒级垃圾短信拦截,隐私零上传;智能座舱助手采用双模型协作优化车载环境。

垂直领域表现突出,金融AI助手通过Prompt优化达成95%以上意图识别准确率;游戏翻译与QQ飞车手游NPC展现多语言理解与方言处理潜力。Arm、高通、Intel和联发科技等芯片平台已宣布支持部署,加速终端设备集成。开源策略推动AI技术民主化,促进社区创新与行业应用迭代。

本文链接: https://www.shuzhipunk.com/articles/EiFBfTxrwpR
转载请注明文章出处

文章所属标签
腾讯混元
开源AI模型
小尺寸模型
消费级显卡
长上下文