DIGIPUNK
去投稿

DeepSeek发布V3.1模型升级并开源基础版本,次世代模型R2发布时间未定

DeepSeek线上模型升级至V3.1版本,上下文长度拓展至128k,同步开源685B参数基础模型。次世代模型R2因硬件适配等技术挑战暂无明确发布时间。

2025年08月20日
谷歌推出2.7亿参数Gemma 3 270M开源模型,实现边缘计算高效部署

谷歌发布Gemma 3系列最新成员Gemma 3 270M开源模型,以2.7亿参数优化边缘计算部署。该模型在Pixel 9 Pro实测中创能效新纪录,并适配五类应用场景,开发者可通过Hugging Face获取。

2025年08月19日
阿里Qwen-Image模型登顶全球AI开源社区热度榜,千问系列推动中国开源生态爆发增长

阿里实验室开源的文生图模型Qwen-Image登陆全球顶级AI开源社区当日即登顶热度榜首,并在四大测试集刷新性能纪录。中国开源生态迎来爆发式增长,千问系列模型全球市场份额跃居第四,推动中文AI社区形成全球影响力。

2025年08月06日
昆仑万维开源多模态统一预训练模型Skywork UniPic

昆仑万维正式开源多模态统一预训练模型Skywork UniPic,在单一架构中融合图像理解、文本生成与图像编辑三大功能。该模型以1.5B参数实现多项SOTA性能,显著降低AI应用门槛。

2025年07月30日
阿里巴巴通义万相Wan2.2视频生成模型升级,引入MoE架构并开源三款模型

阿里巴巴开源的通义万相Wan2.2视频生成模型引入MoE架构,节省50%计算资源并新增电影美学控制系统。开源的三款模型支持高清视频生成,其中TI2V-5B可在消费级显卡快速处理高清视频。

2025年07月29日
OpenAI计划推出GPT-5及开源模型扩展开发者生态

OpenAI将于8月初正式推出GPT-5大语言模型,并同步发布API版本。同时,公司计划在7月底推出开源语言模型,标志着开源策略的回归。

2025年07月25日
德国 TNG 推出 DeepSeek-TNG R1T2 Chimera 模型,专家组装技术融合三大预训练模型

德国 TNG 公司推出 DeepSeek-TNG R1T2 Chimera 模型,通过专家组装技术融合三大预训练模型。该模型在基准测试中展现出高效率,推理能力接近原模型 90%-92%,同时输出 token 减少 60%,响应速度提升 200%。

2025年07月07日
谷歌开放Gemini 2.5 Pro预览版API试用通道,开发者可提前体验企业级功能

谷歌向开发者开放Gemini 2.5 Pro预览版API试用通道,该模型在响应结构和创意输出方面获得优化。Gemini 2.5 Pro在多项基准测试中表现突出,尤其在编码和科学推理领域展现显著优势,同时成本控制机制成为新亮点。

2025年06月06日
智谱科技发布 GLM-4-32B-0414 开源模型矩阵 突破实时推理性能瓶颈

智谱科技推出全新开源模型矩阵,其旗舰推理引擎实现每秒 200 Tokens 运算速率,商业化部署版本实现 30 倍级费用压缩。产品矩阵覆盖基础架构至深度决策全链条,并通过 z.ai 技术门户提供零门槛接入。

2025年04月16日
LG 发布 320 亿参数 EXAONE Deep 模型 韩国自主推理型 AI 实现突破

LG AI Research 推出 320 亿参数规模的 EXAONE Deep 模型,其闭环认知系统可实现自主假设生成与多维度验证。该模型同步推出参数压缩技术路线,并通过 GitHub 开源框架推动智能体型 AI 生态发展。

2025年03月19日