DIGIPUNK
去投稿

阿里巴巴开源 Qwen2.5-Omni-7B 全模态大模型 支持跨模态实时处理

阿里巴巴集团开源通义千问系列最新 Qwen2.5-Omni-7B 模型,该 7B 参数规模模型实现文本 / 图像 / 音频 / 视频跨模态实时处理,通过双核架构与创新算法超越 Google Gemini 等竞品。模型在语音生成质量达专业播音水平,支持智能手机本地部署,并构建全球最大开源模型生态体系。

2025年03月29日
硅基智能 HeyGem.ai 开源代码库 72 小时斩获四位数星标 数字人技术突破工业化生成瓶颈

硅基智能旗下数字人解决方案 HeyGem.ai 通过端到端生成架构实现生物特征全维度快速复刻,其动态量化推理引擎与超高清渲染技术突破多项行业标准。该系统为教育 OMO、虚拟直播等场景提供工业化级生成式解决方案。

2025年03月11日