٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智本土
腾讯正式推出全球最大的视频生成开源大模型“混元”,支持中英文输入,能够快速生成高质量视频。该模型具备创新的技术架构,广泛适用于广告、动画和创意视频制作等领域。
腾讯发布全球最大视频生成开源大模型
开源创新
Lightricks推出的LTX-Video模型,基于DiT架构,实现了实时生成高质量视频的能力。该模型在消费级硬件上高效运行,为视频创作带来了全新可能。
LTX-Video:颠覆视频创作的AI黑科技,速度与质量兼得!
数智本土
智谱科技推出了基于 CogVideoX 和新音效模型 CogSound 的升级版视频生成工具“清影”,实现了图生视频、人物表演、音效同步等五项关键提升,进一步完善了多模态模型生态。多家企业已与智谱合作,以推动其大模型应用在电力、算力平台等领域落地。
智谱多模态模型升级:视频生成产品“清影”引入音效、4K 支持及更真实动作模拟
数智国际
Runway新推出的Act-One功能使AI生成角色拥有电影级面部表情表现,支持单摄像头即可生成逼真动画效果,极大简化3D面部动画制作流程。该功能目前对部分用户开放,将推动数字创作者在AI视频制作领域的创新。
Runway推出Act-One表情捕捉功能,助力AI视频生成技术革新
数智本土
智源研究院发布了全新原生多模态世界模型Emu3,基于下一个token预测即可实现文本、图像、视频的理解与生成,无需依赖扩散模型。Emu3在图像生成、视觉语言理解和视频生成等任务中表现优异,提供了一种统一的多模态研究范式,并已开源。
智源研究院推出Emu3:实现文本、图像、视频统一生成的多模态模型
视频创作
KLING AI 是由中国科技公司快手开发的先进视频生成模型,支持文本到视频和图像+文本到视频的生成。其特点包括多语言支持、逼真的3D动画、以及多种视频分辨率选择。目前,KLING AI 已在全球范围开放测试,并逐渐成为 OpenAI Sora 的强劲对手,在生成高质量视频内容方面展现出卓越能力。
全球AI视频创作新浪潮:KLING AI 的全球化与技术革新
数智国际
Meta与Blumhouse Productions合作开发AI视频模型Movie Gen,该工具能生成逼真的视频和音频片段。Blumhouse将邀请多位电影制作人测试这一技术,探索其在影视创作中的应用潜力。
Meta联手Blumhouse开发AI视频模型MovieGen,助力电影制作革新
数智国际
Meta发布了一款名为Movie Gen的AI视频生成工具,能根据文本生成带声音的高清视频,还支持编辑现有视频和图像。尽管Movie Gen具备多种功能,但Meta尚未准备好正式发布该工具,主要原因在于技术成本高且视频生成时间较长。
Meta推出AI视频生成工具Movie Gen,可自动生成高清视频
数智国际
OpenAI Sora开发负责人之一蒂姆·布鲁克斯宣布离职,前往谷歌的DeepMind团队,专注于视频生成技术和世界模拟器的研究。布鲁克斯的离职标志着OpenAI团队的一系列变动,同时Sora面临与其他视频生成系统的激烈竞争。
OpenAI视频生成器Sora联合负责人离职,加入谷歌DeepMind
数智国际
Luma AI发布Dream Machine 1.6版本,显著提升视频生成速度,20秒内即可生成高质量视频,并新增相机移动功能。该公司还推出API,支持开发者将AI视频生成功能整合进自有应用。
Luma AI推出Dream Machine 1.6版,视频生成速度提升10倍
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.