核心要点👉
- 🎬 Veo 3.1推出新预设模板,用户可通过上传照片或文本定制视频,将自己转化为视频核心角色
- 🌈 提供15种视觉风格模板,包括赛博朋克、电子游戏和宇宙等创意选项
- 🍳 上个月推出“食材转视频”功能,针对移动设备优化,扩展日常生活应用
- 🤖 图像生成代号“Nano Banana”,整合两种模型:基础版强调速度,Pro版支持高保真文字渲染
- 🔍 Gemini 3 Pro Image支持4K分辨率、实时数据验证和混合参考14张图片生成图像
数智朋克讯,谷歌近日为其整合在Gemini平台内的视频生成模型Veo 3.1,推出了多款全新的预设模板。这些模板旨在强化用户对生成视频场景元素的操控能力,用户可以通过上传个人照片或输入文本描述,对模板进行个性化定制,从而快速生成视频内容。这意味着,用户能够借助一张照片,将自己转化为所生成视频片段中的核心角色。
目前,这批新模板已通过官方网站以及Gemini移动应用程序向用户进行推送。Veo 3.1目前共提供了十五种风格迥异的模板,涵盖了从“文明”、“金属质感”、“备忘录”到“赛博朋克”、“电子游戏”、“宇宙”等多种视觉风格,同时也包含了“魅力光效”、“毛线玩偶”、“果冻卡通”等更具创意表现力的选项。
就在上个月,谷歌还为Veo 3.1推出了名为“食材转视频”的更新,该功能针对移动设备进行了专门优化,允许用户基于食材的静态图片来创建动态视频,进一步拓宽了视频生成模型在日常生活场景中的应用边界。
与此同时,谷歌在Gemini平台中的图像生成功能,其内部代号为“Nano Banana”。该功能整合了两种不同的模型,其中“Nano Banana”模型基于Gemini 2.5 Flash Image,专为需要高吞吐量和低延迟的任务设计,强调生成速度与效率。而“Nano Banana Pro”则对应Gemini 3 Pro Image预览版,它专为专业素材创作而生,能够运用进阶推理能力来处理复杂的指令,并生成具有高保真度文字渲染的图像。所有由这些模型生成的图片都将被添加SynthID数字水印。
Gemini 3 Pro Image作为目前最先进的图像生成与编辑模型,引入了一系列新特性。它支持最高4K分辨率的内建图像生成,并能够为信息图表、菜单和营销材料生成清晰且风格化的文字。该模型还可以利用Google搜索作为工具,根据实时数据验证事实并生成图像。其“思考”模式会通过内部推理过程来解析复杂提示,并临时生成用于优化构图的“思维图像”。此外,该模型现在最多可混合参考十四张图片来生成最终图像,其中包括最多六张高保真度物体图片和最多五张用于保持角色一致性的人物图像。







粤公网安备44030002001270号