EN
返回资讯列表
模型

谷歌发布Nano Banana 2 Lite与Gemini Omni Flash:4秒出图、10秒成片,轻量创作模型组合上线

2026年6月30日,谷歌DeepMind悄然上线两款轻量级AI创作模型:图像模型Nano Banana 2 Lite(代号gemini-3.1-flash-lite-image)和视频模型Gemini Omni Flash。前者主打4秒生成1K分辨率图像,成本低至0.034美元/张;后者支持对话式视频编辑,输出成本0.10美元/秒。两款模型可通过Interactions API串联,实现“文字→图像→视频”的端到端创作流水线。谷歌同步开源三个Demo应用(Anywhere、Space Lift、Omni Product Studio),展示在旅游、室内设计、电商等场景的落地潜力。

模型核心能力

Nano Banana 2 Lite:最快最便宜的图像模型

  • 速度:约4秒生成一张1024×1024图像,是Nano Banana 2(20秒)的五分之一。
  • 成本:0.034美元/张,约为Nano Banana 2的一半、Nano Banana Pro的四分之一。
  • 性能:在Arena.ai获得Elo 1255分(报道1)或1251分(报道2),排名第五,强于初代Nano Banana Pro。
  • 能力:保持提示词遵循、角色一致性、图中文字清晰度。谷歌建议初代用户直接升级。

Gemini Omni Flash:对话式视频编辑模型

  • 输入:支持文本、图像、视频混合输入,输出最长10秒视频。
  • 编辑:通过自然语言进行最多三轮连续编辑,保留上下文。
  • 知识:内置Gemini世界知识,可调用历史、生物学等常识。
  • 局限:暂不支持音频参考、场景扩展;3秒内视频参考处理不完善;场景切换时角色一致性有限。

价格与竞品对比

模型价格速度
Nano Banana 2 Lite0.034美元/张4秒
Nano Banana 20.067美元/张4-8秒
Nano Banana Pro0.134美元/张10-20秒
GPT Image 2(中等画质)~0.053美元/张约3分钟
Omni Flash0.10美元/秒10秒视频
Veo 3.1 Fast0.10美元/秒同价
Sora 2 Standard(720p)0.10美元/秒同价

中国厂商如字节跳动即梦、快手可灵,5秒视频定价约0.4美元,折算每秒约0.08美元,略低于Omni Flash。

串联工作流与Demo应用

通过Interactions API,用户可先使用Nano Banana 2 Lite快速生成图像,再将其作为参考输入Omni Flash生成视频,并继续用自然语言修改。谷歌发布三个开源Demo:

  • Anywhere:上传自拍,Lite将人像合成到地标场景,Omni Flash转为动态视频。
  • Space Lift:上传房间照片,Lite生成多种装修方案,Omni Flash生成空间漫游视频。
  • Omni Product Studio:产品白底图经Lite生成场景化商品图,Omni Flash转为电商广告视频。

这些功能已集成至Gemini App、Google Flow、YouTube Shorts等产品,免费开放。

社区反应与行业影响

正面评价集中在成本和效率:谷歌开发者关系团队Paige Bailey称NB2 Lite已成为默认出图工具;WPP、Figma、Adobe等企业已接入。负面反馈包括:高峰期排队超30秒、中文文字渲染错误、六指问题偶发、艺术风格迁移不稳定。部分开发者期待旗舰模型Gemini 3.5 Pro,该模型原定6月发布,据外媒报道推迟至7月,谷歌未予置评。

分析认为,谷歌此举并非“救场”,而是并行产品逻辑:旗舰模型解决能力天花板,轻量模型解决速度、成本和嵌入工作流的需求。在2026年中头部模型质量差距缩小的背景下,先进入用户工作流的模型可能更具商业优势。

2026年7月1日来源:综合整理