谷歌发布Nano Banana 2 Lite与Gemini Omni Flash:4秒出图、10秒成片,轻量创作模型组合上线
2026年6月30日,谷歌DeepMind悄然上线两款轻量级AI创作模型:图像模型Nano Banana 2 Lite(代号gemini-3.1-flash-lite-image)和视频模型Gemini Omni Flash。前者主打4秒生成1K分辨率图像,成本低至0.034美元/张;后者支持对话式视频编辑,输出成本0.10美元/秒。两款模型可通过Interactions API串联,实现“文字→图像→视频”的端到端创作流水线。谷歌同步开源三个Demo应用(Anywhere、Space Lift、Omni Product Studio),展示在旅游、室内设计、电商等场景的落地潜力。
模型核心能力
Nano Banana 2 Lite:最快最便宜的图像模型
- 速度:约4秒生成一张1024×1024图像,是Nano Banana 2(20秒)的五分之一。
- 成本:0.034美元/张,约为Nano Banana 2的一半、Nano Banana Pro的四分之一。
- 性能:在Arena.ai获得Elo 1255分(报道1)或1251分(报道2),排名第五,强于初代Nano Banana Pro。
- 能力:保持提示词遵循、角色一致性、图中文字清晰度。谷歌建议初代用户直接升级。
Gemini Omni Flash:对话式视频编辑模型
- 输入:支持文本、图像、视频混合输入,输出最长10秒视频。
- 编辑:通过自然语言进行最多三轮连续编辑,保留上下文。
- 知识:内置Gemini世界知识,可调用历史、生物学等常识。
- 局限:暂不支持音频参考、场景扩展;3秒内视频参考处理不完善;场景切换时角色一致性有限。
价格与竞品对比
| 模型 | 价格 | 速度 |
|---|---|---|
| Nano Banana 2 Lite | 0.034美元/张 | 4秒 |
| Nano Banana 2 | 0.067美元/张 | 4-8秒 |
| Nano Banana Pro | 0.134美元/张 | 10-20秒 |
| GPT Image 2(中等画质) | ~0.053美元/张 | 约3分钟 |
| Omni Flash | 0.10美元/秒 | 10秒视频 |
| Veo 3.1 Fast | 0.10美元/秒 | 同价 |
| Sora 2 Standard(720p) | 0.10美元/秒 | 同价 |
中国厂商如字节跳动即梦、快手可灵,5秒视频定价约0.4美元,折算每秒约0.08美元,略低于Omni Flash。
串联工作流与Demo应用
通过Interactions API,用户可先使用Nano Banana 2 Lite快速生成图像,再将其作为参考输入Omni Flash生成视频,并继续用自然语言修改。谷歌发布三个开源Demo:
- Anywhere:上传自拍,Lite将人像合成到地标场景,Omni Flash转为动态视频。
- Space Lift:上传房间照片,Lite生成多种装修方案,Omni Flash生成空间漫游视频。
- Omni Product Studio:产品白底图经Lite生成场景化商品图,Omni Flash转为电商广告视频。
这些功能已集成至Gemini App、Google Flow、YouTube Shorts等产品,免费开放。
社区反应与行业影响
正面评价集中在成本和效率:谷歌开发者关系团队Paige Bailey称NB2 Lite已成为默认出图工具;WPP、Figma、Adobe等企业已接入。负面反馈包括:高峰期排队超30秒、中文文字渲染错误、六指问题偶发、艺术风格迁移不稳定。部分开发者期待旗舰模型Gemini 3.5 Pro,该模型原定6月发布,据外媒报道推迟至7月,谷歌未予置评。
分析认为,谷歌此举并非“救场”,而是并行产品逻辑:旗舰模型解决能力天花板,轻量模型解决速度、成本和嵌入工作流的需求。在2026年中头部模型质量差距缩小的背景下,先进入用户工作流的模型可能更具商业优势。
相关资讯
5月18日 · Google DeepMind
6月28日 · 综合整理
5月25日 · Google DeepMind
4月19日 · Google AI Blog
12月11日 · Google DeepMind
5月22日 · Google AI Blog